客服工单太多时,怎么用 AI 自动分类和分流?
当客服工单从每天几十条变成几百条时,最先失控的通常不是回复速度,而是分不清哪些要退款、哪些要技术排查、哪些需要销售跟进。AI 可以先做分类和分流,但前提是标签体系足够清楚。
先区分“分类”和“回复”
很多团队一开始就想让 AI 直接回复用户,结果很快遇到口径不一致、权限不明确和误判责任人的问题。更稳的第一步是让 AI 做分类:识别工单意图、紧急程度、涉及产品、是否需要人工、应该分给哪个角色。分类结果供客服参考,不直接替代最终回复。
这类场景不需要把“GPT 中转”当成卖点。更准确地说,它需要 AI 模型接口接入与调用管理:工单系统把文本交给模型,模型返回结构化标签,后台保存结果,人工根据规则复核。流程可解释,比单纯追求自动回复更重要。
第一步:设计标签表
先从最近两周工单里抽样 100 条,人工标注一遍。常见一级标签可以是账号登录、计费退款、API 调用、模型效果、发票合同、功能咨询、故障反馈、投诉建议。每个一级标签再配一个处理人或处理组。不要一次设计几十个细标签,标签过细会让 AI 和人工都难以稳定判断。
优先级建议只设三档:高、中、低。高优先级包括支付异常、服务不可用、重要客户阻断;中优先级包括配置错误、模型返回不符合预期、需要技术协助;低优先级包括普通咨询、资料补充和使用建议。每档都要写清进入条件,避免客服按情绪判断。
第二步:让模型返回结构化结果
开发者 AI 调用时,不要只让模型返回一段自然语言建议。更适合工单分流的是 JSON 字段:intent、priority、product_area、summary、assignee_group、needs_human_review、confidence、reason。这样后台可以直接筛选、排序和统计,模型调用管理也能看到各类问题的数量变化。
如果团队还没有结构化输出规范,可以先用 Codex 写一个最小脚本,把工单文本、模型名、返回字段和错误信息记录下来。后续再接入正式工单系统。需要排查接口配置时,可参考 AI 模型接口报错排查清单。
第三步:设置人工复核线
不是所有分类都要人工重看。建议设置三条复核线:confidence 低于阈值的工单必须复核;高优先级工单必须复核;涉及退款、封禁、合同、隐私和投诉的工单必须复核。AI 自动化办公的价值是把大量普通工单排好队,而不是让敏感决策脱离人工责任。
复核结果也要回写系统:AI 原标签、人工修正标签、修正原因、处理时长。这样一周后就能看到哪些标签最容易误判,是提示词需要调整,还是业务规则本身不清楚。
上线前检查点
- 一级标签不超过 10 个,每个标签都有处理组。
- 优先级只有高、中、低三档,进入条件可被客服理解。
- 模型返回 JSON 字段,而不是只返回一段建议文字。
- 低置信度、高优先级、退款投诉类工单必须人工复核。
- 日志记录原文摘要、模型名、标签、置信度、人工修正和处理结果。
常见避坑
不要把历史工单原文无限制地交给模型。进入 AI API 接入流程前,应先脱敏手机号、邮箱、订单号和隐私内容,只保留分类所需信息。对于跨部门协作,可以参考 团队调用日志管理,确保每个入口有人负责。
也不要追求第一天就全自动。先让 AI 给人工排队,等分类准确率和复核流程稳定后,再逐步把低风险咨询接入半自动回复。更多案例可在 Codex 实操与 AI 资讯 持续查看。