从文档知识问答核心流程切入,整理火山方舟知识库在资料上传、切片管理、真实问题测试和知识服务接入上的基本顺序。
火山方舟知识库这条线,官方文档写得很清楚,先看的不该是零散参数,而是文档知识问答核心流程。对第一次上手的人来说,知识库更像一条完整路径:先把资料放进去,再看切片和知识服务,最后才把问答能力接到业务里。顺序一旦放反,后面很容易一边调模型,一边怀疑资料是不是根本没进对地方。
第一步不是创建知识库,而是先把材料分清。产品手册、操作流程、FAQ、售前说明、内部制度,适合分别整理,不要一开始就混进同一个库。与此同时,把后面真正会问的问题先分成几类,例如事实查询、步骤问答、规则问答和资料定位。资料和问题类型先分开,后面切片和测试才有方向。
进入火山方舟知识库以后,第一次更适合沿着官方写的文档知识问答核心流程往下走。先建库、上传资料、完成解析,再看第一轮问答能不能回到正确内容。这个阶段先要确认的是资料有没有进对、问答是不是围绕原文展开,而不是一上来就把分段参数和服务配置全部铺满。基础链路已经通了,后面调细节才有意义。
很多知识库效果不稳定,问题并不在模型,而在切片。切得太碎,答案会丢上下文;切得太长,又容易把不相干内容混在一起。火山方舟把切片管理单独列出来,本身就在提醒这一步要回看。第一次上手时,至少抽几段文档看看切片边界和标题、标签这类元信息是不是对的,再决定要不要继续调分段方式。
资料和切片都确认过以后,再拿真实问题去测一轮。不要只用自己临时编的演示问题,最好直接拿日常会遇到的售前问答、内部检索问题或操作问题来试。只有这一轮已经比较稳定,后面才值得继续看知识服务和调用接入。这样做的好处,是你先确认问答本身有没有站住,再去考虑怎么把它接进应用、客服或内部系统。
知识库做得好不好,前半段更看资料和切片,后半段才轮到服务化接入。先把上传、解析、切片和真实问答这四步排清楚,后面不管是继续补 PromptPilot,还是正式接 API,都会少很多来回试错。
10 分钟阅读