跳到主要内容

常见问题

Q1:为什么要做数据处理?

A:对数据集文件做数据处理,存在两方面原因: 第一:在数据处理模块,可对上传的文件做数据清洗,其中包括异常处理、去隐私处理等,这样可以保证数据的可用性和安全性。 第二:为保证知识库应用的问答质量,在搭建知识库时,最好是关联 QA 格式的数据。当用户上传的是普通文档格式的文件时(如:pdf, docx),我们支持用户在数据处理模块对文件进行 QA 拆分。

Q2:必须要做数据处理才能搭建知识库吗?

A:不是的。现版本为保证问答质量,我们的知识库对 csv 格式的文件(QA 内容)支持度相对较高,其他格式文件支持度偏低。如果您不进行数据处理,知识库直接关联原始文件,问答质量会偏低。所以我们建议您将原始文件进行 QA 拆分处理,这样您可以更精准的搜索您关心的知识内容。

Q3:如果我上传的本身就是 csv 文件,那还需要做数据处理吗?

A:如果本身上传的就是 csv 文件,可以无需做 QA 拆分处理。但是,对于 csv 文件,必须符合 QA 内容规范,即必须是两列内容,那么我们会把第一列认定为 Q,第二列认定为 A。其他不符合规范的文件现版本无法处理。

Q4:我如何根据智能体评估结果进行对应的调整?

A:如果您的智能体评估表现不佳,您可以从以下几个方面分析问题:

  • 根据各项指标得分分析问题所在,如:答案相关度得分较低,那么问题可能是由于大模型 Temperature 配置较为发散,可适当调整配置。
  • 根据详细的 QA 问答,分析是不是由于部分问答偏差较大,从而导致得分偏低,如若是,那么可能的原因包含:知识库检索配置不适、Embedding 配置不适以及知识库本身数据不匹配等。
  • 对于每一个表现不佳的报告,我们都会给出相应的建议,您可以参考我们给出的建议对智能体进行相应的调整(给出的建议仅供参考)。

Q5:我如何测试智能体的效果?

可以通过创建智能体,关联知识库、模型服务,进行对话,即可进行测试。

如果您觉得问答效果不满意,可能有以下原因:

  • 数据处理 QA 拆分质量差
    • 您可以尝试通过 QA 拆分对模型的配置、Prompt 以及更换模型,重新生成高质量的 QA 问答对。
  • 大模型问题
    • 您可以尝试通过调整模型的配置或者更换模型,来解决由于模型原因导致问答质量差的问题。
  • Prompt
    • 一个好的 Prompt 会极大提升应用的问答质量,如果您的问答质量效果差,可以尝试调整 Prompt,让大模型更好地理解您的问题,并且做出更加精确的回答。