📄️ 架构概述
这个主题将涵盖 KubeAGI 的整体技术架构。
📄️ 数据源
数据源用于管理和查看平台数据源。作为 LLMOps 的统一数据入口,训练数据、测试数据和知识库文件等数据必须优先连接到数据源,以供其他模块参考。
📄️ 数据集及版本
数据集是对可用数据的统一管理,包括训练数据集、知识库数据集等。它支持独立的版本迭代,可以进行数据查看和更新。
📄️ 模型
Model 是对模型仓库的资源定义,用来管理用户训练好的模型,用于后续的模型服务部署。
📄️ Workers
Worker
📄️ 大型语言模型
LLM 用来定义通过平台提供的本地部署模型服务或者接入的外部第三方模型服务。
📄️ Embedders
Embedder 模型服务用于将输入数据转换为更高维度、更有表现力的嵌入向量。这些嵌入向量可以捕捉输入数据的语义和语法特征,从而为后续的任务和模型提供更好的表示。
📄️ Vectorstores
VectorStore 是一个在 Kubernetes 上构建的自定义资源,用于管理向量化数据。它的主要用途是提供一种可扩展的、分布式的存储和管理向量数据的方式,也可以通过向量化匹配,判断对应数据的相似度。
📄️ 知识库
知识库(Knowledgebases)提供构建私有领域文档和知识管理的能力,支持多种数据类型,并允许将数据文件上传到矢量数据库中。
📄️ Chains
目前我们支持以下种类的链式(Chains)来构建 AI 代理。
📄️ DocumentLoaders
We support the following kinds of DocumentLoaders to handle various document, audio files including
📄️ Agents
Agent 是一个代理,接收用户的输入,采取相应的行动然后 返回行动的结果。
📄️ 评估
智能体评估(Evaluation)可通过多种维度及指标定量评估应用的表现。
📄️ Retrievers
检索器是一个接口,可以在非结构化查询的情况下返回文档。它比向量数据库更通用。检索器不需要存储文档,只需要返回(或检索)文档。向量数据库可以作为检索器的核心,但也有其他类型的检索器。
📄️ 大型语言模型应用
一个应用是一个 Application 类型的 CR,其中的 spec.nodes 写明了这个应用涉及到的组件,每个组件都是一个 CR。不同类型的组件归属于不同类型的 group,比如 prompts.prompt.arcadia.kubeagi.k8s.com.cn 和 chain.arcadia.kubeagi.k8s.com.cn。