知识库

知识库是提升AI应用效能的关键技术,它通过将用户问题与预先存储的专业知识相结合,使AI回答更加准确、专业、可靠。无论是企业内部文档、专业领域资料,还是业务规则,都可以通过RAG技术转化为AI可理解的知识,让AI回答言之有物,减少"幻觉"问题,提高回复质量。真正实现"用自己的数据,回答自己的问题"。

我们产品通过先构建知识库索引,再在与AI对话中使用知识库索引进行实时检索的方式,帮助用户构建和利用知识库,满足不同场景需求。

知识库索引

目前我们提供以下几种类型构建知识库的解决方案,针对不同规模和需求的用户:

检索器

1.本地向量检索器

特点

  • 简单部署,零额外依赖
  • 适合个人或小团队使用
  • 配合多版本控制,实现快速迭代
  • 响应速度快
  • 适合中小规模文档集(数百至数千文档)

最佳场景

  • 个人知识库管理
  • 需要快速迭代的产品或服务
  • 小型团队文档共享
  • 对部署简便性要求高的场景
  • 需要快速启动使用的项目

2. ElasticSearch 检索器

特点

  • 强大的全文搜索能力
  • 支持混合检索(关键词+语义)
  • 高度可扩展,支持海量文档
  • 灵活的查询语法,精确定位内容

最佳场景

  • 企业级大型知识库
  • 需要精确检索特定信息的场景
  • 多语言、多格式文档管理
  • 需要处理结构化与非结构化数据的复杂应用

3. 知识图谱检索器

特点

  • 基于图数据库的智能知识网络
  • 理解实体间的复杂关系和上下文
  • 支持语义联想和知识推理
  • 可视化知识关联,发现隐藏价值

最佳场景

  • 专业领域知识库(医疗、法律、金融等)

  • 需要理解复杂概念关系的场景

  • 研究分析和知识探索

  • 对回答的可解释性要求高的应用

无论选择哪种方案,您都能获得专业的技术支持,让AI真正成为您业务的得力助手。

多版本控制

我们独创的知识库多版本控制系统让您能够:

  • 保留多个版本的知识索引,随时切换使用
  • 在更新数据前创建新版本,确保当前版本稳定运行
  • 轻松比较不同版本的效果,选择最佳表现版本
  • 快速回滚到之前的版本,避免更新失误带来的影响

每个版本都有独立的索引,互不干扰,让知识库管理更加灵活安全。

数据同步方式

我们提供两种便捷方式实现数据导入:

  1. 网页直接上传:支持多种格式文件(文本文档、PDF、表格等)和音视频文件的上传,还可以直接输入网址进行网页内容爬取,一键转化为知识库索引。

  2. 存储服务直连:支持与各类云存储(如阿里云OSS)和传统文件服务器(如通过SFTP协议)直接连接,实现定时数据批量同步。您可以灵活配置拉取目录和文件类型过滤,让数据导入更加精准高效。

上传完成后,系统后台会自动进行数据读取、清洗和知识索引构建,无需人工干预。

更新策略

根据您的需求,我们提供两种对知识库索引更新的方式:

  • 全量更新:完整重建知识索引,适合如大规模内容变更、不接受检索旧数据的场景

  • 增量更新:只处理新增或变更的内容,大幅提升更新效率和节约资源,适合对知识库频繁更新、快速迭代的场景

如何构建

  1. 进入 知识库中心 页面

  2. 点击"新建知识库"按钮

  3. 填写知识库名称、描述等基本信息

  4. 选择数据同步方式:

    a. 网页上传

    • 您可以直接在页面上传普通的文本文档、PDF、表格等文件
    • 也可以输入网址,系统会自动爬取网页内容
    • 还可以上传音视频文件,系统会自动进行转录
    • 上传完成后,可为文件添加元数据,帮助AI更精准找到内容

    b. 存储服务直连

    • 配置连接信息(如SFTP地址、阿里云OSS等)
    • 指定远程存储服务的拉取目录
    • 设置文件类型过滤,只同步需要的文件
    • 选择索引的更新策略(全量或增量)
    • 配置定时任务,实现自动化拉取和索引构建
  5. 创建索引版本

    • 每个知识库支持多版本管理
    • 切换版本时AI回答将基于所选版本的构建后的知识库索引
    • 构建完成后即可使用该版本进行检索

注意事项

  • 部分文件格式如PDF,可能存在大量图片,导致文本提取不完整或文本识别错乱,从而影响检索效果。建议使用文本为主的文件格式。
  • 仅有构建完成的知识库索引才能被AI检索。服务采用排队方式依次处理构建索引任务,请耐心等待知识库索引构建完成。
  • 每个知识库仅有一个版本处于"激活"状态,只有在激活版本中才能上传更多数据并继续构建知识库索引。
  • 不同版本的知识库索引,上传的文件内容可能并不相同,且不同版本互不影响,请您确认后切换使用。
  • 为文件添加元数据(如作者、来源、版本等)可提高检索精准度。
  • 上传音视频文件时,转写质量会影响后续检索效果。

知识库检索

单一检索、网络检索及混合检索

单一知识库检索

通过上述任一方案完成对知识库的构建完成之后,AI在对话过程中就可以调用知识库进行单一知识库检索,结合用户问题和实时检索知识库内容生成回答。这样AI能够基于专业领域的真实数据,提供准确、权威的回复,提升用户信任度和满意度。

网络检索

我们提供网络检索,为了让AI能够获取最新的互联网信息,突破训练数据的时间限制。开启网络检索后,AI可以实时访问互联网,获取最新的新闻、数据和动态内容,拓展知识边界。

混合检索

我们还想您提供了 网络检索 + 单一知识库检索 混合检索的方式,让AI在回答问题时,既能基于您专属的知识库提供专业解答,又能结合最新的互联网信息,确保回答的全面性和时效性。无论是需要专业背景知识的问题,还是需要最新动态的信息,AI都能游刃有余地应对。

  • 实时性:既能够实时获取本地知识库的专业数据,又能够获取最新的互联网信息,二者结合,提升回答的准确性和时效性
  • 广泛覆盖:可以检索到互联网上的大量信息源
  • 动态性:支持动态权重分配的数据检索,让您根据实际需求调整知识库和网络检索的优先级

快速开始

  1. 创建或打开一个会话
  2. 点击设置按钮,进入"会话设置"
  3. 选择"知识库设置"选项卡
  4. 从可用知识库列表中勾选您需要的知识库以及要使用的版本(当前激活版本会有“√”的标记)
  5. 保存设置并开始对话

通过我们的知识库功能,您可以让AI真正理解您的业务和专业领域,提供比通用AI更精准、更专业、更符合您业务场景的回答,成为您工作中强大的智能助手。