阅读时间:1 分钟
0 字

解析配置

解析配置决定文件能不能被正确读出来,尤其是 PDF、图片、混合文档这类场景。

这一页适合看什么

这一页主要告诉你:

  • 解析配置是干什么的
  • 什么时候要创建解析配置
  • 为什么它对知识库和附件处理很重要

如果你想看更详细的说明,例如:

  • 本地解析和外部解析的区别
  • RapidOCR / RapidOCRPDF 怎么安装
  • 不同解析驱动分别属于哪个平台
  • 文件解析到底会用到哪里

请继续阅读:

适合哪些文件

当前文档侧重介绍:

  • PDF
  • PNG / JPG / JPEG / WEBP / BMP / GIF

为什么解析配置很重要

因为知识库效果不只是看模型,还取决于资料有没有被正确提取成文本。

推荐做法

  • 第一次只用少量文件测试
  • 先确认解析内容是否完整
  • 再进入知识库入库和检索阶段