上传的文件通过“文档解析“工具无法解析结果

labring / FastGPT

FastGPT is a knowledge-based platform built on the LLMs, offers a comprehensive suite of out-of-the-box capabilities such as data processing, RAG retrieval, and visual AI workflow orchestration, letting you easily develop and deploy complex question-answering systems without the need for extensive setup or configuration.

Other

16.96k stars 4.54k forks source link

例行检查

[x] 我已确认目前没有类似 issue
[x] 我已完整查看过项目 README，以及项目文档
[x] 我使用了自己的 key，并确认我的 key 是可正常使用的
[x] 我理解并愿意跟进此 issue，协助测试和提供反馈
[x] 我理解并认可上述内容，并理解项目维护者精力有限，不遵循规则的 issue 可能会被无视或直接关闭

你的版本

[ ] 公有云版本
[x] 私有部署版本, 具体版本号: v4.8.9

问题描述, 日志截图 上传文件启用后，上传txt或者pdf文件通过文档解析后，不能解析具体文本，解析结果为“Only support .txt, .md, .html, .pdf, .docx, pptx, .csv, .xlsx”。

复现步骤

开启文档上传文件，通过调试发现上传后地址为： [ "http://x.x.x.x:3000/api/common/file/read?filename=1.txt&token=eyJhbGciOiJIUzI1NiIsInR5cCI6IkpXVCJ9.eyJidWNrZXROYW1lIjoiY2hhdCIsInRlYW1JZCI6IjY2NjdmYmQwNTViYWEzZWVkZGQ5ZjQzYyIsInRtYklkIjoiNjY2N2ZiZDA1NWJhYTNlZWRkZDlmNDNlIiwiZmlsZUlkIjoiNjZiYWZhOTM4ODkwOTMwYTQyNjFlNTNmIiwiZXhwIjoxNzI0MTM0Njc1LCJpYXQiOjE3MjM1Mjk4NzV9.1Dxgbjc5I8xOn4W02rzn3V9XPsIeCeTToQ7c691A8OU" ]
通过文档解析，结果为： File:
Only support .txt, .md, .html, .pdf, .docx, pptx, .csv, .xlsx

另，将地址换成静态文件地址，如： [ "http://x.x.x.x/1.txt" ] 可正常解析。应该是上传后的文件后续带着token导致误判文件类型导致

预期结果 能够正常解析文本

相关截图

labring / FastGPT

上传的文件通过“文档解析“工具无法解析结果 #2372