Open Henry-Shaw opened 4 days ago
No response
1.6.1
知识库导入由doc文件批量转换后的docx文件,文档中的图片未能正常识别
使用程序转换doc文件为docx文件。参考代码
def convert_doc_to_docx(doc_file_path, docx_file_path): """ 将 .doc 文件转换为 .docx 文件。 :param doc_file_path: 输入的 .doc 文件路径 :param docx_file_path: 输出的 .docx 文件路径 """ # 创建 Word 应用程序对象 word = win32com.client.Dispatch("Kwps.Application") try: # 后台运行,不显示界面 word.Visible = True # 打开 .doc 文件 doc = word.Documents.Open(doc_file_path) # 另存为 .docx 格式 doc.SaveAs(docx_file_path, FileFormat=12) # 通过宏录制,确定wps中12表示 .docx 格式 # 关闭文档 doc.Close() finally: # 关闭 Word 应用程序 # word.Quit() pass
实现对wps转换的docx文档进行支持
感谢支持!
联系方式
No response
MaxKB 版本
1.6.1
问题描述
知识库导入由doc文件批量转换后的docx文件,文档中的图片未能正常识别
重现步骤
使用程序转换doc文件为docx文件。参考代码
期待的正确结果
实现对wps转换的docx文档进行支持
相关日志输出
No response
附加信息
No response