kaixindelele / ChatPaper

Use ChatGPT to summarize the arXiv papers. 全流程加速科研,利用chatgpt进行论文全文总结+专业翻译+润色+审稿+审稿回复
https://chatwithpaper.org
Other
18.54k stars 1.94k forks source link

_get_all_page 解析每个section 内容的时候,当section 跨页的时候,for 循环的range 应该是 (star… #253

Open thomasdongcn opened 1 year ago

thomasdongcn commented 1 year ago
  1. _get_all_page 解析每个section 内容的时候,如果section 跨页,for 循环的range 应该是 (start_page, end_page+1),python range(start, stop[, step]),stop: 计数到 stop 结束,但不包括 stop。如果一个section 是内容在第一页和第二页,如果用 range(0, 1),结果就是只包含了第一页的内容。

2.另外,在循环中,应该使用当前页索引 page_i,而不是用 start_page。

调试参数:"args": [ "--query", "chatgpt robot", "--page_num", "2", "--max_results", "3", "--days", "40", "--save_image", "true" ]

第一个文献“RM-PRT: Realistic Robotic Manipulation Simulator and Benchmark with Progressive Reasoning Tasks”,解析 Introduction 的时候,Introduction 内容页范围[0,2]

3.还是用问题2中的测试参数,第一个文献“RM-PRT: Realistic Robotic Manipulation Simulator and Benchmark with Progressive Reasoning Tasks” 可以看到用section 关键字匹配 section 内容的方式,问题比较大。有些匹配到section 并不是真实存在的section。 image