xfdyd / -

博客
1 stars 0 forks source link

百度文库文档下载方法 #64

Open xfdyd opened 2 years ago

xfdyd commented 2 years ago

方法一:

DoDo百度文库提取工具(Windows) 只能提取DOC格式的文档 文档内的公式暂时无法提取

下载地址:DoDo百度文库提取工具(只能提取doc格式的文件)

方法二:油猴脚本

方法1:百度文库转 Word

方法2:🔥🔥🔥文本选中复制🔥🔥🔥(下载不方便,需要手动复制) https://greasyfork.org/zh-CN/scripts/405130

方法三:

方法1:地址中“baidu”后加“vvv”,回车,即可下载。第一次需要关注微信公众号。似乎容易有多余内容。网站地址:https://www.html22.com/zh/ 也可以配合此脚本和去广告扩展使用。在一个地方第一次使用,需要关注微信公众号获取验证码。

方法2:https://www.hiwenku.com/ 似乎容易格式不对。

方法四(适合页数不多): 天若OCR,可以辅以我的“天若OCR截图”脚本。这个方法,不只是百度文库,所有网站通用。

方法五:

文档下载工具软件经常失效。再说冰点文库只能下载PDF的样子,自带的OCR也不可靠,不如下面的方法了。

下面的方法可能保留段落:

1、开启油猴脚本“网页限制解除”,刷新网页,准备复制。

2、复制,但一次超过2页就有丢失前面或后面内容的风险。Firefox下复制的内容都是分段稀碎的;360安全浏览器下没有分段,但是原分段处有空格。然后,可以粘贴到WPS。这个重复的过程可以用剪贴板增强程序ditto来简化,它可以多次复制,全选一次粘贴,也就是只粘贴文本的样子。官方新版已经不支持xp,异次元软件世界上的32位下载地址的可以。

3、用替换将“ ^p”(前面原来是个空格,现在是一个不可描述的字符,这里打不出,所以依然是空格。)全部替换为“..”,再将“^p”用 全部替换 删除,再将“..”全部替换为“^p”,再将“ ”(空格)用 全部替换 删除。其实可能这最后一步有时多余,甚至会造成错误。这个步骤可以尝试用宏一键完成,(很可能因为宏不支持这一特殊字符而不能实现了),不过你要有WPS专业增强版。

第2、3步可以简化为后面的AHK脚本。使用它,只需要按顺序复制文本,但是复制请使用快捷键ctrl+c,文本就会按顺序保存在桌面的 text.txt 文件中。虽然前面的方法已经废了,但这个脚本已经修复。

注意,复制完成后,请立即退出脚本,否则使用ctrl+c将出问题。另外,分段还是可能有错误。然后再排版吧。此脚本热键在没有选择可复制内容时使用,会造成本身失灵,这时请重启热键脚本。

下载地址: https://share.weiyun.com/58fNw21

ps 宏模板更改后,只能另存为,不知道为什么。默认也不能保存宏。要把原模板的宏工程项目文件拖到新模板的工程项目中,保存,才行。

百度文库可以尝试搜索引擎网页快照提取前部分,但是没有分段。

xfdyd commented 1 year ago

备选: https://greasyfork.org/zh-CN/scripts/435884-wenku-doc-downloader

xfdyd commented 1 year ago

https://greasyfork.org/zh-CN/scripts/452595-%E6%89%80%E6%9C%89%E6%96%87%E6%A1%A3%E5%85%8D%E8%B4%B9%E4%B8%8B%E8%BD%BD-%E6%96%87%E6%9C%AC%E9%80%89%E4%B8%AD%E5%A4%8D%E5%88%B6

xfdyd commented 1 year ago

https://greasyfork.org/zh-CN/scripts/437609-%E6%96%87%E5%BA%93%E4%B8%8B%E8%BD%BD%E5%99%A8

xfdyd commented 1 year ago

https://greasyfork.org/zh-CN/scripts/427007-%E7%99%BE%E5%BA%A6%E6%96%87%E6%A1%A3%E4%B8%8B%E8%BD%BD%E5%99%A8