百度文库文档下载方法

xfdyd commented 2 years ago

方法一：

DoDo百度文库提取工具（Windows）只能提取DOC格式的文档文档内的公式暂时无法提取

下载地址：DoDo百度文库提取工具（只能提取doc格式的文件）

方法二：油猴脚本

方法1：百度文库转 Word 。

方法2：🔥🔥🔥文本选中复制🔥🔥🔥（下载不方便，需要手动复制） https://greasyfork.org/zh-CN/scripts/405130

方法三：

方法1：地址中“baidu”后加“vvv”，回车，即可下载。第一次需要关注微信公众号。似乎容易有多余内容。网站地址：https://www.html22.com/zh/ 也可以配合此脚本和去广告扩展使用。在一个地方第一次使用，需要关注微信公众号获取验证码。

方法2：https://www.hiwenku.com/ 似乎容易格式不对。

方法四（适合页数不多）：天若OCR，可以辅以我的“天若OCR截图”脚本。这个方法，不只是百度文库，所有网站通用。

方法五：

文档下载工具软件经常失效。再说冰点文库只能下载PDF的样子，自带的OCR也不可靠，不如下面的方法了。

下面的方法可能保留段落：

1、开启油猴脚本“网页限制解除”，刷新网页，准备复制。

（

2、复制，但一次超过2页就有丢失前面或后面内容的风险。Firefox下复制的内容都是分段稀碎的；360安全浏览器下没有分段，但是原分段处有空格。然后，可以粘贴到WPS。这个重复的过程可以用剪贴板增强程序ditto来简化，它可以多次复制，全选一次粘贴，也就是只粘贴文本的样子。官方新版已经不支持xp，异次元软件世界上的32位下载地址的可以。

3、用替换将“ ^p”（前面原来是个空格，现在是一个不可描述的字符，这里打不出，所以依然是空格。）全部替换为“..”，再将“^p”用全部替换删除，再将“..”全部替换为“^p”，再将“ ”（空格）用全部替换删除。其实可能这最后一步有时多余，甚至会造成错误。这个步骤可以尝试用宏一键完成，（很可能因为宏不支持这一特殊字符而不能实现了），不过你要有WPS专业增强版。

）

第2、3步可以简化为后面的AHK脚本。使用它，只需要按顺序复制文本，但是复制请使用快捷键ctrl+c，文本就会按顺序保存在桌面的 text.txt 文件中。虽然前面的方法已经废了，但这个脚本已经修复。

注意，复制完成后，请立即退出脚本，否则使用ctrl+c将出问题。另外，分段还是可能有错误。然后再排版吧。此脚本热键在没有选择可复制内容时使用，会造成本身失灵，这时请重启热键脚本。

下载地址： https://share.weiyun.com/58fNw21

（

ps 宏模板更改后，只能另存为，不知道为什么。默认也不能保存宏。要把原模板的宏工程项目文件拖到新模板的工程项目中，保存，才行。

百度文库可以尝试搜索引擎网页快照提取前部分，但是没有分段。

）

xfdyd commented 1 year ago

备选： https://greasyfork.org/zh-CN/scripts/435884-wenku-doc-downloader

xfdyd commented 1 year ago

https://greasyfork.org/zh-CN/scripts/452595-%E6%89%80%E6%9C%89%E6%96%87%E6%A1%A3%E5%85%8D%E8%B4%B9%E4%B8%8B%E8%BD%BD-%E6%96%87%E6%9C%AC%E9%80%89%E4%B8%AD%E5%A4%8D%E5%88%B6

xfdyd commented 1 year ago

https://greasyfork.org/zh-CN/scripts/437609-%E6%96%87%E5%BA%93%E4%B8%8B%E8%BD%BD%E5%99%A8

xfdyd commented 1 year ago

https://greasyfork.org/zh-CN/scripts/427007-%E7%99%BE%E5%BA%A6%E6%96%87%E6%A1%A3%E4%B8%8B%E8%BD%BD%E5%99%A8

xfdyd / -

百度文库文档下载方法 #64