详细教程 -> https://zhuzi.dev/posts/2021-06-05-douban-backup-sync-notion/
.
├── archive # 不再使用的实验时的爬虫脚本
├── cols.json # 可修改自定义的 Notion 表格列名
├── .env # 如果需要在本地 debug,可以添加这个文件
├── scripts # 长期不需要使用的脚本,但未来有可能需要使用
├── src # 会保持更新正在使用的脚本👩🏻💻👈
└── userscript # 导出时可使用的油猴脚本
export.user.js
导出的 CSV 数据样例(one row){ '标题': '无间双龙:这份爱,才是正义 / ウロボロス~この愛こそ正 義。', '个人评分': '5', '打分日期': '2015/03/21', '我的短评': '5星打的绝对不是剧情!为建国,为toma,为一众cast就 是如此任性ˊ_>ˋ(1 有用)', '上映日期': '2015/01/16', '制片国家': '日本', '条目链接': 'https://movie.douban.com/subject/25953663/' }
{ '条目链接': { id: '=jBf', type: 'url', url: 'https://movie.douban.com/subject/26277363/' }, 'IMDb 链接': { id: '@ME}', type: 'url', url: 'https://www.imdb.com/title/tt5419278' }, '主演': { id: 'X{lL', type: 'rich_text', rich_text: [[Object]] }, '个人评分': { id: 'Z^ph', type: 'multi_select', multi_select: [ { id: 'FRXk', name: '5', color: 'pink' } ] // multi_select: [], // empty array if no value for rating }, '打分日期': { id: 'e\\{[', type: 'date', date: { start: '2021-01-19', end: null } }, '类型': { id: 'pzY>', type: 'multi_select', multi_select: [[Object], [Object]] }, '海报': { id: 't@Fv', type: 'files', files: [ { name: 'https://img3.doubanio.com/view/photo/s_ratio_poster/public/p2524998570.jpg' } ] }, '我的短评': { id: 'wG?R', type: 'rich_text', rich_text: [[Object]] }, '上映年份': { id: 'xghA', type: 'number', number: 2016 }, '导演': { id: 'y]UL', type: 'rich_text', rich_text: [[Object]] }, '标题': { id: 'title', type: 'title', title: [[Object]] } }
#竹子哟竹子#✨ 的收藏 { creator: '#竹子哟竹子#✨', title: '想看白蛇传·情', link: 'http://movie.douban.com/subject/34825976/', pubDate: 'Mon, 31 May 2021 15:14:58 GMT', 'dc:creator': '#竹子哟竹子#✨', content: `
推荐: 很差/较差/还行/推荐/力荐 |
\n' + ' | \n' + '\n' +
' 推荐: 还行 备注: 测试 短评第 2 行 ' ' |
RSS 的好处一个是轻量,但又包含了个人标记的最重要的几个数据:名字、条目链接、时间、评分、短评。 所以需求可以转换为,定时获取 RSS 更新,并对新的条目进行抓取信息并同步到 notion database。
但需要注意的是,豆瓣的 RSS 数据每次都只保留 10 个,并且包括想看、想听、想读。本人的脚本同步到 Notion 的部分仅处理看过、听过、读过的条目,如果某一天集中标记数量过多,可能使 RSS 数据并未全部被 workflow 获取。 这种情况的时候请自己手动触发脚本的运行,或者将脚本运行间隔时间改短,比如每个小时或者每两个小时。
GitHub 免费用户的开源仓库,actions 暂时是完全免费,也不计时间。
在文档页面先生成一个 Token,然后给 repo 添加一个 secret 叫 NEODB_API_TOKEN
。
即可开启在豆瓣的标记会同步到 NeoDB 的功能。