dataabc / weibo-search

获取微博搜索结果信息,搜索即可以是微博关键词搜索,也可以是微博话题搜索
1.66k stars 369 forks source link

视频url可能带英文逗号, 导致分割出错 #94

Open Ccptsoap opened 3 years ago

Ccptsoap commented 3 years ago

提个bug~ 抓到的视频url,结尾有一个,video标记:

http://f.video.weibocdn.com/R5H557tolx07P9qriWpO01041200fsVS0E010.mp4?label=mp4_ld&template=640x360.25.0&trans_finger=6006a648d0db83b7d9951b3cee381a9c&ori=0&ps=1BVp4ysnknHVZu&Expires=1629454745&ssig=AiriQqmuPF&KID=unistore,video

LivePhot的url,结尾有一个,videomovSrc标记:

//video.weibo.com/media/play?livephoto=//us.sinaimg.cn/004f4R8pgx07P4TTYl8z0f0f0100leoX0k01.mov&KID=unistore,videomovSrc

如果用逗号分割,会造成数据处理出错。 2022年8月22日

dataabc commented 3 years ago

感谢反馈。

分割指的是一条微博的视频链接可能包含多个视频,想使用分隔符分开它吗?指的是weibo-crawer吗?本程序中的视频url只有一个,不会有分割问题,weibo-crawler使用的是英文分号(;)。如果还有疑问,欢迎继续讨论。

Ccptsoap commented 3 years ago

根据readme文档的 输出 条目:

视频url: 微博中的视频url和Live Photo中的视频url,若某条微博存在多个视频,则每个url以英文分号分隔,若没有视频则值为''

我的理解是:爬取到的微博可能含有多个视频,用英文逗号分割。

不过仔细研究了一下,微博是限制了上传视频只能传一个视频。 唯一的例外就是readme里所说的Live Photo,如果用iOS设备传Live Photo,用户点开照片后会播放视频。而微博允许传多个Live照片,也就可能包含了多个视频。

而微博内的视频url会出现英文逗号。

dataabc commented 3 years ago

这里readme应该是写错了。weibo-crawler能获取live photo,本项目不行。weibo-crawler用的是分号分隔多个视频url的,应该是不会出错的。