Closed ZQbd closed 5 years ago
结构不一样啊
我的意思数据组合成一条,就和三张表join后的效果一样。 但是我想爬取完就组合在一起,然后直接输出到kafka
结构不一样啊
我的意思数据组合成一条,就和三张表join后的效果一样。 但是我想爬取完就组合在一起,然后直接输出到kafka
数据类似于这种: 你能帮忙看下吗,我试着改下了你的代码,没成功,之前没搞过python。。。
你爬完之后写条sql自己join就好了吧?这都是primary-foreign key join应该不用多久。
你爬完之后写条sql自己join就好了吧?这都是primary-foreign key join应该不用多久。
我的意思是我不想存到mysql,我要直接组合好 入kafka,然后我会接流式处理框架分析。
你爬完之后写条sql自己join就好了吧?这都是primary-foreign key join应该不用多久。
我的意思是我不想存到mysql,我要直接组合好 入kafka,然后我会接流式处理框架分析。
你可以看看pipeline.py
里面的几个insert_xxx
函数,这些函数会处理搜集到的单条信息,然后整理成sql语句插入。不过回复和帖子信息是分开的,没法直接组到一起。
结构不一样啊