RimoChan / sese-engine

【sese-engine】新时代的搜索引擎!
https://sese.yyj.moe
Other
607 stars 53 forks source link

请问爬取的数据源来自于哪里?是否可以自定义? #40

Closed fengguowudi closed 1 year ago

RimoChan commented 1 year ago

数据来自遍历互联网,就是配置.py的入口开始的最大的连通图,所以它很难自定义……

fengguowudi commented 1 year ago

我的意思就是怎么遍历?基于wiki的关键词然后在其他搜索引擎找吗?

RimoChan commented 1 year ago

就是你把每个url当成点,当url a有到url b的链接时,点a和点b之间会有1条边,然后在这个连通图上做一个魔改的bfs

fengguowudi commented 1 year ago

就是你把每个url当成点,当url a有到url b的链接时,点a和点b之间会有1条边,然后在这个连通图上做一个魔改的bfs

理解了