BioforestChain / dweb_browser

BioforestChain Infrastructure
https://docs.dweb-browser.org
MIT License
11 stars 4 forks source link

Kmp Browser 的搜索引擎改进 #95

Closed Gaubee closed 1 month ago

Gaubee commented 6 months ago
  1. 提示界面应该有直达设置的按钮: Now
    image
  2. 默认可用的搜索引擎太少了: 建议参考其它国内的、国际化的 浏览器的搜索引擎进行补全: Now Opera Edge
    image image image
waterbang commented 6 months ago
  1. 期望浏览器能屏蔽一些违规内容,虽然是搜索引擎的锅,但这个是颗定时炸弹,一旦被下架,整个产品线会受影响。
  2. 我觉得并不是搜索引擎越多越好,因为普通用户的需求就是搜索个内容,可能都不知道引擎是什么,挑个绿色的好用的感觉就可以。
kingsword09 commented 6 months ago

单个搜索引擎的问题就是可能被墙或者CDN问题导致有些区域覆盖不了的问题不好解决

waterbang commented 6 months ago

或者说,一般用户在搜索的时候,会有使用自己搜索引擎的习惯,那么我们的搜索,期望是一个分布式搜索引擎,收录的是应用,就像洋葱浏览器一样。

Gaubee commented 6 months ago
  1. 关于如何界定:“是软件的问题还是搜索引擎的问题”这样这样定义:

    在安装到开始选中使用某个搜索引擎的时候,这个过程是否需要进行“输入法”的接入,如果用户只是通过点击的行为,就能用上 baidu/sougou 搜索,那就是我们软件的问题。

  2. 我个人一直以来理想状态就是不去内置任何搜索引擎,但这种操作确实反人类。
  3. 目前来说有一个方案可以绕过这个问题,就是我们自己做离线的本地的搜索器(search.browser.dweb+search.std.dweb)。
    1. 在该搜索器内部,主要的功能是:搜索其它模块的数据。具体实现是:
      1. 其它模块在运行期间,向 search.std.dweb 注入索引数据
      2. 数据包含 文本、图片、ipc 链接、https 链接 等信息
      3. 搜索器自己会去处理这些信息进行加工,取决于机器的性能,或者可以同步到 PC 上进行加工
      4. 搜索到时候搜索器只需要向自己内部数据库进行搜索即可得到结果
      5. 搜索结果会根据访问评论自动重新排序
    2. 搜索器内有“扩展外链搜索”的功能,因为我们是离线搜索,不会去爬数据,所以允许扩展
      1. 比方说,我的股票软件,它可以扩展外链搜索,这样我在点击这个外链的时候,会打开股票软件直接查看
    3. 我们在本地搜索器中内置网络搜索引擎,但默认不启用,特定关键字的时候才会启用:
      1. 一开始,我搜索“时间”,我们只向本地数据库搜索,没有得到任何数据。
      2. 然后在我搜索了 baidu/百度/google/谷歌/bing/必应 等关键字时,这些数据是哪只在我的搜索数据库的,它们有对应的链接,用户可以点击直接打开对应的网址
        1. 我们可以在本地录入全球知名的网址数据
      3. 在我访问了任何一个已知的搜索引擎网址后,这个搜索引擎将会被激活成“扩展外链搜索”,比方说我现在激活了 必应
      4. 这时候我再搜索“时间”这个关键字,结果列表里就会出现一个新的外链项目:“ 用百度搜索“时间” ”
      5. 同理,我可以激活多个互联网搜索引擎,那么它们都会显示在我搜索器的结果列表中
    4. 在未来,这个本地的搜索器还能进一步耦合 AIGC,使用操作系统提供的本地模型进行智能搜索。
    5. 前期,我们只需要构建满足 3. 的相关功能即可作为 MVP 发布
jackie-yellow commented 4 months ago

搜索引擎的地址中的关键字搜索,需要使用 %s 来占位,可以参考 Chrome 地址搜索引擎功能。 20240312-161157 ‘{key}’里头的是用来做 变量替换。%s是一个老东西,等价于新标准中的 {searchTerms}

这里是搜索 的 标准描述: https://developer.mozilla.org/en-US/docs/Web/OpenSearch 比方说github 20240312-161315 在源代码中就有这些描述文件可以用来定义自己。