tgbot-collection / SearchGram

🔠 Telegram 中文聊天记录搜索机器人 Effortlessly search your Telegram chat history, including CJK languages, with fuzzy and typo-tolerant search capabilities.
GNU General Public License v3.0
251 stars 27 forks source link

结果排序,命令格式,黑白名单优先级 #97

Closed bennyzdog closed 1 year ago

bennyzdog commented 1 year ago

建议改成白名单优先级更高,或者可以由用户自行决定(例如根据配置的顺序,越靠下/上的优先级越高)

BennyThink commented 1 year ago
/bot - Search messages from bots
/channel - Search messages from channels
/group - Search messages from groups
/private - Search messages from private chats
/supergroup - Search messages from supergroups
bennyzdog commented 1 year ago

时间排序还有问题。 只修复了同一页的结果的顺序错乱,但全部搜索结果(分页)时上一页最后一条并不是接着下一页第一条的

bennyzdog commented 1 year ago

-u=user_id|username keyword 也可优化,与 /type 命令进行合并,从而简化搜索体验

当命令为 /type key1 key2 时,识别 key1 为用户名,key2 为 keyword 当命令为 /type key1 时,识别 key1 为 keyword

bennyzdog commented 1 year ago

/help 返回的信息没有更新

bennyzdog commented 1 year ago

命令可以优化,当用户只发送命令,不带后面的 key,提示用户重发正确的格式

/bot - Search messages from bots
/channel - Search messages from channels
/group - Search messages from groups
/private - Search messages from private chats
/supergroup - Search messages from supergroups
BennyThink commented 1 year ago

全修好了! 升级好之后,要手动跑一次数据迁移 python add_timestamp.py

Potat0000 commented 1 year ago

时间好像还是有问题。 1

把前三页的时间单独拿出来是这样的:

Page1:
2023-04-28 14:26:31
2023-04-23 22:10:20
2023-04-23 22:10:04
2023-04-23 21:01:58
2023-04-23 13:13:01
2023-04-16 23:43:51
2023-04-16 14:04:09
2023-04-14 20:04:11
2023-04-14 18:57:10
2023-04-12 20:57:40

Page2:
2023-03-08 11:52:59
2022-12-20 12:22:22
2023-05-21 13:01:50
2023-05-20 14:09:39
2023-05-17 13:08:25
2023-05-07 13:16:59
2023-04-28 16:38:42
2023-04-28 14:32:17
2023-04-27 23:33:15
2023-04-23 22:12:18

Page3:
2023-04-23 22:11:55
2023-04-23 22:11:13
2023-04-23 22:10:25
2023-04-23 22:09:27
2023-04-23 22:06:26
2023-04-21 16:39:13
2023-04-20 22:08:54
2023-04-12 21:24:35
2023-04-09 21:51:37
2023-03-15 11:56:51

观察了一下,似乎后半部分是对的,第一页和第二页开头的部分是错的。

是否应该考虑一下 sync 的时间戳、正常读取的时间戳、add_timestamp 的时间戳里是不是有哪个出了问题?

BennyThink commented 1 year ago

🫠 已经跑完了 add_timestamp 吗?所有的数据都有对应的时间戳了?

Potat0000 commented 1 year ago

🫠 已经跑完了 add_timestamp 吗?所有的数据都有对应的时间戳了?

跑完了的,在 meilisearch 面板里都有 TIMESTAMP 的。

刚刚往后面多翻了几页,后面还是乱的,并不是只有第一页第二页有问题

BennyThink commented 1 year ago

🫠 好,那可能是排序的bug,我周末抽空看一下

BennyThink commented 1 year ago

好像是meilisearch 的bug...

BennyThink commented 1 year ago

解决了,是ranking rule的问题 https://www.meilisearch.com/docs/reference/api/settings#update-ranking-rules

重新拉image,然后重启下就应该好了

BennyThink commented 1 year ago

我测了一下可以了

Potat0000 commented 1 year ago

我测了一下可以了

已经修复了。十分感谢!