测试发现分词规则不是逐字而是和词元类似,但不确定是哪个词典。
虽然这确实是分词的正确方法,但有些怀疑 telegram 真这么好心吗,或许中文搜索是AI训练副产物,因为最近有相关新功能推出。
更新:应该只是还没索引到这些字,现在能搜索到了。tg这搜索真的是逐字索引,只要帖子包含搜索的每个字,不论顺序,都能搜出来。想要完全匹配必须用引号包裹。
虽然这确实是分词的正确方法,但有些怀疑 telegram 真这么好心吗,或许中文搜索是AI训练副产物,因为最近有相关新功能推出。
更新:应该只是还没索引到这些字,现在能搜索到了。tg这搜索真的是逐字索引,只要帖子包含搜索的每个字,不论顺序,都能搜出来。想要完全匹配必须用引号包裹。