Closed sdhjl2000 closed 1 year ago
text-embedding-ada-002对应的最长token是2048,text2vec的限制是多少超过会被截断?
https://huggingface.co/shibing624/text2vec-base-chinese 底下的说明说是max_sql_length是128,这个128代表是汉字个数还是有类似tiktoken这种工具来检测
token数
请问有token maxlen为2048的模型推荐吗,或者1024的
text-embedding-ada-002对应的最长token是2048,text2vec的限制是多少超过会被截断?