Open flash201524 opened 3 months ago
RPC error: [insert_rows], <MilvusException: (code=1100, message=the length (74246) of dynamic field exceeds max length (65536): invalid parameter[expected=valid length dynamic field][actual=length exceeds max length])>, <Time:{'RPC start': '2024-04-11 23:49:01.457415', 'RPC error': '2024-04-11 23:49:02.505110'}>
Traceback (most recent call last):
File "E:\OneDrive\history_rag-master\cli.py", line 120, in
这不是崩溃的,因为milvus存储text的字符串长度是有限制的,如图是65536,而由于你的切分方式导致,切出了一个74246的长文本,事实上,长文本的embedding效果一般也不好,因为信息过多让特征不再明显。因为history_rag的文本切分是针对史料,所以不一定适合你的文本,使用更通用的文本切分方式,请参考https://github.com/wxywb/history_rag/issues/63
这不是崩溃的,因为milvus存储text的字符串长度是有限制的,如图是65536,而由于你的切分方式导致,切出了一个74246的长文本,事实上,长文本的embedding效果一般也不好,因为信息过多让特征不再明显。因为history_rag的文本切分是针对史料,所以不一定适合你的文本,使用更通用的文本切分方式,请参考https://github.com/wxywb/history_rag/issues/63
明白了,但是我没办法把已经切好的文本删除了,输入remove 文件夹名之后说有多少条但是删除0条,有没有什么其他删除的指令呢
from pymilvus import Collection, connections
connections.connect("default", host="localhost", port="19530")
#在cfgs/config.yaml中的默认值
col_name = "history_rag"
col = Collection(col_name)
col.load()
col.drop()
也许是txt太多了?