Closed Berlin-98 closed 2 years ago
请问如何处理中文数据集?将om.data.tokenizers.WordTokenizer(pretrained="xxx")替换成中文的词向量后会出现报错:ValueError: could not convert string to float: '义'
om.data.tokenizers.WordTokenizer(pretrained="xxx")
暂时还不支持中文数据,请等待版本更新
请问如何处理中文数据集?将
om.data.tokenizers.WordTokenizer(pretrained="xxx")
替换成中文的词向量后会出现报错:ValueError: could not convert string to float: '义'