Open wallacemoraes opened 4 years ago
Olá wallacemoraes, Eu ainda não experimentei correr num windows, mas em geral quando tive erros semelhantes devia-se à versão de python, o que está a usar?
Cumprimentos, João
Estou usando a 3.7, vou testar na 3.5
Eu não conseguiu rodar o programa no Windows, infelizmente. Todavia, eu fiz no Google Colab, e funcionou perfeitamente. Acho que precisa do Linux mesmo para rodar o programa.
Com os melhores cumprimento Wallace
O erro pode ser uma questão de codificação. Tente carregar o arquivo com encoding="utf-8", porque 0x9d faz sentido nessa codificação.
Olá, tentei importar o arquivo usando o encoding ou só uma string teste='testando uma frase'. Porém, em ambas situações, o erro persiste. A forma que encontrei de corrigir foi alterar a função load do arquivo NLPyPort/NLPyPort/LemPyPort/rank/word_ranking.py Como no LINUX e MAC o encoding default é o 'utf-8' e pro WINDOWS não, é preciso colocar o encoding dentro da função. Fiz a alteração no meu computador, mas acho que é interessante fazer a correção aqui para que todas as instalações da biblioteca não tenham problema.
def load(self,input_file):
rank = 0
frequency = 0
word = 0
lineNumber = 0
**with open(input_file,"r", encoding='utf-8') as f:**
for line in f:
line = line.strip()
if(len(line)>0 and not (line[0]=="#")):
if("\t" in line and (line.find("\t")+1<len(line))):
word = line[line.find("\t")+1:].replace("="," ")
frequency = line[0:line.find("\t")]
rank += 1
new_entry = word_list_entry(word,frequency,rank)
#new_entry.print_word_list_entry()
self.wordMap[word] = new_entry
else:
break
UnicodeDecodeError Traceback (most recent call last)
Oi, como vão?
Estou tentando fazer um teste com o projeto, mas não consigo processar o arquivo. Aparece o erro:
UnicodeDecodeError: 'charmap' codec can't decode byte 0x9d in position 7897: character maps to
Tentei o próprio arquivo de teste "Sample.txt", mas aparece o mesmo erroVocês pode ajudar, por favor? Existe alguma codificação específica? Tenho testado no Windows.
Com os melhores cumprimentos