Closed marcoshsbosco closed 1 year ago
Talvez seja exagero, mas tem esse dataset aqui. Eu não olhei ainda o arquivo, mas como é um .csv, provavelmente tá todo cagado e precisa formatar ele. Nada que um script em Python não resolva em 10 minutos pra deixar 1 palavra por linha certinho e tals.
Baixar de alguma base de dados da internet ou sei lá, talvez uma API/site de dicionário. Pior dos casos, fazer scrape em algum site de dicionário. O arquivo em si tem que ter 1 palavra por linha sem espaço antes e nem depois. Referenciar o banco atual se necessário.