c-w / gutenberg

A simple interface to the Project Gutenberg corpus.
Apache License 2.0
322 stars 59 forks source link

Unicode error #45

Closed WillemJan closed 8 years ago

WillemJan commented 8 years ago

Hi there,

I'm working in a multilang project using gutenberg book module to test things: Using python2.7 (latest release)

pip install gutenberg --upgrade Requirement already up-to-date: gutenberg in /home/aloha/code/Narralyzer/env/lib/python2.7/site-packages

gutenberg_test_id = 31727 print(strip_headers(load_etext(gutenberg_test_id)).strip()[100:200])

also:

python -m gutenberg.acquire.text 31727 test.txt

output:

Problem wird, offenbart. Aber gleichzeitig haftete diesem merkw�rdigen und tiefsinnigen Erleber aller begrifflichen Probleme die verh�ngnisvolle Schw�che an, da� er sofort jeden Boden verlor, sowie er aus dem Kreis seiner innerlichsten Spekulation heraustrat in die

source: http://www.gutenberg.org/ebooks/31727

Great module, keep it up!

never mind

sys.getdefaultencoding() 'ascii' ;)