goldsmith / Wikipedia

A Pythonic wrapper for the Wikipedia API
https://wikipedia.readthedocs.org/
MIT License
2.89k stars 519 forks source link

Numbers are returned without dot notation #288

Open Fantantonio opened 3 years ago

Fantantonio commented 3 years ago

The returned summary sentence remove the dot notation from numbers so as example 14.000 is returned as 14 000.

Test it running:

import wikipedia

wikipedia.set_lang("it")
s = wikipedia.summary("Roma", 1)
print(s)

Output: Roma (AFI: /ˈroma/, ) è un comune italiano di 2 779 973 abitanti, capitale della Repubblica Italiana, nonché capoluogo dell'omonima città metropolitana e della regione Lazio.

Workaround adding a regex:

import wikipedia

wikipedia.set_lang("it")
s = wikipedia.summary("Roma", 1)
s = re.sub("(\d+) (\d)", r"\1.\2", s)
print(s)

Output: Roma (AFI: /ˈroma/, ) è un comune italiano di 2.779.973 abitanti, capitale della Repubblica Italiana, nonché capoluogo dell'omonima città metropolitana e della regione Lazio.