slawekmikula / epguide

Projekt grabbera XMLTV oraz TXT dla polskich stacji telewizyjnych
http://slawekmikula.github.io/epguide
6 stars 5 forks source link

Teleman - pełne opisy #19

Closed GoogleCodeExporter closed 9 years ago

GoogleCodeExporter commented 9 years ago
Należy rozszerzyć program o opcję ściągania pełnych opisów z teleman.pl 
- oznacza to dla każdego wydarzenia ściągnięcie osobnej strony ze 
szczegółami i odpowiednio wykorzystanie wszystkich opisów (treść, aktorzy 
itp.)
 Taka operacja znacznie wydłuży czas ściągania programu na cały tydzień dlatego musi być to tylko opcja.

Dodatkowo, ściągnięte strony powinny być cachowane na dysku, tak aby przy 
kolejnym wywołaniu nie były ściagane ponownie, lecz parsowane z dysku

Original issue reported on code.google.com by damian.golda@gmail.com on 17 Mar 2013 at 8:45

GoogleCodeExporter commented 9 years ago

Original comment by damian.golda@gmail.com on 24 Mar 2013 at 9:00

GoogleCodeExporter commented 9 years ago
Do parsowania strony ze szczegółami użyto parsera xml/html o nazwie lxml:

http://lxml.de/

https://pypi.python.org/pypi/lxml/3.1.0

sudo apt-get install python-lxml

Original comment by damian.golda@gmail.com on 24 Mar 2013 at 9:07

GoogleCodeExporter commented 9 years ago

Original comment by slawek.m...@gmail.com on 11 Apr 2013 at 8:37

GoogleCodeExporter commented 9 years ago
dodałem do setup.py wymaganie na bibliotekę lxml w wersji >= 2.3.5 (taka jest 
w ubuntu 12.10 dla python2.6)

wypuszczam wersję 1.7.1. Do zamknięcia (?)

Original comment by slawek.m...@gmail.com on 12 Apr 2013 at 4:56

GoogleCodeExporter commented 9 years ago
OK. Dzięki.
Czekam na ewentualne uwagi od użytkowników

Original comment by damian.golda@gmail.com on 13 Apr 2013 at 3:43