illegalvoice / xbmchuscraper

Automatically exported from code.google.com/p/xbmchuscraper
0 stars 0 forks source link

Eredeti filmcím is magyarul jön #25

Closed GoogleCodeExporter closed 8 years ago

GoogleCodeExporter commented 8 years ago
Nagyon köszönöm, hogy a scrappert megírtad, valószínűleg, ha ez nincs, 
soha nem kezdtem volna el az XBMC-t használni.

A hiba:
1. Megpróbálom felismertetni mondjuk a Hegylakó című filmet, amit helyesen 
felismer, de az Original title-nek is a magyar címe "Hegylakó" kerül be.
2. Megpróbálom felismertetni az "Az ezeregy éjszaka virágai" című filmet 
és az eredeti címnek az "Arabian Nights" (angol cím) jön és nem az eredeti 
olasz cím: "Il fiore delle mille e una notte".

Megnéztem és nekem úgy tűnik, hogy a probléma ott van, hogy ebben a 
részben:

<!--Get original title from imdb.com and store it in buffer 18 for future use-->
  <RegExp input="$$1" output="\2" dest="18">
   <expression fixchars="2">&lt;meta\sname=&quot;title&quot;\scontent=&quot;(IMDb\s-\s)?(?:&amp;#x22;)?([^&quot;]*?)(?:&amp;#x22;)? \([^\(]*?([0-9]{4})(?:–\s)?\)</expression>
 </RegExp>

Ahol az IMDB tudja a magyar címet ott azt írja be, ahol azt nem de tudja az 
angolt azt jeleníti meg.

Próbaképpen kicseréltem erre:
<expression fixchars="2">&lt;span 
class="title-extra"&gt;(.*)\s*&lt;i&gt;</expression>

Ez eddig működött.

Original issue reported on code.google.com by l...@csilling.com on 14 Feb 2013 at 7:52

GoogleCodeExporter commented 8 years ago
A legfrissebb 1.9.2-es scrappert 12-es XBMC-vel használok.

Original comment by l...@csilling.com on 14 Feb 2013 at 7:54

GoogleCodeExporter commented 8 years ago
Amit javasoltam, az mégsem tűnik jónak, mert például a Charlie és a 
csokigyárra nem működik, meg a Jumanji-ra sem működik, de a 
Életrevalókra igen. Szóval megcsináltam 20 filmet és abból csak 3-nál 
működött :-(

Original comment by l...@csilling.com on 14 Feb 2013 at 9:58

GoogleCodeExporter commented 8 years ago
Most megcsináltam az eredeti regexp-el és az működött a 17-re és nem 
működött a 3-ra.

Tehát itt van 3 film, amivel lehet tesztelni:
-Táncoló talpak (Happy Feet)
-Szeretném, ha szeretnél (The wedding planner)
-Mindenképpen talán (Definitely, Maybe)

Közben teszteltem még egy kört és az nem működik, hogy az imdb annak 
ellenére, hogy en-us-ra van állítva a nyelv, ennél a 3-nál magyarul adja 
vissza a filmcímet.

Ami végül ezeknél mind működött, hogy a scrapper-ben átállítottam, 
hogy hu-hu-val kérje le az oldalt és utána a módosított (title-extra-t 
használó) regexpet használtam.

Original comment by l...@csilling.com on 14 Feb 2013 at 10:49

GoogleCodeExporter commented 8 years ago
Jó nyomon jártál és köszönöm, hogy odatetted magad a tesztelésbe is.
Javítva az 1.9.4 verzióban.

FYI - a hu-hu az csak a keresésre vonatkozik, minden más en-en-el megy.

Original comment by nadas.bence@gmail.com on 15 Feb 2013 at 12:33

GoogleCodeExporter commented 8 years ago
Köszönöm a javítást, közben használtam az új verziót és most teljesen 
jó :-)

Original comment by l...@csilling.com on 17 Feb 2013 at 10:09