mediathekview / MLib

lib für das Projekt MediathekView
GNU General Public License v3.0
35 stars 27 forks source link

Feature: Sendereihe Abkürzung **vorsichtig** ins ZDF-Crawling-Verfahren miteinbeziehen #62

Closed zxsd closed 3 years ago

zxsd commented 8 years ago

Betr: https://github.com/mediathekview/MediathekView/issues/149

Eine Stunde nach meinem früheren Issue habe immer noch fast keine Ahnung wie man vorgehen soll, also wieder versuchsweise eingereicht ...

Diesmal aber mit einer ausdrücklichen Bitte ...

Nicht implementieren bis die Möglichkeit vorhanden ist, die Auswirkung der beschriebenen Änderung außerhalb des Live-Verfahrens testen, betrachten, und beurteilen zu lassen. Ein kleiner Kreis von erfahrenen Usern sollte vor der Inbetriebnahme dieser Art von Änderung unbedingt im vollen Ausmaß abseits (off the beaten path auf Englisch) testen. Ich habe ORF und ZDF geohrfeigt, weil diese Sender deren Live-Infrastruktur fürs Testing eingesetzt haben. So was darf mit MV nicht vorkommen!

Es ist nicht abzuschätzen, wie viele Abos derzeit im Betrieb sind. Ich bin mir aber sicher, daß MV-Anwender die ZDF-Abos angelegt haben, die jetzigen Themen und vielleicht anderen Filmliste-Attributen acht geschenkt haben. Die Rubriken die sich jetzt in Abos befinden können, dürfen nicht 'einfach so' ersetzt werden.

Das Workflow beschreibt bestimmt wie Neuerungen sorgfältig und vorsichtig, den normalen Betrieb nicht störend, zu testen sind. Wenn nicht, soll dieses Issue halt offen bleiben. bis wir als Projekt soweit sind.

...

Also zum Issue selbst ... welches früher im MV-Forum erschienen ist.

Seit der Umstellung 'landen' Sendungen öfter nur in Sammelthemen, als früher der Fall war. Problemen wurden gemeldet, beispielsweise mit Abos oder Episoden überhaupt zu finden.

Als Ergänzung, bzw., Ausweichlösung (fallback auf Englisch) der jetzigen Logik, die das Thema ermittelt, könnte vielleicht von einer Zeichenkette in der Dateinamen Gebrauch gemacht werden. Gerade vor der Auflösungs-/Versions-Angaben (wie "1496k_p13v13", "2256k_p14v11" oder "3296k_p15v13") ist normalerweise eine mit Unterstrichen abgegrenzte, drei-bis-vier stellige Abkürzung (Abk.) der Sendereihe vorhanden. Zum Beispiel bedeutet "tex" ZDF-intern wohl die Sendereihe "Terra X" während "txp" "Terra Xpress" bedeutet. (ZDF-Sendungen die mit 3sat geteilt werden, können stark von diesem Muster abweichen.)

Hier ist eine Liste von Kandidaten, falls sich so was umsetzen ließe. Der junge Stand von einigen Sammelthemen ist widerspiegelt: Der Fernsehfilm der Woche, Dokumentation, Ganze Filme im ZDF, Samstagskrimis, Serien, Serien im ZDF, und Show. Meiner Meinung nach müssen die Sammelthemen besonders acht geschenkt werden ... Merkmale von diesen zu ändern, könnte in ungeahntem Ausmaß Abos von vielen MV-Anwendern (ohne Absicht) beeinflussen. Vollständig/autoritativ ist die untenstehende Liste lange nicht, aber als Anfang, vielleicht geeignet.

    bel  --> Bella Block
    afe  --> Auf der Flucht
    bet  --> Bettys Diagnose
    chf  --> Die Chefin
    dls  --> Letzte Spur Berlin   (Die Sendereihe hieß früher, "Die letzte Spur.")
    dlz  --> Der letzte Zeuge
    dks  --> Das kleine Fernsehspiel
    dkm  --> Der Kommissar und das Meer
    drk  --> Dr. Klein
    dsh  --> Deutschlands Superhirn
    dof  --> Filmdonnerstag (siehe fad auch)
    dok  --> Dokumentation
    egf  --> Ein guter Grund zu feiern
    ete  --> Ein starkes Team
    fad  --> Filmdonnerstag (siehe dof auch)
    fdw  --> Der Fernsehfilm der Woche
    ffz  --> Ein Fall für zwei
    gsi  --> GSI Spezialeinheit Göteborg
    hel  --> Heldt
    his  --> ZDF-History
    hzb  --> Herzensbrecher
    inf  --> ZDFinfo
    kbe  --> Kommissar Beck
    klu  --> Kommissarin Lucas
    koh  --> Kommissarin Heller
    kue  --> Küstenwache
    lll  --> Lafer!Lichter!Lecker!
    mau  --> Marie Brand und ...
    mdh  --> Mordshunger
    mmo  --> München Mord
    mtk  --> Mich täuscht keiner!
    neo  --> ZDFneo   (selten ... aber siehe Sammelthema Dokumentation)
    nhk  --> Notruf Hafenkante
    nnm  --> Clüvers Geheimnis
    rhc  --> Die Rosenheim-Cops
    sak  --> Schwarzach 23  (siehe aber Stralsund von 2016.10.29, "Vergeltung" ... Stralsund scheint ein Fehler zu sein)
    sof  --> Filme
    ************
    sok1 --> SOKO München   ("SOKO München" und "SOKO 5113" scheint gleichbedeutend zu sein ...
    sok1 --> SOKO 5113      ... wobei "SOKO München" wohl bevorzugt werden soll (siehe z.B., https://www.zdf.de/serien/soko-muenchen/wasserratten-102.html)
    ************
    sok2 --> SOKO Kitzbühel
    sok3 --> SOKO Köln
    sok4 --> SOKO Leipzig
    sok6 --> SOKO Wien
    sok7 --> SOKO Wismar
    sok8 --> SOKO Stuttgart
    sta  --> Der Staatsanwalt
    str  --> Stralsund
    uvd  --> Unter Verdacht
    vks  --> Volle Kanne
    wil  --> Wilsberg
    zei  --> ZDFzeit
    zdj  --> Zeugen des Jahrhunderts
    zeu  --> Zeitzeuge
derreisende77 commented 8 years ago

Probleme mit dem crawler bitte in MServer posten. MediathekView hier ist das GUI und hat damit nichts zu tun.

Am 21. November 2016 08:25:41 schrieb zxsd notifications@github.com:

Betr: https://github.com/mediathekview/MediathekView/issues/149

Eine Stunde nach meinem früheren Issue habe immer noch fast keine Ahnung wie man vorgehen soll, also wieder versuchsweise eingereicht ...

Diesmal aber mit einer ausdrücklichen Bitte ...

Nicht implementieren bis die Möglichkeit vorhanden ist, die Auswirkung der beschriebenen Änderung außerhalb des Live-Verfahrens testen, betrachten, und beurteilen zu lassen. Ein kleiner Kreis von erfahrenen Usern sollte vor der Inbetriebnahme dieser Art von Änderung unbedingt im vollen Ausmaß abseits (off the beaten path auf Englisch) testen. Ich habe ORF und ZDF geohrfeigt, weil diese Sender deren Live-Infrastruktur fürs Testing eingesetzt haben. So was darf mit MV nicht vorkommen!

Es ist nicht abzuschätzen, wie viele Abos derzeit im Betrieb sind. Ich bin mir aber sicher, daß MV-Anwender die ZDF-Abos angelegt haben, die jetzigen Themen und vielleicht anderen Filmliste-Attributen acht geschenkt haben.
Die Rubriken die sich jetzt in Abos befinden können, dürfen nicht 'einfach so' ersetzt werden.

Das Workflow beschreibt bestimmt wie Neuerungen sorgfältig und vorsichtig, den normalen Betrieb nicht störend, zu testen sind. Wenn nicht, soll dieses Issue halt offen bleiben. bis wir als Projekt soweit sind.

...

Also zum Issue selbst ... welches früher im MV-Forum erschienen ist.

Seit der Umstellung 'landen' Sendungen öfter nur in Sammelthemen, als früher der Fall war. Problemen wurden gemeldet, beispielsweise mit Abos oder Episoden überhaupt zu finden.

Als Ergänzung, bzw., Ausweichlösung (fallback auf Englisch) der jetzigen Logik, die das Thema ermittelt, könnte vielleicht von einer Zeichenkette in der Dateinamen Gebrauch gemacht werden. Gerade vor der Auflösungs-/Versions-Angaben (wie "1496k_p13v13", "2256k_p14v11" oder "3296k_p15v13") ist normalerweise eine mit Unterstrichen abgegrenzte, drei-bis-vier stellige Abkürzung (Abk.) der Sendereihe vorhanden. Zum Beispiel bedeutet "tex" ZDF-intern wohl die Sendereihe "Terra X" während "txp" "Terra Xpress" bedeutet. (ZDF-Sendungen die mit 3sat geteilt werden, können stark von diesem Muster abweichen.)

Hier ist eine Liste von Kandidaten, falls sich so was umsetzen ließe. Der junge Stand von einigen Sammelthemen ist widerspiegelt: Der Fernsehfilm der Woche, Dokumentation, Ganze Filme im ZDF, Samstagskrimis, Serien, Serien im ZDF, und Show. Meiner Meinung nach müssen die Sammelthemen besonders acht geschenkt werden ... Merkmale von diesen zu ändern, könnte in ungeahntem Ausmaß Abos von vielen MV-Anwendern (ohne Absicht) beeinflussen. Vollständig/autoritativ ist die untenstehende Liste lange nicht, aber als Anfang, vielleicht geeignet.

    bel  --> Bella Block
    afe  --> Auf der Flucht
    bet  --> Bettys Diagnose
    chf  --> Die Chefin
    dls  --> Letzte Spur Berlin   (Die Sendereihe hieß früher, "Die letzte Spur.")
    dlz  --> Der letzte Zeuge
    dks  --> Das kleine Fernsehspiel
    dkm  --> Der Kommissar und das Meer
    drk  --> Dr. Klein
    dsh  --> Deutschlands Superhirn
    dof  --> Filmdonnerstag (siehe fad auch)
    dok  --> Dokumentation
    egf  --> Ein guter Grund zu feiern
    ete  --> Ein starkes Team
    fad  --> Filmdonnerstag (siehe dof auch)
    fdw  --> Der Fernsehfilm der Woche
    ffz  --> Ein Fall für zwei
    gsi  --> GSI Spezialeinheit Göteborg
    hel  --> Heldt
    his  --> ZDF-History
    hzb  --> Herzensbrecher
    inf  --> ZDFinfo
    kbe  --> Kommissar Beck
    klu  --> Kommissarin Lucas
    koh  --> Kommissarin Heller
    kue  --> Küstenwache
    lll  --> Lafer!Lichter!Lecker!
    mau  --> Marie Brand und ...
    mdh  --> Mordshunger
    mmo  --> München Mord
    mtk  --> Mich täuscht keiner!
    neo  --> ZDFneo   (selten ... aber siehe Sammelthema Dokumentation)
    nhk  --> Notruf Hafenkante
    nnm  --> Clüvers Geheimnis
    rhc  --> Die Rosenheim-Cops
    sak  --> Schwarzach 23  (siehe aber Stralsund von 2016.10.29, "Vergeltung" 
    ... Stralsund scheint ein Fehler zu sein)
    sof  --> Filme
    ************
    sok1 --> SOKO München   ("SOKO München" und "SOKO 5113" scheint 
    gleichbedeutend zu sein ...
    sok1 --> SOKO 5113      ... wobei "SOKO München" wohl bevorzugt werden soll 
    (siehe z.B., https://www.zdf.de/serien/soko-muenchen/wasserratten-102.html)
    ************
    sok2 --> SOKO Kitzbühel
    sok3 --> SOKO Köln
    sok4 --> SOKO Leipzig
    sok6 --> SOKO Wien
    sok7 --> SOKO Wismar
    sok8 --> SOKO Stuttgart
    sta  --> Der Staatsanwalt
    str  --> Stralsund
    uvd  --> Unter Verdacht
    vks  --> Volle Kanne
    wil  --> Wilsberg
    zei  --> ZDFzeit
    zdj  --> Zeugen des Jahrhunderts
    zeu  --> Zeitzeuge

You are receiving this because you are subscribed to this thread. Reply to this email directly or view it on GitHub: https://github.com/mediathekview/MSearch/issues/62

zxsd commented 8 years ago

Tut mir leid. Eine "Anfänger/Anwender" Warntafel werde ich basteln müssen.

claell commented 8 years ago

Passt doch hier in MSearch, oder ist das nachträglich verschoben worden?

zxsd commented 8 years ago

https://github.com/mediathekview/MServer/issues/26

Ich bin Anwender, und versuch mich konform zu verhalten. Einer der Bescheid weiß ... bitte das falsche Issue (entweder MServer oder MSearch) zuzumachen.

claell commented 8 years ago

Ich glaube, @derreisende77 hat sich vertan und nicht gesehen, dass das hier MSearch ist. Das sollte hier eigentlich passen, MServer ist da glaube ich noch was anderes.

derreisende77 commented 8 years ago

Ja hatte nur den Link auf MV gesehen. MSearch ist auch OK, MServer wäre auch OK. MV definitiv nicht. Also alles OK

Am 21. November 2016 09:52:24 schrieb Claudius Ellsel notifications@github.com:

Ich glaube, @derreisende77 hat sich vertan und nicht gesehen, dass das hier MSearch ist. Das sollte hier eigentlich passen, MServer ist da glaube ich noch was anderes.

You are receiving this because you were mentioned. Reply to this email directly or view it on GitHub: https://github.com/mediathekview/MSearch/issues/62#issuecomment-261878868

xaverW commented 8 years ago

das muss hier hin, da ist es richtig (und nur hier)

Nicklas2751 commented 8 years ago

Also wegen Workflow das von dir verlinkte hat nichts mit dem Einstellen von Bugs zu tun sondern bezieht sich eher auf Entwicklung der Anwendung. Wenn du ein Problem hast kannst du hier einfach ein Issue dafür einstellen.

Was meinst du denn mit "Sammelthemen"? Die von dir verlinkten gemeldeten Probleme sahen mir jetzt wie gelöst aus und eher keine Crawler Probleme zu sein.

Allgemein wird mir gerade dein Problem nicht so klar. Kannst du bitte versuchen das aktuelle Verhalten aus deiner Sicht zu beschreiben, was dir daran nicht passt und wie du es dir vorstellen würdest? Oder auch gerne ein ganz Konkretes Beispiel wo dein Problem auftritt, also bei Welcher Sendung von welchem Datum und was da nicht passt?

Vielen Dank.

claell commented 8 years ago

Ich glaube, es geht darum, anhand des Links das Thema zuzuordnen.

zxsd commented 8 years ago

Wenn du ein Problem hast kannst du hier einfach ein Issue dafür einstellen. (Nicklas2751 commented 17 hours ago)

Eigentlich habe ich kein Problem. Meldungen von Usern in MV-Forum deuten darauf hin, daß die Schwächen ZDF aufweist bei dem Publizieren von Sendungen (oder als Folge der ZDF-Umstellung) stören. Und diese Meldung kommen vereinzelt immer wieder vor.

Was meinst du denn mit "Sammelthemen"?

Als Sammelthema bezeichne ich die ZDF-Themen welche anscheinend dafür vorgesehen war, das leichte Abonnieren von verwandten Sendereihen. Seitdem ich MV anwende sind sie dabei, obwohl ich nie von denen Gebrach gemacht habe.

sammelthemen

Wenn ein MV-Anwender ein derartiges Abo angelegt hatte, wie "ZDF (Sender) | Serien im ZDF (Thema)", erwartetet er, daß diese Sendungen zum Downloaden automatisch selektiert werden, oder sogar in Headless/Auto-Modus ohne jegliche Einwirkung runtergeladen werden. Und diese Erwartungen entsprechen was vorhanden war, wenn das Abo angelegt wurde ... irgendwann in der Vergangenheit. Wenn ein derartiges Abo angelegt worden war, könnte der Anwender versucht haben, mit einem Schlag einige Sendereihen mit einem einzelnen Abo zu beziehen, beispielsweise: Heldt (hel), Die Rosenheim-Cops (rhc) und Herzensbrecher (hzb):

serien im zdf

Wegen Zeitmangels werde dieses Posting erst heute Abend fertig schreiben können. Wird fortgesetzt ...

Die von dir verlinkten gemeldeten Probleme sahen mir jetzt wie gelöst aus und eher keine Crawler Probleme zu sein.

Allgemein wird mir gerade dein Problem nicht so klar. Kannst du bitte versuchen das aktuelle Verhalten aus deiner Sicht zu beschreiben, was dir daran nicht passt und wie du es dir vorstellen würdest? Oder auch gerne ein ganz Konkretes Beispiel wo dein Problem auftritt, also bei Welcher Sendung von welchem Datum und was da nicht passt?

xaverW commented 8 years ago

Als Ergänzung, bzw., Ausweichlösung (fallback auf Englisch) der jetzigen Logik, die das Thema ermittelt, könnte vielleicht von einer Zeichenkette in der Dateinamen Gebrauch gemacht werden. Gerade vor der Auflösungs-/Versions-Angaben (wie "1496k_p13v13", "2256k_p14v11" oder "3296k_p15v13") ist normalerweise eine mit Unterstrichen abgegrenzte, drei-bis-vier stellige Abkürzung (Abk.) der Sendereihe vorhanden. Zum Beispiel bedeutet "tex" ZDF-intern wohl die Sendereihe "Terra X" während "txp" "Terra Xpress" bedeutet.

der Vorschlag meint, dass man das "Thema" beim ZDF vielleicht besser aus der URL ableiten könnte oder die jetzigen "Themen" damit "korrigieren" könnte

zxsd commented 8 years ago

Ich schreibe (wohl zu) pedantisch, um etwas aus großer Entfernung in Wörtern präzis zu beschildern. Deswegen sind Bilder auch oft dabei. Ich tue es in der Hoffnung von wildfremden, anderssprachigen Menschen verstanden zu werden, oder etwas bewirken zu können. Asymmetrischere Kommunikation gibt's nicht ... heute was schreiben, morgen eventuell eine Erwiderung lesen. Deswegen meist ein derartiger 'Plädoyer,' wobei ich auch versuche, etwaige Fragen vorauszuahnen, und diese gleich mitzubeantworten. Ein zweiter Anlauf bringt nichts.

Schenkt der Leser mein gut gemeinter Versuch keine Acht, dann ist es halt so. Wenn ich was lese, egal ob deutsch oder englisch, dann niemals quer. Das Überfliegen im Twitter-Sinne des Wortes von komplizierten Sachen liefert oft kein wirkliches Verständnis.

Wenn der Kern von meinem ursprünglichen (langen, komplizierten) Anliegen mit einigen Wörtern klar zusammengefaßt werden kann, wie @xaverW oben tat, weiß ich, daß ich doch letztendlich kommuniziert habe. Ich weiß auch zu schätzen, die Bemühungen meinen ganzen Kram zu lesen höchstwahrscheinlich erfordert. Ich verspreche Euch, viel mehr Mühe beim Schreiben verwandt zu haben, als das Lesen erfordern sollte!

Insbesondere weiß ich MV und seine Entwickler zu schätzen. An das Verbessern von MV versuche ich beizutragen. Mehr nicht.

xaverW commented 8 years ago

wäre ein Ansatz, mir wäre aber wohler, wenn sich das Thema "exakt" aus der Website auslesen ließe, würde auch bei neuen Themen passen. Aber zum Abgleich oder wenn keins gefunden wird, wäre es als 2. Möglichkeit das Thema zu ermitteln, was.