mediathekview / MServer

Server zum Steuern des Crawler
https://mediathekview.de
GNU General Public License v3.0
70 stars 19 forks source link

Feature Request: Unterstützung für Staffel/Episode Daten #942

Open ChristianKuehnel opened 11 months ago

ChristianKuehnel commented 11 months ago

Das ZDF hat jetzt offenbar die Staffel und Episode bei Serien aus dem Titel entfernt und speichert diese in einem eigenen Feld (Beispiel: https://www.zdf.de/serien/solo-fuer-weiss : "S01 F08").

Es wäre super, wenn MediathekView das auch (z.b. als eigene Spalten) anzeigen würde.

Die ARD entgegen hat diese Daten immer noch im Titel (Beispiel: https://www.ardmediathek.de/serie/der-zuerich-krimi/ "Borcherts Fall (S01/E01)").

dadidadit commented 11 months ago

Das ZDF hat jetzt offenbar die Staffel und Episode bei Serien aus dem Titel entfernt und speichert diese in einem eigenen Feld (Beispiel: https://www.zdf.de/serien/solo-fuer-weiss : "S01 F08").

Es wäre super, wenn MediathekView das auch (z.b. als eigene Spalten) anzeigen würde.

Das ZDF hat Staffel und Episode bis auf ganz wenige Ausnahmen NOCH NIE im Titel gehabt, weder in der API noch im EPG noch im Videotext des Senders. Soviel dazu..

Die ARD entgegen hat diese Daten immer noch im Titel (Beispiel: https://www.ardmediathek.de/serie/der-zuerich-krimi/ "Borcherts Fall (S01/E01)").

Immer noch ist gut ;) . Gottseidank hat die ARD seit der Übernahme der Sendungen vom ZDF ebenso bis auf wenige Ausnahmen SCHON IMMER im Titel gahabt. _

ChristianKuehnel commented 11 months ago

Das ZDF hat jetzt offenbar die Staffel und Episode bei Serien aus dem Titel entfernt und speichert diese in einem eigenen Feld (Beispiel: https://www.zdf.de/serien/solo-fuer-weiss : "S01 F08").

Es wäre super, wenn MediathekView das auch (z.b. als eigene Spalten) anzeigen würde.

Das ZDF hat Staffel und Episode bis auf ganz wenige Ausnahmen NOCH NIE im Titel gehabt, weder in der API noch im EPG noch im Videotext des Senders. Soviel dazu..

Dann habe ich mich da geirrt. Entschuldigung.

Die Informationen zur Staffel/Episode sind irgendwo vorhanden (auf der Webseite werden sie angezeigt) und es wäre super, wenn jemand einen Weg finden würde diese zu extrahieren.

vitusson commented 11 months ago

Das ZDF macht das wie es gerade Lust hat. Je naach Mondstand, Sonnenscheindauer geteilt durch Redakteursalter und Tagesform. Da war noch nie was konsistent. Es gibt Serien die vorbildlich mit S01E0X getagt sind, andere einfach nur mit Titel und Folgennummmer darf man sich selber suchen. Ich sehe nicht was MV daran ändern könnte, die Rohdaten vom ZDF sind shice, Punkt.

codingPF commented 11 months ago

Ich glaube hier ist besser aufgdhoben

ChristianKuehnel commented 11 months ago

Dann sollte ich mir die Rohdaten mal anschauen und überlegen, ob man daraus irgendwas sinnvolles extrahieren kann.

Woher (welche API/Webseite/...) bezieht denn MediathekView die Inhalte beim ZDF? Ist das ein Webscraper? Oder hat das ZDF eine API dafür?

dadidadit commented 11 months ago

Dann sollte ich mir die Rohdaten mal anschauen und überlegen, ob man daraus irgendwas sinnvolles extrahieren kann.

Dann such mal schön. Und wenn du fündig sein solltst, kannst du den Entwicklern, die sich bisher immer große Mühe gegeben haben und einfach nichts finden (wollen?) ganz toll erklären, wie einfach das doch war , wenn das ZDF diese Informationen nicht zur Verfügung stellen will. Noch nicht einmal im eigenen erzeugten und veröffentlichten Videotext im Fernsehprogramm findest du dazu irgend etwas zu Staffel und Folge .... Im einfachsten Fall holst du dir die gewünschten Serientitel mit fehlenden Infos einfach aus dem ARD-Link oder gehts auf die Webseite in der ZDF-Mediathek und schaust sie dir da ab. Das geht nämlich ganz einfach: Klick auf den "Link zur Webseite".

codingPF commented 11 months ago

Dinge ändern sich und es kann nicht schaden (auch bekannte) Themen noch zu durch denken

pidoubleyou commented 11 months ago

ja, das ZDF hat die Infos tatsächlich explizit mittlerweile in seiner Datenstruktur: Screenshot from 2023-11-08 21-50-16

Eine Erweiterung in diese Richtung wäre durchaus mal denkbar.

ChristianKuehnel commented 11 months ago

@dadidadit Ich finde deinen Tonfall sehr unfreundlich und unangemessen bezogen auf mein Angebot Zeit zu investieren um das Tool zu verbessern.

@pidoubleyou Das sieht doch super aus! Kann ich mir diese Daten irgendwo anschauen? Woher beziehen wir diese Daten?

pidoubleyou commented 11 months ago

Das sieht doch super aus! Kann ich mir diese Daten irgendwo anschauen? Woher beziehen wir diese Daten?

über die ZDF-API. wenn du die Filmseite bei ZDF aufrufst, findest du einen JSON-Request mit folgender Url: https://api.zdf.de/content/documents/zdf/serien/solo-fuer-weiss/solo-fuer-weiss---liebeswut-102.json

Den zugehörigen Deserializer findest du im Code hier.

codingPF commented 11 months ago

ich habe mal ein paar Zeilen code rein gebaut...hier der output (random sample) um mal einen Eindruck zu bekommen....NO EPISODE habe ich drin gelassen damit man verstehen kann wie oft das Feld gefüllt ist. Das sieht schon sehr nett aus aber hat auch eine großen imapact...

Blinky Bill#Cranky, der Clown -  (NO EPISODE)
Doku#Vom Freiwilligenjahr zum eigenen Hostel in Afrika - Abenteuer Auswandern in Tansania (NO EPISODE)
In aller Freundschaft#Verpasste Gelegenheiten -  (NO EPISODE)
Bares für Rares#Bares für Rares vom 6. November 2023 - Die Trödel-Show mit Horst Lichter #SE2023#EP256
Löwenzahn#Hühner - Das große Gackern #SE42#EP371
Abendschau - Der Süden#Sendung 09.11.2023 · Das Wichtigste aus Südbayern -  (NO EPISODE)
Death in Paradise#Rückschwung #SE11#EP4
heute#Gedenkfeier zur Reichspogromnacht (NO EPISODE)
ZDFinfo Doku#Murderous History: Der Teufel von Chicago - Rätselhafte Verbrechen #SE2022#EP3
Volle Kanne#Blühendes für den Winter - Tipps von Elmar Mai zu Weihnachtssternen und Amaryllis (NO EPISODE)
SWR1 Leute#Inna Hartwich - Moskau-Korrespondentin - Russland: Darum begehren die Menschen nicht auf -  (NO EPISODE)
Terra X#Welten-Saga - Die Schätze Indiens - Folge 2 der sechsteiligen Dokureihe mit Christopher Clark #SE1#EP2
ZDFinfo Doku#Murderous History: Die Leichenräuber von Edinburgh - Rätselhafte Verbrechen #SE2022#EP2
SWR Aktuell Baden-Württemberg#Sendung 19:30 Uhr vom 6.11.2023 -  (NO EPISODE)
KiKANiNCHEN#Der Krebs -  (NO EPISODE)
Leschs Kosmos#Der Schatz in der Mülltonne - Das Recycling-Versprechen #SE2022#EP7
Insectibles#10. Das große Leuchten -  (NO EPISODE)
heute journal update#Fiedler: "Personal nach wie vor knapp" (NO EPISODE)
Panorama#"The Marvels": Diverser Cast und Actionszenen (NO EPISODE)
Terra X#Überleben – Planet im Wandel - Dokureihe mit Dirk Steffens #SE19#EP5
ZDFinfo Doku#Geheimes Saudi-Arabien - Aufbruch und Unterdrückung  #SE1#EP3
Doku & Reportage#Von der Fabrik zur Kunst -  (NO EPISODE)
ChristianKuehnel commented 11 months ago

Danke für die Links!

Ich versuche mal zusammenzufassen, was zu tun wäre:

Das klingt tatsächlich nach einer größeren Aktion. Seht ihr da einen Mehrwert, der den Aufwand rechtfertigt?