xtne6f / EDCB

BonDriver based multifunctional EPG software
Other
162 stars 37 forks source link

番組説明テキストのイレギュラーなURIを無視するよう修正 #41

Closed tkntrec closed 3 years ago

tkntrec commented 3 years ago

テレビ朝日 4/11 23:55からの番組の説明にエラーとなる表現がありました。 マッチングで回避可能かもしれませんが、一応無視する処置を提案してみます。

番組説明よりエラー部分 https://cluster.mu(アプリ「cluster」)

xtne6f commented 3 years ago

ありがとうございます。

一点だけ、852行目の para.Inlines.Add(m.Value); ですが、 para.Inlines.Add(text.Substring(m.Index, m.Length)); としたい、つまり表示部分はReplaceUrlDictionaryで置換する前のオリジナルにしたいです。

System.Uriはホスト名要素に()があると例外になるみたいですね。RFC的にはそりゃそうだですが、一方でパス要素以下ではわりと()が使われるのでどうしたもんか…ってところです。差し当たり現状のマッチングを維持しようと思います。

tkntrec commented 3 years ago

反映しました。

xtne6f commented 3 years ago

マージしました。 ついでに思い付きで リンク抽出を強化 してみました。安定をみて早めにリリースに回す予定です。

tkntrec commented 3 years ago

抽出強化、テレ東なんかの手抜きリンクなんかも概ね拾えてますね。

xtne6f commented 3 years ago

テレ東なんかの手抜きリンク

そしてこういうのに限ってhttpsにも未対応(httpオンリー)だったりする… かといってhttpを仮定してリンク作るのはあまり良い習慣じゃないので、過渡期と思って諦めます。