fkubota / Carrier-Owl

arxiv--> DeepL --> Slack/LINE
MIT License
327 stars 357 forks source link

タイトルに改行が含まれる場合がある #78

Open yujidn opened 2 years ago

yujidn commented 2 years ago

https://github.com/fkubota/Carrier-Owl/blob/5460771fac147103950a61d1bf77e3949fb39fc1/src/carrier_owl.py#L54-L62

でtitleも改行のreplaceを行なったほうがいいかもしれない、という提案になります。 60行目に以下を挿入するだけになります。

            title = title.replace('\n', '')

例えば以下の論文では改行置換ありなしでdeeplの結果が変わっていました。

url: http://arxiv.org/abs/2205.00779v1

改行置換なし

title:    ゼブラ ゼロブロックによるCNNアクセラレータのメモリ帯域幅の削減
   活性化マップの正則化
title_en:    Zebra: Memory Bandwidth Reduction for CNN Accelerators With Zero Block
 Regularization of Activation Maps

改行置換あり

title:    ゼブラ 活性化マップのゼロブロック正則化を用いたCNNアクセラレータのメモリ帯域幅の削減
title_en:    Zebra: Memory Bandwidth Reduction for CNN Accelerators With Zero Block  Regularization of Activation Maps

論文のタイトルには改行が含まれておらず、arxiv.queryの結果には含まれているのでarxiv.queryのところで何とかして欲しい気持ちですが、↓を見る限りは使う側で対処した方が良さそうかなという感じです。

https://github.com/lukasschwab/arxiv.py/issues/48