biosciencedbc / rdf-medgen

0 stars 0 forks source link

medgen_pubmed_lnk.txt.gzのコンバート時にエラーが発生する #2

Closed ytokunaga-hi closed 2 years ago

ytokunaga-hi commented 2 years ago

2022/06/15 自動コンバートにて以下のエラーが発生

/rdf_converter_medgen.rb:371:in parse: invalid byte sequence in UTF-8 (ArgumentError) from /rdf_converter_medgen.rb:359:in block in rdf from /rdf_converter_medgen.rb:353:in open from /rdf_converter_medgen.rb:353:in rdf from /rdf_converter_medgen.rb:582:in <main> Failed: NonZeroResultCode: Remote command failed with exit status 1

確認したところ以下のファイルコンバート時にエラーが発生している模様

mitsuhashi commented 2 years ago

medgen_pubmed_lnk.txt.gz のバイト文字列対応の変更がcommitされたので、次の自動実行が正常終了するかを確認する。 https://github.com/skwsm/rdf_converter_medgen/commit/d8193b88afc3e74c29e25d6de862c4b30404400b

mitsuhashi commented 2 years ago

更新されたコンバータが自動的に適用されてエラーも出力されず、turtleファイルも作成されていることも確認しましたのでクローズします。

[rdf-medgen_logs]$ cat 20220616_stderr.log
/rdf_converter_medgen.rb:371:in `parse': invalid byte sequence in UTF-8 (ArgumentError)
    from /rdf_converter_medgen.rb:359:in `block in rdf'
    from /rdf_converter_medgen.rb:353:in `open'
    from /rdf_converter_medgen.rb:353:in `rdf'
    from /rdf_converter_medgen.rb:582:in `<main>'
[rdf-medgen_logs]$ cat 20220620_stderr.log
[rdf-medgen_logs]$