ddbj / ddbj_validator

DDBJ Validation Rule/Validator/Module/API server
1 stars 0 forks source link

biosample package の rdf に tsv での提供順情報を持たせる #48

Closed okbp closed 6 years ago

okbp commented 6 years ago

現状のDDBJ BioSample OWLでは、TSVで属性表示する際の順序を取得することが出来ないので、RDFデータの構造を見直す

okbp commented 6 years ago

gist保存の変換スクリプトの20170612版を取り込み https://gist.github.com/tfuji/f552f942c11538ac2cdb/0cf80a8be41064e25f30bbbe09b85eb5317efe19

8fd5fa0

その後の順序定義の為の試行コード(& 属性グループ制約)以外の変更を取り込み 612fda8 1086ec4

okbp commented 6 years ago

RDF collectionsを使用してパッケージ毎の属性順序定義をRDFに追加。ただし、順序を定義するスプレッドシートがまだない為、現状は全て同じ順序を定義。

376b68b

RDFでは順序リストを定義できるが、現状のSPARQLの仕様では順序を保ったまま効率よく取り出すことが出来ない。 この為、順序を取得する際にはVirtuoso独自のtransitiveオプションを使用することを想定している。

スキーマとSPARQL例 https://docs.google.com/presentation/d/1blwBlW10xYitWP8TLuiAnRCe850sRVCA7z-WG_Gn-ig/edit?usp=sharing

okbp commented 6 years ago

RDF collectionsは使用せず、owl:Axiomを使用して順序を記述するように修正 https://gist.github.com/tfuji/f552f942c11538ac2cdb

https://github.com/ddbj/ddbj_validator/wiki/meeting_20180330#biosample-package-%E3%81%AE-rdf%E4%BD%9C%E6%88%90

新しいスキーマに対応するSPARQLに修正してmasterマージしリリース済み https://github.com/ddbj/ddbj_validator/commit/bf30387fb5530b5e23e9e1bdf3f4dd9f6d83f0f3