glycoinfo / GlycanBuilder2

7 stars 5 forks source link

Incorrect encoding N-sulfate of GlycoCT #45

Open e15d5605 opened 2 years ago

e15d5605 commented 2 years ago

GitlabのSupportより移動

GlyTouCanのGraphic toolに関して以下の報告があった。

GlyTouCan Glycan Search – Graphic Input tool において、既存の構造からの検索を行いましたら、検索エラーとなりました。

Glycan Search – Graphic Input tool、ツールバーの‘Structure’ より ‘Add Structure’ -> ‘GAGs’ -> ‘gagheparin’ (‘gagheparan’ も同様でした) を選択 earchボタンをクリック 以下のエラーメッセージが表示されました

Error in GlycoCT validation:>For this substituent sulfate linkage pos must be 1.For this substituent n-sulfate linkage pos must be 1.For this substituent sulfate linkage pos must be 1.For this substituent sulfate linkage pos must be 1.<

e15d5605 commented 2 years ago
image
RES
1b:x-dglc-HEX-1:5
2s:n-sulfate
3s:sulfate
4b:a-dido-HEX-1:5|6:a
5s:sulfate
6b:a-dglc-HEX-1:5
7s:n-sulfate
8s:sulfate
9b:a-dido-HEX-1:5|6:a
10s:sulfate
11s:sulfate
LIN
1:1d(2+-1)2n
2:1o(3+-1)3n
3:1o(4+1)4d
4:4o(2+-1)5n
5:4o(4+1)6d
6:6d(2+-1)7n
7:6o(3+-1)8n
8:6o(4+1)9d
9:6o(6+-1)10n
10:1o(6+-1)11n

置換基側の結合位置に誤りがある。-1になっている箇所は1でなければならない。

1:1d(2+-1)2n 2:1o(3+-1)3n

core_typesのGWSの表記によるものと考えられる。

gagheparin      GAGs    freeEnd--??1D-GlcN,p(((--NS)--3S)--6S)--4a1D-IdoA,p(--2S)--4a1D-GlcN,p(((--NS)--3S)--6S)--4a1D-IdoA,p       Heparin

GB2のGAGのテンプレートは独自性のある置換基の表記で記述されている。\ --NSは硫酸基の親側の結合位置をNと定義されるため、GlycoCTの変換処理では結合位置を-1としている。\ 置換基側の結合位置を考慮する場合は2?1NSまたは2?1Sとする必要がある。\ また、--3S--6Sなども同様であり、GlycoCTでこれらの結合情報は結合位置が-1`となっている。

以上のことから、N-sulfateの定義の方法と硫酸基の結合位置を最適な表記に置き換えることで、この問題を解決することが可能になる。

edwardsnj commented 1 year ago

This bug is exercised in GlyTouCan accession G00087BT, when parsing GlycoCT only. This results in an incorrect image in our workflow in which the sulfates on the GlcN are omitted. Any time-line on a fix for this?