zjunlp / OntoProtein

[ICLR 2022] OntoProtein: Protein Pretraining With Gene Ontology Embedding
MIT License
138 stars 22 forks source link

数据文件 #4

Closed lonetravelwolf closed 2 years ago

lonetravelwolf commented 2 years ago

博主你好,请问一下代码数据集中,protein_go_triplet,protein_seq_map.txt文件如何获取?似乎没有在代码中找到

Alexzhuan commented 2 years ago

你好,我们数据集中 protein_seq_map.txt 是由OntoProtein/gen_onto_protein_data.pycreate_uniprot_data 生成,需要输入蛋白质序列文件 uniprot_sprot.dat (我们在README提供了下载途径);protein_go_triplet 是文件夹,里面文件是由 create_goa_triplet 生成。

lonetravelwolf commented 2 years ago

非常感谢,我在建立protein_seq_map.txt空白文件后解决了问题