PaddlePaddle / PaddleHelix

Bio-Computing Platform Featuring Large-Scale Representation Learning and Multi-Task Deep Learning “螺旋桨”生物计算工具集
Apache License 2.0
801 stars 189 forks source link

hiv和muv数据集 #281

Open zoey731 opened 1 month ago

zoey731 commented 1 month ago

您好,我在处理HIV和MUV数据集时遇到了一些疑问。论文中提供了HIV和MUV数据集的运行结果,但是chemrl_downstream_datasets并未提供这两个数据集,并未在finetune_class.sh中明确说明使用方法。能否提供关于这两个数据集的更多细节。

Noisyntrain commented 1 month ago

Hi zoey731, 感谢关注,muv和hiv数据集因为大小原因未被包括在chemrl_downstream_datasets 中,你可以通过https://moleculenet.org/datasets-1 这里的muv和hiv下载地址来下下载。具体的数据处理可以参考pahelix/datasets/hiv_dataset.py 及 pahelix/datasets/muv_dataset.py。 希望这些信息能够对你有所帮助