yaledeus / ElliDock

Rigid protein-protein docking via equivariant elliptic-paraboloid interface prediction
MIT License
2 stars 1 forks source link

'ligand sequence length < 20' 和 'receptor sequence length < 100 or > 1000',跳过的原因? #10

Closed Ming-Qin-tech closed 3 months ago

Ming-Qin-tech commented 4 months ago

虞博你好👋 请问 if ligand: assert plen >= 20, 'ligand sequence length < 20' else: assert plen >= 100 and plen <= 1000, 'receptor sequence length < 100 or > 1000'

请问这么设置的原因是什么?是 follow 的其他 paper 吗?论文中没有找到说明

yaledeus commented 4 months ago

这里的设置是经验性的,原因是 SAbDab 数据集中有一些脏数据,通过控制 ligand 和 receptor 的 seq 最小长度筛除。控制 receptor 的最大长度是防止单条数据长度偏差过大导致训练时 OOM.