蛋白质口袋划分
选取口袋部分,6A ,8A ,
球形/正方形
ps. 一定按照文献中的数据进行
从数据库中下载mol2
400millions 的药物分子去和蛋白质口袋进行作用
筛选出TOP1K的数据
DrugClip 一种基于对比学习的蛋白质-分子表示学习框架,将虚拟筛选重构为密集检索任务,通过双编码器,
- unimol的3d transformer 学习蛋白质口袋于分子的表示;
- HomoAug生物数据增强(利用同源蛋白质生成新训练对)和rdkit构象模拟处理训练-测试不一致的问题,在
结果: - dud-e 和lit-pcba基准测试中,零样本设置下显著优于Glide-sp vina等传统对接方法
查看TOP100/20/50里面有没有我们的阳性分子
我们有pos阳性的分子 也有neg阴性的分子
注意:
- 我们特征提取时可以将数据提取出来之后直接进行,不需要重复进行计算
- 大规模的特征提取,可以采用faceholk的方式进行