蛋白质口袋划分

选取口袋部分,6A ,8A ,
球形/正方形
ps. 一定按照文献中的数据进行

从数据库中下载mol2

400millions 的药物分子去和蛋白质口袋进行作用

筛选出TOP1K的数据

DrugClip 一种基于对比学习的蛋白质-分子表示学习框架,将虚拟筛选重构为密集检索任务,通过双编码器,

  1. unimol的3d transformer 学习蛋白质口袋于分子的表示;
  2. HomoAug生物数据增强(利用同源蛋白质生成新训练对)和rdkit构象模拟处理训练-测试不一致的问题,在
    结果:
  3. dud-e 和lit-pcba基准测试中,零样本设置下显著优于Glide-sp vina等传统对接方法

查看TOP100/20/50里面有没有我们的阳性分子

我们有pos阳性的分子 也有neg阴性的分子

注意:

  1. 我们特征提取时可以将数据提取出来之后直接进行,不需要重复进行计算
  2. 大规模的特征提取,可以采用faceholk的方式进行