2024年“数据要素×”大赛优秀项目案例集——科技创新案例之二 | 提高蛋白质从头设计的效率和可控性

2025-02-17 14:37 来源:国家数据局
浏览量: 收藏:0 分享

       当前,国际上蛋白质算法预测的多是蛋白的静态结构,由于自然界中存在的活性蛋白都是运动的,因此,如何了解蛋白的运动规律,对靶点和药物的研究至关重要。北京大学深圳研究生院研究团队积极探索大数据驱动的蛋白质设计科研范式,提升蛋白质设计效率,并实现蛋白的可控设计,推动研发的药物对靶点更强针对性,更小毒副作用。

  一是积极探索大数据驱动的蛋白质设计科研范式。团队在“AI+蛋白质”设计领域取得了重大突破,提出了一种新的冷冻电镜成像算法,即重建蛋白酶体底物降解动态自由能面,并收集了200T特有的四维冷冻电镜独有数据。根据该数据库模拟了蛋白酶体构象的连续体动力学变化,研发了国际领先(First in Class)的靶点机制。同时,基于收集的独有数据集,进行多模态大模型训练,进行蛋白质设计、生成和筛选,并将成果进行了商业转化,目前已获得多轮天使融资,与多家企业开展了合作。

  image.png

  图1基于审计的蛋白质设计大模型

  二是丰富数据的来源、扩充数据规模。数据主要来源于公司自己采集、分析和建模,以及公共数据的分析。其中,约200T私有数据利用了北大的成像装置采集、纯化得到。同时也辅助加入国际上公开约60P的蛋白质数据库。

  三是利用大数据训练蛋白质可控生成大模型。将训练好的大模型用于任意给定靶点的药物设计。通过结合虚拟筛选和物理驱动等策略,可以进一步甄别高质量药物候选物,将湿实验门槛降低到可快速验证的数量级。

  四是利用蛋白生成大模型生成特定的靶向药物。目前主要围绕“蛋白酶+炎症小体”,研发世界级领先的药物,为抗癌、抗病毒、抗细菌等方面的蛋白质药物研发提供新思路和解决方案。

  通过蛋白质设计、生成和筛选,逐步形成和掌握蛋白为核心的制药关键大数据,形成数据为基础的真正的核心竞争力。

 image.png

  图2产业链协作模式

  五是积极探索项目的社会经济效益。项目有利支持多特异药物研发,先导药物发现的时间从24个月缩短至5个月。深圳埃空间生物科技公司完成了种子轮融资,自研了候选药物用于治疗心梗等心血管疾病。目前完成动物实验阶段,已与江苏某医药民企合作开发创新药物,同时与慢性病管理机构达成战略合作。

↓↓了解更多资讯,请识别下方二维码↓↓

  1701840725(1).jpg

国脉集团

国脉集团是数据资产化专业服务机构,为数据资源拥有者提供专业、规范、合规的全流程数据资产化服务,包括培训、咨询和产品设计等,实现数据资源价值最大化。主要服务于政府数据管理机构、央国企数据运营企业、城市数据运营平台和数据富集型平台企业,打造数据资产网、数据资产研究院和产业专家网络等支撑体系,同时在营商环境与政务领域继续保持领先优势。

主要课程

主要课程包括数据资产入表、数据经纪人、公共数据运营和政府CDO、数据精品等精品课程。

主要服务

数据资产化服务:数据资产化战略布局、数据资产入表、数据产品开发及交易等关键任务;

数据要素×项目服务:政策扶持、案例奖项申报、金融支撑和市场变现;

数据产业园区和试验区咨询服务:园区规划、咨询、资源导入

标签:

责任编辑:chenshanliang
在线客服