颜宁点评AlphaFold2+外行买家秀:蛋白结构预测神器初体验

颜宁点评AlphaFold2+外行买家秀:蛋白结构预测神器初体验
文章图片
去年年末 , 谷歌公司旗下DeepMind团队研发的AlphaFold2人工智能系统在国际蛋白质结构预测竞赛(CASP)上取得惊人的准确度 , 多数预测模型与实验测得的蛋白质结构模型高度一致 , 引起举世瞩目 。 《返朴》曾发表多位相关领域科学家的评论(回顾:《颜宁等点评:AI精准预测蛋白质结构 , 结构生物学何去何从?》) 。
颜宁点评AlphaFold2+外行买家秀:蛋白结构预测神器初体验】时隔半年 , 7月16日 , DeepMind在《自然》杂志上发文 , 公开了进一步优化的AlphaFold2源代码并详细描述了其设计框架和训练方法 。 几天后 , DeepMind又发布了由AlphaFold预测的蛋白结构数据库 , 免费提供给全球科研人员开发使用 。 对此 , 《返朴》总编、结构生物学家颜宁提出了自己的见解 。
最近这次AlphaFold带来的震撼其实不如第一次大 , 因为有了上一次的突破 , 现在这个结果基本是水到渠成 。 对比了一下钠离子通道的结构——预测的部分与电镜已经解析的部分吻合得还行 , 但没有任何homologymodel(同源模型)的部分 , 比如电镜结构里看不到的部分 , 在预测的结构里依然是一团无序的圈圈 。
AlphaFold毫无疑问是对整个生物学的一场变革 , 而不局限在结构生物学领域 。 但它并不是结构生物学的终点 , 而是可以把结构作为起点去做更多的东西 。 生命在于运动——分子层面的运动是冷冻电镜技术革命之后结构生物学新的重点 。 以我的科研为例 , 我们的目标并不是要获得研究对象的折叠信息 , 而是要解析其处于不同工作状态的精准构象信息 , 以此来理解它的工作机理和致病机理 。
短短几天 , 学界针对AlphaFold已经形成两派:做超级复合物的叹为观止 , 做膜蛋白的 , 比如我 , 感觉帮助不大 , 并且误差较大 。 这是为什么?
有人认为 , 是因为膜蛋白有脂水两相;有人认为 , 是因为膜蛋白本身解出来的可靠数据少 , 不够供AI训练;还有评论说 , 是因为膜蛋白静态简单 , 动态复杂;超级复合物则相反 , 而AlphaFold强在静态蛋白结构预测 。
膜蛋白的折叠有着相对复杂的脂分子环境 , 一旦缺少可靠的模型 , AlphaFold所预测的蛋白质折叠可能大体正确 , 但在具体构象上与实验数据有较大的差距 。 而决定膜蛋白复杂功能的 , 不是它相对简单的折叠模式 , 而是精细的构象变化 。
AI最大的挑战 , 将会是在未来 。 关于分子的动态研究、动态预测、动态模拟等等 , 其实还有很多问题都值得解决 。 在上次AlphaFold横空出世的时候我就说过 , 希望AI下一步可以解决分子动力学模拟对于很多生物过程无能为力的问题 。 那就继续期待AlphaDynamics吧?
——颜宁
撰文|继省
最近一周以来 , 生物医药圈子被AlphaFoldv2.0刷屏 , 每天打开微信朋友圈 , 都能看到至少一半的新消息与它有关 。 这款由谷歌旗下人工智能公司DeepMind团队开发的蛋白三维结构预测程序 , 在2020年的蛋白结构盲测比赛CASP中一骑绝尘独领风骚;而这次研发团队把全部代码任性地开放 , 并把Uniprot*上大部分代表性蛋白序列都给预测了一遍 。
*UniProt是一个免费使用的蛋白质序列与功能信息数据库 。
与此同时 , 蛋白设计领域的大神DavidBaker课题组参考AlphaFold的思路 , 利用他们长期在蛋白质设计领域的优势推出了一款同类软件RosettaFold 。 后者虽然不如AlphaFold覆盖全面 , 但在一些代表性的蛋白结构预测上已经可以与之媲美 , 并且对计算资源的占用更少 。
我偶尔也会八卦:是不是RosettaFold的良性竞争压力促成了AlphaFold的全面开源?总之 , 一时间结构生物学、人工智能、合成生物学还有生物医药投资等多个领域的研究者开始了热烈的讨论 。