【新智元导读】OpenAI与Retro Biosciences合作,借助定制模型GPT-4b micro成功设计出优化版「山中因子」,大幅提升了成体细胞逆转为多能干细胞的效率。这一成果不仅改进了细胞工程,更展示了AI赋能生命科学研究的全新范式,加速科研进入全新时代。 这种「细胞逆转」,能让普通的体细胞回到像胚胎一样的状态,从此人类就有可能再生各种组织,甚至治愈那些无法治疗的疾病。 后续通过在多种捐赠者来源、多种细胞类型和多种递送方法中的重复实验验证了其可靠性,最终确认所衍生的iPSC细胞系具备完全的多能性和基因组稳定性。 首先,从一个GPT-4o的缩减版进行初始化,以充分利用GPT系列模型已有的知识储备,随后在一个特殊的数据集上对其进行深度训练。 研究团队对大部分数据进行了丰富,为其添加了额外的上下文信息,包括蛋白质的文本描述、共进化同源序列以及已知的相互作用蛋白质组。 这对于山中因子这类靶点尤为关键,因为它们的活性并非依赖于形成单一稳定结构,而是通过与多种结合伴侣发生大量瞬时相互作用来实现的。 在开发过程中,观察到了类似语言模型的scaling laws——在更大数据集上训练的更大模型,在困惑度(perplexity)和下游蛋白质基准测试上均表现出可预测的性能提升。 为了证明该模型确实能加速疗法开发,研究团队与Retro的科学家们通力合作,由他们使用此模型重新设计了与其细胞重编程研究项目相关的关键蛋白质。 筛选结果显示,模型给出的建议中超过30%的序列,在表达关键多能性标记物方面的表现优于野生型SOX2,尽管它们与野生型的平均差异超过100个氨基酸。 在三次独立的实验中,成纤维细胞的早期(SSEA-4)和晚期(TRA-1-60, NANOG)标记物水平均出现急剧上升,且晚期标记物的出现时间比使用野生型OSKM组合方案提前了数天。 为了进一步确认重编程效率的提升并探索其临床应用潜力,研究团队测试了一种新的递送方式(使用mRNA替代病毒载体)和另一种细胞类型——源自三位中年(50岁以上)捐赠者的人类间充质基质细胞(MSCs)。 这些结果全面超越了由合同研究组织(CRO)使用标准因子生成的常规iPSC细胞系的基准数据,进一步证明了研究团队工程化变体的稳健性,也为其在不同递送方式和细胞类型中的应用提供了有力证据。 下面三张图中所有的结果共同证实了,研究团队已成功获得健康、且完全重编程的干细胞,从而也全面验证了重编程干细胞的健康与功能。 综上所述,高阳性率、深度的序列编辑、标记物的提前出现以及AP阳性集落的形成,这些早期证据共同表明,AI指导的蛋白质设计能够极大地推动干细胞重编程研究的进程。 当研究人员将深刻的领域洞见与研究团队的语言模型工具相结合时,那些曾经需要耗费数年才能解决的问题,如今可能在几天之内就迎来转机。 总的来说,这次的成功,不仅仅是AI创造了几种更高效的蛋白质,更是向研究团队展示了一种利用AI深度理解复杂科学问题并提出创新解决方案的全新科研范式 从寻找抗衰老疗法,到设计新药、解决粮食危机,当人类的智慧与AI的超凡算力相结合,研究团队解决科学难题的速度,将发生革命性的改变。


