AI大模型用6周时间完成生物学家134年成果!斯坦福生物学基础模型开启生物学AI时代
这些计算机根据它们彼此在一个庞大的多维空间中的相似性,自己处理数据,建立起了所有细胞的模型。来自斯坦福大学的研究人员使用数百万个真实细胞的化学和基因组成作为原始数据训练了一个AI大模型,通过自行学习到的知识,模型可以将之前从未见过的细胞归类为1000多种类别中的某一种,Norn细胞就是其中之一。这些计算机运行的是类似于流行的语言模型ChatGPT的人工智能程序,但斯坦福的研究人员训练他们的计算机使
斯坦福大学研发的生物学基础大模型仅用六周时间就完成了一项震撼世界的成就——它发现了Norn细胞,而Norn细胞的发现曾让人类科学家花费了134年才达到!
来自斯坦福大学的研究人员使用数百万个真实细胞的化学和基因组成作为原始数据训练了一个AI大模型,通过自行学习到的知识,模型可以将之前从未见过的细胞归类为1000多种类别中的某一种,Norn细胞就是其中之一。
而此时,距离科学家发表Norn细胞的发现才过去短短几个月,也许早一点训练模型的话,这个功劳说不定就被AI给抢了!
这项突破不只是AI在生物科学领域的一个巨大进步,它还象征着生物学领域AI新纪元的到来。
1889年,法国医生弗朗索瓦-吉尔伯特·维奥尔在安第斯山下采集自己的血液,经显微镜观察后发现,在缺氧环境下,他的红细胞数增加了42%。他发现了人体的一个神秘能力:在需要更多此类关键细胞时,人体能够即时制造它们。
20世纪初,科学家推测是一种激素导致这种现象,他们将这种理论上的激素命名为红细胞生成素,源自希腊语“制造红色”。七十年后,研究人员在过滤了670加仑尿液后,找到了实际的红细胞生成素。
再过约50年,以色列的生物学家宣布他们发现了一种罕见的肾细胞,在氧气水平过低时生产这种激素。这种细胞被命名为Norn细胞,得名于诺尔斯命运女神。
人类用了134年的时间发现Norn细胞,而去年夏天,加州的计算机只用了六周就自行发现了它们。
研究人员在斯坦福大学将计算机编程为自学生物学。这些计算机运行的是类似于流行的语言模型ChatGPT的人工智能程序,但斯坦福的研究人员训练他们的计算机使用数百万实际细胞及其化学和基因构成的原始数据。
研究人员没有向计算机解释这些测量数据的含义,也没有说明不同种类的细胞有不同的生化特征。这些计算机根据它们彼此在一个庞大的多维空间中的相似性,自己处理数据,建立起了所有细胞的模型。当机器完成工作时,它们已经学到了惊人的知识量。它们能够将一个从未见过的细胞分类为一千多种不同的类型之一。其中一个就是Norn细胞。
斯坦福大学的计算机科学家Jure Leskovec表示:“这非常了不起,因为没有人告诉模型肾脏中存在Norn细胞。”
这些软件是几个新的AI驱动的程序之一,被称为基础模型,它们正致力于生物学的基础研究。模型不仅整理了生物学家收集的信息,它们还能发现关于基因工作方式以及细胞如何发育的新知识。
随着这些模型在实验数据和计算能力上的扩展,科学家们预测它们将开始进行更深刻的发现。它们可能会揭示有关癌症和其他疾病的秘密。它们也许能找到将一种细胞转变为另一种细胞的方法。
斯克里普斯研究转化研究所所长Eric Topol博士认为:“关于生物学的重要发现,否则可能不会由生物学家发现——我认为我们总有一天会看到。”
至于这些模型能走多远,就有了争议。虽然有些怀疑者认为这些模型将会遇到障碍,但更乐观的科学家认为基础模型甚至会解决所有生命问题:什么让生活与非生命有别?
像ChatGPT一样,生物学模型有时也会出错。牛津大学的计算生物学家Kasia Kedzierska和她的同事最近对GeneFormer和另一个基础模型scGPT进行了一系列测试。他们向这些模型提供了它们之前没见过的细胞图谱,并让它们执行诸如分类细胞类型等任务。这些模型在某些任务上表现良好,但在其他情况下则比简单的计算机程序表现差。
Kedzierska博士表示她对这些模型寄予厚望,但目前“它们不应该在没有适当理解其局限性的情况下直接使用”。
Leskovec博士说,随着科学家在更多数据上训练它们,模型正在改进。但与ChatGPT在整个互联网上的训练相比,最新的细胞图谱只提供有限的信息。他说:“我想要一个完整的细胞互联网。”
随着更大的细胞图谱上线,更多的细胞数据将出现。科学家们也从这些图谱中的每个细胞中获取不同类型的数据。这些信息将允许基础模型总结细胞工作原理的经验。
科学家们还在开发工具,这些工具可以让基础模型将它们自己学到的知识与生物学家已经发现的知识相结合。这个理念将是将成千上万的已发表科学论文的发现与细胞测量的数据库联系起来。
大语言模型(LLM)|ChatGPT相关文章(以下点击可阅读):
大语言模型简化了临床研究的自动化机器学习 | 临床科研的福音
基于GPT-4的Coscientist成功完成复杂化学实验,布洛芬配方轻松拿捏,复现诺贝尔化学奖
AI超大模型!一个午休就能读完20万篇论文、提取信息完成生物数据库更新!
两篇Nature:AI实现新材料的快速合成!17天独自创造41种新材料
顶刊 | 解放军总医院:基于生成对抗网络的主动脉和颈动脉非造影 CT 血管造影
1个小时利用ChatGPT完成神经外科领域的完全虚构的论文!AI写论文的逼真程度令人震惊
利用ChatGPT,这位医生4个月内完成16篇论文,且已发表5篇!医生科研开启加速模式!
AI论文 | ChatGPT在医学中的应用概述:应用、优势、局限性、未来前景和伦理思辨
AI论文 | 从临床和科研场景分析ChatGPT在医疗健康领域的应用可行性
GPT辅助论文降重教程,100%降至13%(实用指令,赶紧收藏)
2023年国自然医学科学学部人工智能及大模型相关课题项目汇总
科研之心,致力于探索AI大模型与科研结合。科研之心为您提供最新的AI资讯、最实用的AI工具、最深入的AI分析,帮助您在科学研究中发掘AI的无限潜力。
欢迎关注,保持交流!

GitCode 天启AI是一款由 GitCode 团队打造的智能助手,基于先进的LLM(大语言模型)与多智能体 Agent 技术构建,致力于为用户提供高效、智能、多模态的创作与开发支持。它不仅支持自然语言对话,还具备处理文件、生成 PPT、撰写分析报告、开发 Web 应用等多项能力,真正做到“一句话,让 Al帮你完成复杂任务”。
更多推荐
所有评论(0)