最适合科研工作的模型是什么?Anthropic:斯坦福、MIT用Claude加速科研进程
编辑丨coisini去年十月,Anthropic 推出了 Claude 生命科学版 ——Claude for Life Sciences,旨在让 Claude 成为生命科学领域工作者更得力的合作伙伴。之后,Anthropic 投入大量资源,致力于将 Claude 打造为最适合科研工作的模型。最新推出的 Claude Opus 4.5 在图表解析、计算生物学和蛋白质理解等基准测试中均取得显著进步。A
编辑丨coisini去年十月,Anthropic 推出了 Claude 生命科学版 ——Claude for Life Sciences,旨在让 Claude 成为生命科学领域工作者更得力的合作伙伴。之后,Anthropic 投入大量资源,致力于将 Claude 打造为最适合科研工作的模型。最新推出的 Claude Opus 4.5 在图表解析、计算生物学和蛋白质理解等基准测试中均取得显著进步。Anthropic 与学术界及产业界研究人员密切合作,致力于精准把握科学家如何运用人工智能加速科研进程。研究人员已开发出定制化系统,将 Claude 的应用场景拓展到文献综述或代码辅助等基础任务之外。简而言之,Claude 正在重塑科学家的研究模式,推动科研领域迈向全新的科学洞察与发现。Anthropic 最近列举了一些知名实验室采用 Claude 加速科研进程的例子。Biomni:集成数百种工具与数据库的通用生物医学智能体生物学研究的一大瓶颈在于工具碎片化:现有数百个数据库、软件包和实验方案,研究人员需要耗费大量时间在不同平台间进行选择和掌握。在理想情况下,这些时间本应用于实验操作、数据解析或探索新课题。斯坦福大学研发的智能 AI 平台 Biomni,将数百种工具、软件包和数据集整合进统一系统,由 Claude 驱动的智能体可在其中自主调度。研究人员使用自然语言提出需求,Biomni 会自动匹配合适资源。该系统能够提出假设、设计实验方案,并在超过 25 个生物学子领域执行分析任务。以全基因组关联分析(GWAS)为例,这种研究旨在寻找与特定性状或疾病相关的基因变异。基因组扫描相对简单,耗时环节在于数据解析与意义解读:基因组数据格式杂乱需要深度清洗;研究人员必须控制混杂因素并处理缺失数据;发现「命中信号」后,还需解析其生物学意义 —— 定位邻近基因、确定其表达细胞类型、推测影响的生物通路等。每个步骤都可能涉及不同工具、不同文件格式和大量人工决策。这种繁琐过程使得单次 GWAS 分析常需数月时间,而在 Biomni 的初期试验中,仅需 20 分钟。Biomni 团队已通过多领域案例验证系统可靠性:在分子克隆实验设计中,盲评显示其方案与拥有五年以上经验的博士后水平相当;处理 30 名受试者超过 450 份可穿戴设备数据仅用 35 分钟,而专家完成相同任务预计需三周;分析 33.6 万个人类胚胎组织单细胞基因活性数据时,系统不仅验证了已知调控关系,更发现了研究人员未曾关联到胚胎发育过程的新转录因子。Biomni 并非完美系统,因此设置了防护机制以监测 Claude 是否偏离正轨。它也不能解决所有问题,但当其能力不足时,专家可将方法论编码为技能 —— 教智能体模仿专家解决问题的思路而非任其自由发挥。Biomni 代表了一种通用型解决方案,而其他实验室正在构建更专精的系统,以攻克特定研究流程中的瓶颈。Cheeseman 实验室:大规模基因敲除实验解读自动化当科学家需要了解基因功能时,常用方法是将其从细胞或生物体中移除并观察产生的异常。CRISPR 基因编辑技术使大规模精准敲除成为可能,但其应用仍受限制:实验室产生的数据量远超分析处理能力。这正是麻省理工学院 Whitehead 研究所 Iain Cheeseman 实验室面临的挑战。他们使用 CRISPR 技术对数千万人类细胞进行数千种基因敲除,通过显微成像记录每个细胞的变化。但解读基因簇的意义 —— 探究聚类原因、寻找共同特征、判断属于已知生物学关系还是新发现 —— 仍然需要专家逐基因查阅文献。这个过程极其缓慢:单次筛选可能产生数百个基因簇,由于时间、精力和专业知识限制,大多数簇从未被深入探究。多年来 Cheeseman 亲自承担所有解读工作。他估计自己大约能记住 5000 个基因功能,但有效分析这些数据仍需数百小时。为加速这一进程,博士生 Matteo Di Bernardo 着手构建能自动化 Cheeseman 工作模式的系统。通过深入解析 Cheeseman 的解读方法论 —— 数据源选择、模式识别标准、发现价值判断 —— 他们最终创建了由 Claude 驱动的 MozzareLLM 系统。该系统接收基因簇数据后,会执行 Cheeseman 式的专家分析:识别潜在共享生物过程、标注研究充分与欠缺的基因、突出值得跟进的目标。这不仅极大加速了研究进程,还帮助他们获得额外的重要生物学发现。在开发 MozzareLLM 的过程中,Di Bernardo 测试了多种 AI 模型。Claude 的表现始终优于其他模型。Lundberg 实验室:测试 AI 主导的基因研究目标假设生成Cheeseman 实验室采用的光学混合筛选技术可在单次实验中敲除数千基因,其瓶颈在于结果解读。但并非所有细胞类型都适用混合筛选方法。斯坦福大学 Lundberg 实验室等研究团队进行的是规模较小、目标集中的筛选实验,他们的瓶颈出现在更前端:如何确定需要靶向的基因。由于单次聚焦筛选成本可能超过 2 万美元且随规模增加,实验室通常仅选择数百个最可能关联特定条件的基因。传统流程需要研究生和博士后团队逐条添加候选基因并附简要理由或文献链接。这是基于文献调研、专业知识和直觉的「经验猜谜游戏」,受限于人类认知带宽,且依赖已有研究成果和在场人员记忆,难免存在疏漏。Lundberg 实验室正运用 Claude 颠覆这种方法。他们的系统不再追问「基于已有研究我们能做出哪些推测」,转而探索「基于分子特性应该研究什么」。团队构建了细胞内所有已知分子(蛋白质、RNA、DNA)的关联图谱,标注蛋白质相互作用、基因编码关系和结构相似性。随后向 Claude 提出目标 —— 例如寻找调控特定细胞结构或过程的基因 ——Claude 通过遍历分子关系图谱,依据生物学特性与关联度筛选候选基因。该实验室正在开展验证实验,将对比人类专家与 Claude 的表现。若该方法验证有效,团队预期它将成为聚焦扰动筛选的标准前置步骤。实验室无需再依赖直觉博弈或当代研究中盛行的暴力筛选,而是基于信息做出精准靶向决策。原文链接:https://www.anthropic.com/news/accelerating-scientific-research]]>