载入中… | ● 今日精选
首页 投稿 RSS 关于 联系
首页

AI新突破:JEPA架构首次驶入细胞内部

· · 阅读 5 分钟

当四年前 Yann LeCun 提出联合嵌入预测架构(JEPA)时,学界更多将其视为对自监督学习和世界模型的一次理论重构。如今,一个中国研究团队首次将这套原本为理解世界而生的架构,引入到单细胞层面——让 AI 像理解物理世界一样,去理解一颗细胞内部的动态与决策机制。这标志着“世界模型”正从宏观走向微观,从图像、视频走向活体细胞。

## 从“理解世界”到“理解细胞”:JEPA 的跨界进化

JEPA(Joint Embedding Predictive Architecture)是 LeCun 提出的一种自监督学习框架,它与当前主流的 LLM(大语言模型)路径截然不同。LLM 依赖海量文本数据学习 token 之间的概率关系,而 JEPA 则试图学习一种抽象的、高维的“表征空间”,在其中预测未来状态——它不仅学习“发生了什么”,更学习“世界如何运行”。

正是这种对因果结构的建模能力,引起了中国科研团队的关注。在传统单细胞研究中,AI 主要通过转录组、蛋白质组等静态图谱进行分类或预测,但这种“数据驱动”的方式忽略了细胞作为一个复杂动态系统的内在因果逻辑。如果将 JEPA 的“预测未来”理念应用到细胞中,模型就可以学习细胞状态之间的迁移规律,实现对细胞命运、应激响应甚至病变过程的预判。

## 解码细胞语言:中国团队的核心创新

### 1. 构建细胞内部的“抽象表征”

研究团队首先将单细胞测序、蛋白成像等多模态数据映射到一个统一的高维空间。他们借鉴 JEPA 的核心思想,在表征空间中定义“细胞状态”的嵌入向量,并设计了一个预测器——不是直接预测未来的观测数据,而是预测未来状态在表征空间中的位置。这样一来,模型不再执着于像素级的匹配,而是学习细胞内部更深层的因果结构。

### 2. 引入时间序列与干预模拟

为了让 JEPA 适应细胞动态,团队引入了时间序列标签(如不同发育阶段、药物处理不同时间点)以及干预数据(如基因敲除、化合物刺激)。模型在这些数据上训练后,能够回答如“如果在某个时间点抑制某个信号通路,细胞状态将如何偏移”这类反事实问题。这相当于给了细胞生物学一个可进行“思想实验”的虚拟工具。

### 3. 验证实验:预测细胞命运走向

在测试中,团队以造血干细胞分化这一经典难题为例。模型仅依据初始状态的嵌入表征,就成功预测了多个分支路径上的细胞命运,准确率超过传统基于深度学习的静态分类方法约32%。更重要的是,模型展示出了“零样本”泛化能力——即使未见过某些稀有细胞类型,也能通过因果空间中的路径推断出其可能的起源与归宿。

## 重新定义“世界模型”的边界

这项工作的意义远超单一技术突破。它实际上在回答一个根本问题:什么是世界模型?LeCun 曾指出,世界模型应该能够预测环境如何对动作做出响应。过去,这一概念被应用于自动驾驶、机器人等宏观场景。而中国团队的这片研究不仅证明了 JEPA 架构在细胞尺度同样有效,更暗示着“细胞即世界”的可能性——每一个细胞都是一个拥有感知、决策、反馈能力的微型智能体。

从产业层面看,这种能力将直接加速药物研发。传统上,候选化合物对细胞的动态影响需要大量湿实验验证,成本高昂且周期漫长。有了基于 JEPA 的细胞世界模型,研究者可以通过仿真来快速筛选最有潜力的分子,将实验集中在高概率成功的通路上。此外,在肿瘤异质性研究中,模型可以捕捉罕见细胞亚群的动态行为,为精准治疗提供决策依据。

当然,目前的工作仍处于初期阶段。将细胞中数以万计的分子信号和空间结构完整嵌入到统一表征空间中,计算复杂度和数据量都呈指数级上升。但中国团队已经打开了一扇门:当 AI 不再只是“看”细胞,而是学会“想象”细胞如何演变,生命科学的基础认知或许将迎来一次范式级的跃迁。