近日,记者从北京智源人工智能研究院了解到,智源研究院行为世界模型创新中心聚焦下一代通用世界基座模型的学术研究与前沿探索,将构建面向真实物理世界的通用基座模型。
世界模型被视为AI迈向通用智能的下一个关键战场。图灵奖得主杨立昆将其视为AGI核心路径,其创立的AMILab持续深耕JEPA架构;AI科学家李飞飞从空间智能出发,创办的WorldLabs累计融资超10亿美元,发布Marble模型构建可交互的3D物理环境。谷歌DeepMind持续迭代Genie系列模型,英伟达推出Cosmos世界基础模型,国内字节跳动、阿里巴巴、腾讯、华为等厂商也在加速布局。全球AI竞争的核心坐标,正从“虚拟世界的内容生成”转向“物理世界的真实交互”。
智源技术布局经历了从大语言模型到多模态模型,再到世界模型的清晰演进,充分聚焦在人工智能从数字世界迈向物理世界的能力。2021年智源发布中国首个超大规模预训练语言模型“悟道1.0”及当时全球参数量最大的“悟道2.0”,引领中国大模型浪潮;2022年起布局多模态大模型,并在2023年正式推出Emu1和Emu2,具备多模态输入到多模态输出和多模态上下文学习能力;2024年发布的悟界·Emu3是全球首个原生多模态世界模型,相关成果登上《Nature》正刊,这是我国科研机构主导的大模型成果首次在《Nature》正刊发表;2025年10月,推出原生多模态世界模型悟界·Emu3.5,实现从“预测下一个词元”到“预测下一个状态”的能力跃迁,从长视频数据中学习世界演化规律,提出多模态Scaling新范式。
近日,22岁北京大学青年学者、逆矩阵创始人、国际顶会ACL最佳论文得主陈博远担任北京智源人工智能研究院行为世界模型创新中心负责人。经过七年多的发展,智源探索出“集中力量办大事、青年人才挑大梁”的独特模式。其中,智源学者计划中,38岁以下青年科学家有40位,其中3位不足30岁,而智源青源会则汇聚了海内外青年学者2000余人。7年来,智源累计孵化加速超20家具有核心技术能力的创新企业,已上市1家,估值超过百亿元的2家,超过10亿元的6家。
访谈
更多护航视频监控网络安全 做物联网安全的守护者 ——专访天防安全总经理段伟恒
在万物互联时代,网络安全的重要性日益凸显,尤其在快速发展的城市建设中,搭建的巨大物联网络对其安全保障…
做行业赋能者 HID迎接数字化浪潮新机遇 破解新挑战
今年3月份,全球可信身份解决方案提供商HID发布了最新的《安防行业现状报告》(以下简称“报告”),该报告…
数字化浪潮下,安防厂商如何满足行业客户的定制化需求?
回顾近两年,受疫情因素影响,包括安防在内的诸多行业领域都遭受了来自市场 “不确定性”因素的冲击,市场…