华为UCM、英伟达Cosmos Reason、达摩院开源“三大件”……一周AI大事记
8月14日,三大件智元推出面向真实世界机器人操控的英院开源周统一世界模型平台Genie Envisioner(GE)。 与传统“数据-训练-评估”的伟达割裂流水线模式相比,GE将未来帧预测、达摩大事策略学习与仿真评估整合,三大件以视频生成为核心形成闭环架构。英院开源周 基于约3000小时的伟达真实机器人操控视频数据,GE建立了从语言指令到视觉空间的达摩大事直接映射,保留了机器人与环境交互的三大件完整时空信息,让机器人在同一世界模型中完成从“看”到“想”再到“动”的英院开源周端到端推理与执行。 • 点评:当前,伟达机器人学习系统普遍采用分阶段开发模式,达摩大事这种碎片化架构增加了开发的三大件繁琐度,延长了迭代周期,英院开源周限制了系统的伟达可扩展性。不同于主流VLA(视觉-语言-动作)模型利用视觉-语言进行间接建模,GE可以直接在视觉空间中建模,让机器人完成“想象-验证-行动”的完整闭环。(曹妍) 8月11日,英伟达发布机器人视觉语言模型(VLM)Cosmos Reason,它拥有70亿参数,用于机器人等具身智能,让机器人和AI代理能够像人类一样进行推理,利用先验知识、常识来理解现实世界,并在现实世界中行动。 同时,现有Cosmos世界模型系列将新增Cosmos Transfer-2,能加速从3D模拟场景或空间控制输入中生成合成数据。此外,英伟达还推出了一系列面向机器人开发者的数据库及相关基础设施。 • 点评:Cosmos Reason的突破在于解决多步骤任务,有望应用于数据管理、机器人规划和视频分析等领域。这一系列动作,标志着英伟达正在加码进军机器人赛道,拓展AI数据中心之外的下一个重要应用场景。(曹妍) 8月11日,阿里达摩院宣布开源自研的VLA模型RynnVLA-001-7B、世界理解模型RynnEC,以及机器人上下文协议RynnRCP,推动数据、模型与机器人的兼容适配,打通具身智能开发的全流程。 达摩院将MCP(Model ContextAI与机器人
01 智元发布机器人世界模型平台Genie Envisioner
02 英伟达发布Cosmos Reason
03 达摩院开源具身智能“三大件”
- 最近发表
- 随机阅读
-
- 一本线以上可直接申请加拿大本科吗?
- 活力中国调研行丨天津统筹布局未来产业赛道 加快培育新质生产力
- 哈医大研究:每天2杯无糖茶/咖啡显著降低患癌风险!
- 卡普空听劝了!龙信2砍掉付费捷径 本体永久降价!
- 伊朗议长:霍尔木兹海峡将按伊方制定的机制进行管理
- 时尚辣妹进山养鸡!日本辣妹协会会长搬到乡下养鸡
- 西十高铁昨日全线启动试运行 武汉至西安未来3小时可达
- 以被曝“最后一刻”取消大规模空袭伊朗计划
- 英国伦敦艺术大学排名及优势
- 我国233部测雨雷达已覆盖90万平方公里
- 6万亿元投资“源源而来”,未来5年升级这张网→
- 不止官方新DLC!巫师3大型MOD复原被删完整任务线
- 韩国华城电池厂火灾调查结果公布:涉事企业粗制滥造疏于管理
- 第32届图博会展出22万种图书 海外展商超1100家
- 《剑星》将登Xbox但还需等待! 适配主机工作或进行中
- 华为开发者大会2026:独家游戏、创新玩法,鸿蒙游戏展区人气高涨
- 黄金交易提醒:美伊握手言和,金价自一周低位反弹,多头却迎来最强对手?
- 现实苦才看动漫?海外观众嫌日漫太假 被指管得太宽
- 游侠早报:《剑星:血雨》女主年龄 《龙之信条2》永久降价
- 《火焰纹章:万缕千丝》主角迪托利希人设情报公开!
- 搜索
-