NVIDIA 宣布推出适用于人形机器人的 GR00T 项目基础模型

airobotnews 2024-03-22 阅读:488 评论:0
Isaac 机器人平台现为开发人员提供新的机器人训练模拟器、Jetson Thor 机器人计算机、生成式 AI 基础模型以及 CUDA 加速感知和操作库NVIDIA 今天宣布推出 GR00T 项目,这是一个用于人形机器人的通用基础模型,旨在...

Isaac 机器人平台现为开发人员提供新的机器人训练模拟器、Jetson Thor 机器人计算机、生成式 AI 基础模型以及 CUDA 加速感知和操作库

project-gr00t-humanoid.jpg

NVIDIA 今天宣布推出 GR00T 项目,这是一个用于人形机器人的通用基础模型,旨在进一步推动机器人技术和具体人工智能领域的突破。

作为该计划的一部分,该公司还推出了一款用于基于 NVIDIA Thor 片上系统 (SoC) 的人形机器人的新型计算机 Jetson Thor,以及对 NVIDIA Isaac™ 机器人平台的重大升级,包括用于模拟和人工智能工作流程基础设施的生成式人工智能基础模型和工具。

NVIDIA 创始人兼首席执行官黄仁勋表示:“为通用人形机器人构建基础模型是当今人工智能领域最令人兴奋的问题之一。” “这些使能技术正在汇聚在一起,让世界各地领先的机器人专家在人工通用机器人领域取得巨大飞跃。”

GR00T代表通用机器人00技术,由GR00T驱动的机器人将被设计为通过观察人类行为来理解自然语言和模仿动作——快速学习协调性、灵活性和其他技能,以便导航、适应现实世界并与现实世界互动。在他的GTC 主题演讲中,黄展示了几个这样的机器人来完成各种任务。

专为人形机器人
打造 Jetson Thor 是一个新的计算平台,能够执行复杂的任务并与人和机器安全、自然地交互。它具有针对性能、功耗和尺寸进行优化的模块化架构。

该 SoC 包括基于NVIDIA Blackwell 架构的下一代 GPU,其变压器引擎可提供 800 teraflops 的 8 位浮点 AI 性能,以运行 GR00T 等多模式生成 AI 模型。凭借集成的功能安全处理器、高性能 CPU 集群和 100GB 以太网带宽,它显着简化了设计和集成工作。

NVIDIA 正在为 1X Technologies、Agility Robotics、Apptronik、Boston Dynamics、Figure AI、Fourier Intelligence、Sanctuary AI、Unitree Robotics 和 XPENG Robotics 等领先的人形机器人公司构建全面的 AI 平台。

“我们正处于历史的转折点,像 Digit 这样以人为中心的机器人将永远改变劳动力。现代人工智能将加速发展,为像 Digit 这样的机器人在日常生活的各个方面为人们提供帮助铺平道路。”Agility Robotics 联合创始人兼首席机器人官 Jonathan Hurst 说道。 “我们很高兴与 NVIDIA 合作,投资计算、模拟工具、机器学习环境和其他必要的基础设施,以实现机器人成为日常生活一部分的梦想。”

Sanctuary AI 联合创始人兼首席执行官 Geordie Rose 表示:“嵌入式人工智能不仅有助于解决人类面临的一些最大挑战,还将创造目前超出我们能力或想象的创新。” “如此重要的技术不应孤立构建,这就是我们优先考虑 NVIDIA 等长期合作伙伴的原因。”

Isaac 平台的重大更新
GR00T 使用的 Isaac 工具能够为任何环境中的任何机器人实例创建新的基础模型。这些工具包括用于强化学习的Isaac Lab和计算编排服务OSMO 。

具体的人工智能模型需要大量的真实和合成数据。新的 Isaac Lab 是一款基于 Isaac Sim 构建的 GPU 加速、轻量级、性能优化的应用程序,专门用于运行数千个机器人学习并行模拟。

为了跨异构计算扩展机器人开发工作负载,OSMO 协调分布式环境中的数据生成、模型训练和软件/硬件在环工作流程。

NVIDIA 还发布了 Isaac Manipulator 和 Isaac Perceptor——一系列机器人预训练模型、库和参考硬件。

Isaac Manipulator为机械臂提供最先进的灵活性和模块化 AI 功能,并拥有强大的基础模型和 GPU 加速库集合。它在路径规划方面提供高达 80 倍的加速,零样本感知提高了效率和吞吐量,使开发人员能够自动执行更多新的机器人任务。早期的生态系统合作伙伴包括安川、优傲机器人、泰瑞达旗下公司、PickNik Robotics、Solomon、READY Robotics 和 Franka Robotics。

Isaac Perceptor提供多摄像头、3D 环绕视觉功能,这些功能越来越多地用于制造和履行操作中采用的自主移动机器人,以提高效率和工人安全,并降低错误率和成本。早期采用者包括 ArcBest、比亚迪和凯傲集团,因为他们的目标是在物料搬运操作等方面实现新的自主水平。

新的 Isaac 平台功能预计将在下个季度推出。


版权声明

本文仅代表作者观点,不代表本网站立场。
本文系作者授权本网站发表,未经许可,不得转载。

发表评论
热门文章
  • 使用众包反馈来帮助训练机器人

    使用众包反馈来帮助训练机器人
    为了教人工智能代理一项新任务,比如如何打开厨房柜子,研究人员经常使用强化学习——这是一种试错过程,在该过程中,代理会因采取更接近目标的行动而获得奖励。在许多情况下,人类专家必须仔细设计奖励函数,这是一种激励机制,赋予代理人探索的动力。当智能体探索并尝试不同的动作时,人类专家必须迭代地更新奖励函数。这可能非常耗时、效率低下,并且难以扩展,尤其是当任务复杂且涉及许多步骤时。来自麻省理工学院、哈佛大学和华盛顿大学的研究人员开发了一种新的强化学习方法,该方法不依赖于专门设计的奖励函数...
  • 康普顿未来智慧农场

    康普顿未来智慧农场
    康普顿未来农场,使用更少的水和1%的土地,即可实现与产统农业相同产量....
  • 拆解 OpenAI 的新董事会

    拆解 OpenAI 的新董事会
    在人工智能和技术领域掀起波澜的惊人事件中,人工智能领域的领先实体 OpenAI 最近的领导地位发生了重大转变。以萨姆·奥尔特曼 (Sam Altman) 戏剧性地重返首席执行官职位以及随之而来的董事会改组为标志,这些变化代表了该组织的关键时刻。OpenAI 以其在人工智能研究和开发方面的开创性工作而闻名,包括广泛认可的 ChatGPT 和 DALL-E 模型,站在人工智能进步的最前沿。因此,董事会的重组不仅仅是人员的变动,还标志着人工智能领域最具影响力的组织之一的方向、优先事...
  • 一种自动确定计算机游戏状态中可能动作的方法

    一种自动确定计算机游戏状态中可能动作的方法
    由于手动彻底测试视频游戏软件非常困难,因此需要拥有能够自动探索不同游戏功能的人工智能代理。此类代理的关键要求是玩家动作的模型,代理可以使用该模型来确定不同游戏状态下的可能动作集,以及对代理策略选择的游戏执行选定的动作。目前使用的典型游戏引擎不提供这样的动作模型,导致现有的工作要么需要人工手动定义动作模型,要么不精确地猜测可能的动作。在我们的工作中,我们通过为游戏中存在的用户输入处理逻辑开发最先进的分析方法来演示程序分析如何有效解决该问题,该分析可以使用离散动作空间自动建模游戏...
  • 在音频中将你的描述和内容分开模型AudioSep

    在音频中将你的描述和内容分开模型AudioSep
    语言查询音频源分离(LASS)是计算听觉场景分析(CASA)的新范例。LASS 旨在根据自然语言查询从音频混合物中分离出目标声音,这为数字音频应用程序提供了自然且可扩展的接口。最近的 LASS 工作尽管在特定源(例如乐器、有限类别的音频事件)上取得了有希望的分离性能,但无法在开放域中分离音频概念。在这项工作中,我们介绍了 AudioSep,这是一种使用自然语言查询进行开放域音频源分离的基础模型。我们在大规模多模态数据集上训练 AudioSep,并广泛评估其在音频事件分离、乐器...