ROBOT - 人工智能机器人技术网

使用众包反馈来帮助训练机器人

为了教人工智能代理一项新任务，比如如何打开厨房柜子，研究人员经常使用强化学习——这是一种试错过程，在该过程中，代理会因采取更接近目标的行动而获得奖励。在许多情况下，人类专家必须仔细设计奖励函数，这是一种激励机制，赋予代理人探索的动力。当智能体探索并尝试不同的动作时，人类专家必须迭代地更新奖励函数。这可能非常耗时、效率低下，并且难以扩展，尤其是当任务复杂且涉及许多步骤时。来自麻省理工学院、哈佛大学和华盛顿大学的研究人员开发了一种新的强化学习方法，该方法不依赖于专门设计的奖励函数...
作者：ROBOT@qwh 日期：2023.11.29 分类：机器人 1818
OpenAI考虑加入AI芯片制造联盟

OpenAI是著名的ChatGPT背后的强大力量，可能很快就会深入研究人工智能芯片制造的动态世界。根据路透社的一份新报道，该公司正在积极考虑创建其独特的AI芯片，甚至正在考虑收购该领域的潜在目标。全球对AI芯片的需求正在飙升，尤其是在OpenAI的ChatGPT去年冲击市场之后。这种被称为AI加速器的专用芯片在培训和实施尖端的生成AI技术方面发挥着关键作用。目前，市场认为英伟达处于顶峰，在大多数AI芯片生产中占据主导地位。OpenAI对这些昂贵的芯片的依赖也是有限的，这使该公...
作者：ROBOT@qwh 日期：2023.10.12 分类：人工智能 380
新型的可重构机器人Tail STAR

Tail STAR是一种新型的可延展式机器人，具有双关节的尾巴，能够克服各种障碍。它可以用于搜索和救援应用。它可以穿过缝隙，爬过楼梯和人行道。它可以爬过比车轮半径大6倍的障碍物。视频：论文：https://ieeexplore.ieee.org/document/10050748...
作者：ROBOT@qwh 日期：2023.10.07 分类：机器人 551

使用众包反馈来帮助训练机器人

OpenAI考虑加入AI芯片制造联盟

新型的可重构机器人Tail STAR

随机文章

热门文章

康普顿未来智慧农场

拆解 OpenAI 的新董事会

一种自动确定计算机游戏状态中可能动作的方法

使用众包反馈来帮助训练机器人

HierSpeech++：通过零样本语音合成新架构

最近发表

标签列表