重新定义机器人技术:普渡大学的创新机器视觉解决方案

ROBOT@qwh 2023-10-12 阅读:262 评论:0
受人尊敬的普渡大学的研究人员在机器人、机器视觉和感知领域取得了重大飞跃。他们的突破性方法比传统技术有了显着的改进,有望在未来机器比以往任何时候都更有效、更安全地感知周围环境。介绍HADAR:机器感知的革命性飞跃Elmore电气和计算机工程副...

iamge.PNG

受人尊敬的普渡大学的研究人员在机器人、机器视觉和感知领域取得了重大飞跃。他们的突破性方法比传统技术有了显着的改进,有望在未来机器比以往任何时候都更有效、更安全地感知周围环境。

介绍HADAR:机器感知的革命性飞跃

Elmore电气和计算机工程副教授Zubin Jacob与研究科学家Fanglin Bao合作,介绍了一种名为HADAR的开创性方法,是热辅助检测和测距的缩写。他们的创新引起了极大的关注,这种认可扩大了人们对HADAR在各个领域的潜在应用的预期。

传统上,机器感知依赖于激光雷达、雷达和声纳等主动传感器,这些传感器发出信号以收集有关周围环境的三维数据。然而,这些方法带来了挑战,尤其是在扩大规模时。它们容易受到信号干扰,甚至可能对人类安全构成风险。摄像机在低光照条件下的局限性以及传统热成像中的“重影效应”进一步使机器感知复杂化。

HADAR寻求应对这些挑战。“物体及其环境不断发射和散射热辐射,导致无纹理的图像,众所周知的'重影效应',”鲍解释说。他继续说:“一个人脸部的热照片只显示轮廓和一些温度对比;没有任何功能,让您看起来像看到了鬼魂。这种信息、纹理和特征的损失是使用热辐射进行机器感知的障碍。

HADAR的解决方案结合了热物理、红外成像和机器学习,可实现完全被动和物理感知的机器感知。雅各布强调了HADAR带来的范式转变,他说:“我们的工作建立了热感知的信息理论基础,表明漆黑携带的信息量与光天化日之下相同。进化使人类偏向于白天。机器对未来的感知将克服这种长期存在的白天和黑夜之间的二分法。

实际影响和未来方向

HADAR在越野夜间场景中恢复纹理的能力强调了其有效性。“HADAR TeX视觉恢复了纹理并克服了重影效应,”鲍指出。它准确地描绘了水波纹和树皮皱纹等复杂的图案,展示了其卓越的感官能力。

然而,在将HADAR集成到自动驾驶汽车或机器人等实际应用中之前,还有一些挑战需要解决。鲍说:“电流传感器又大又重,因为HADAR算法需要多种颜色的不可见红外辐射。为了将其应用于自动驾驶汽车或机器人,我们需要降低尺寸和价格,同时使相机更快。其愿望是提高电流传感器的帧速率,该传感器目前每秒创建一次图像,以满足自动驾驶汽车的需求。

在应用方面,虽然HADAR TeX视觉目前是为自动驾驶汽车和机器人量身定制的,但其潜力要大得多。从农业和国防到医疗保健和野生动物监测,可能性是巨大的。

为了表彰他们的开创性工作,Jacob和Bao获得了DARPA的资助,并从技术商业化办公室的Trask创新基金获得了50,000美元的资助。两人已经向普渡大学创新技术商业化办公室披露了他们的创新,并采取了为他们的作品申请专利的第一步。

普渡大学的这项变革性研究将重新定义机器感知的边界,为机器人及其他领域更安全、更高效的未来铺平道路。


版权声明

本文仅代表作者观点,不代表本网站立场。
本文系作者授权本网站发表,未经许可,不得转载。

发表评论
热门文章
  • 使用众包反馈来帮助训练机器人

    使用众包反馈来帮助训练机器人
    为了教人工智能代理一项新任务,比如如何打开厨房柜子,研究人员经常使用强化学习——这是一种试错过程,在该过程中,代理会因采取更接近目标的行动而获得奖励。在许多情况下,人类专家必须仔细设计奖励函数,这是一种激励机制,赋予代理人探索的动力。当智能体探索并尝试不同的动作时,人类专家必须迭代地更新奖励函数。这可能非常耗时、效率低下,并且难以扩展,尤其是当任务复杂且涉及许多步骤时。来自麻省理工学院、哈佛大学和华盛顿大学的研究人员开发了一种新的强化学习方法,该方法不依赖于专门设计的奖励函数...
  • 康普顿未来智慧农场

    康普顿未来智慧农场
    康普顿未来农场,使用更少的水和1%的土地,即可实现与产统农业相同产量....
  • 拆解 OpenAI 的新董事会

    拆解 OpenAI 的新董事会
    在人工智能和技术领域掀起波澜的惊人事件中,人工智能领域的领先实体 OpenAI 最近的领导地位发生了重大转变。以萨姆·奥尔特曼 (Sam Altman) 戏剧性地重返首席执行官职位以及随之而来的董事会改组为标志,这些变化代表了该组织的关键时刻。OpenAI 以其在人工智能研究和开发方面的开创性工作而闻名,包括广泛认可的 ChatGPT 和 DALL-E 模型,站在人工智能进步的最前沿。因此,董事会的重组不仅仅是人员的变动,还标志着人工智能领域最具影响力的组织之一的方向、优先事...
  • 一种自动确定计算机游戏状态中可能动作的方法

    一种自动确定计算机游戏状态中可能动作的方法
    由于手动彻底测试视频游戏软件非常困难,因此需要拥有能够自动探索不同游戏功能的人工智能代理。此类代理的关键要求是玩家动作的模型,代理可以使用该模型来确定不同游戏状态下的可能动作集,以及对代理策略选择的游戏执行选定的动作。目前使用的典型游戏引擎不提供这样的动作模型,导致现有的工作要么需要人工手动定义动作模型,要么不精确地猜测可能的动作。在我们的工作中,我们通过为游戏中存在的用户输入处理逻辑开发最先进的分析方法来演示程序分析如何有效解决该问题,该分析可以使用离散动作空间自动建模游戏...
  • HierSpeech++:通过零样本语音合成新架构

    HierSpeech++:通过零样本语音合成新架构
    基于大语言模型(LLM)的语音合成已广泛应用于零样本语音合成中。然而,它们需要大规模数据,并且具有与以前的自回归语音模型相同的局限性,包括推理速度慢和缺乏鲁棒性。本文提出了 HierSpeech++,一种快速、强大的零样本语音合成器,用于文本到语音(TTS)和语音转换(VC)。我们验证了分层语音合成框架可以显着提高合成语音的鲁棒性和表现力。此外,即使在零样本语音合成场景中,我们也显着提高了合成语音的自然度和说话人相似度。对于文本到语音,我们采用文本到向量框架,该框架根据文本表...