• Zero123++:从单张图像推理出多个视图模型

    Zero123++:从单张图像推理出多个视图模型

        Zero123++,这是一种图像条件扩散模型,用于从单个输入视图生成 3D 一致的多视图图像。为了充分利用预训练的 2D 生成先验,我们开发了各种条件和训练方案,以最大限度地减少现成图像扩散模型(例如稳定扩散)的微调工作。Zero123++ 擅长从单个图像生成高质量、一致的多视图图像,克服纹理退化和几何错位等常见问题。此外,我们展示了在 Zero123++ 上训练 ControlNet 以增强对生成过程的控制的可行性。 ...

    作者:ROBOT@qwh    日期:2023.10.25    分类:人工智能 135
  • 现代机器人I - 手臂式机械手(教程)

    现代机器人I - 手臂式机械手(教程)

    Modern Robotics I - Arm Type ManipulatorsYou can watch a video of the introduction to the Modern Robotics I course at the link below:Introduction to the Course VideoDownload the full syllabus of the course including grading criteria at the...

    作者:ROBOT@qwh    日期:2023.10.24    分类:学习教程 147
  • 机器人烹饪方法YORI

    机器人烹饪方法YORI

    由加州大学洛杉矶分校的机器人与机械实验室一直在研究,既利用机器人友好的自动化,又利用人类技能,使事物味道正确,的烹饪机器人解决方案。   论文链接:https://spectrum.ieee.org/romela-cooking-robot...

    作者:ROBOT@qwh    日期:2023.10.17    分类:机器人 158
  • 在音频中将你的描述和内容分开模型AudioSep

    在音频中将你的描述和内容分开模型AudioSep

    语言查询音频源分离(LASS)是计算听觉场景分析(CASA)的新范例。LASS 旨在根据自然语言查询从音频混合物中分离出目标声音,这为数字音频应用程序提供了自然且可扩展的接口。最近的 LASS 工作尽管在特定源(例如乐器、有限类别的音频事件)上取得了有希望的分离性能,但无法在开放域中分离音频概念。在这项工作中,我们介绍了 AudioSep,这是一种使用自然语言查询进行开放域音频源分离的基础模型。我们在大规模多模态数据集上训练 AudioSep,并广泛评估其在音频事件分离、乐器...

    作者:ROBOT@qwh    日期:2023.10.16    分类:项目 165
  • OpenAI考虑加入AI芯片制造联盟

    OpenAI考虑加入AI芯片制造联盟

    OpenAI是著名的ChatGPT背后的强大力量,可能很快就会深入研究人工智能芯片制造的动态世界。根据路透社的一份新报道,该公司正在积极考虑创建其独特的AI芯片,甚至正在考虑收购该领域的潜在目标。全球对AI芯片的需求正在飙升,尤其是在OpenAI的ChatGPT去年冲击市场之后。这种被称为AI加速器的专用芯片在培训和实施尖端的生成AI技术方面发挥着关键作用。目前,市场认为英伟达处于顶峰,在大多数AI芯片生产中占据主导地位。OpenAI对这些昂贵的芯片的依赖也是有限的,这使该公...

    作者:ROBOT@qwh    日期:2023.10.12    分类:人工智能 97
  • 重新定义机器人技术:普渡大学的创新机器视觉解决方案

    重新定义机器人技术:普渡大学的创新机器视觉解决方案

    受人尊敬的普渡大学的研究人员在机器人、机器视觉和感知领域取得了重大飞跃。他们的突破性方法比传统技术有了显着的改进,有望在未来机器比以往任何时候都更有效、更安全地感知周围环境。介绍HADAR:机器感知的革命性飞跃Elmore电气和计算机工程副教授Zubin Jacob与研究科学家Fanglin Bao合作,介绍了一种名为HADAR的开创性方法,是热辅助检测和测距的缩写。他们的创新引起了极大的关注,这种认可扩大了人们对HADAR在各个领域的潜在应用的预期。传统上,机器感知依赖于激...

    作者:ROBOT@qwh    日期:2023.10.12    分类:机器人 110
  • 与大型语言模型和机器人相关的资源、文章和观点列表

    与大型语言模型和机器人相关的资源、文章和观点列表

    我们收集了一些与大型语言模型(LLM)相关的文章,观点,视频和资源。其中一些链接还涵盖了其他生成模型。我们将定期更新此列表,以添加任何其他感兴趣的资源。本文是该系列的第三篇。(以前的版本在这里:v1 |v2.)什么是法学硕士以及它们是如何工作的什么是生成AI模型?,Kate Soule,来自IBM Technology的视频。大型语言模型简介,John Ewald,来自Google Cloud Tech的视频。什么是 GPT-4,它与 ChatGPT 有何不同?,A...

    作者:ROBOT@qwh    日期:2023.10.10    分类:人工智能 166
  • 手指形传感器使机器人更加灵巧

    手指形传感器使机器人更加灵巧

    麻省理工学院的研究人员开发了一种基于摄像头的触摸传感器,它又长又弯曲,形状像人类的手指。他们的设备在大面积上提供高分辨率的触觉感应,可以使机器人手执行多种类型的抓取。图片:由研究人员提供作者:亚当·泽维 |麻省理工学院新闻想象一下,用一只手抓住一个重物,比如管扳手。您可能会用整个手指抓住扳手,而不仅仅是指尖。皮肤中的感觉受体沿着每个手指的整个长度运行,会向你的大脑发送有关你正在掌握的工具的信息。在机器人手中,使用摄像头获取有关抓取物体信息的触觉传感器又小又扁,因此它们通常位于...

    作者:ROBOT@qwh    日期:2023.10.10    分类:机器人 132
  • 机器人技术的新曙光:基于触摸的物体旋转

    机器人技术的新曙光:基于触摸的物体旋转

    在一项突破性的开发中,加州大学圣地亚哥分校 (UCSD) 的工程师团队设计了一款机械手,可以仅通过触摸来旋转物体,而无需视觉输入。这种创新方法的灵感来自于人类无需看到物体即可轻松处理物体的方式。对象操纵的触摸敏感方法该团队为四指机械手配备了 16 个触摸传感器,分布在其手掌和手指上。每个传感器的成本约为 12 美元,执行一个简单的功能:检测物体是否正在接触它。这种方法是独一无二的,因为它依赖于大量低成本、低分辨率的触摸传感器,这些传感器使用简单的二进制信号(触摸或不触摸)来执...

    作者:ROBOT@qwh    日期:2023.10.09    分类:机器人 121
  • “无脑”软机器人在复杂环境中导航机器人技术突破

    “无脑”软机器人在复杂环境中导航机器人技术突破

    在不断发展的机器人领域,研究人员实现了一项新的突破:一种不需要人类或计算机指导即可在复杂环境中导航的软机器人。这项新发明建立在之前的工作基础上,其中软机器人在更简单的迷宫中展示了基本的导航技能。利用物理智能进行导航该研究的共同通讯作者、北卡罗来纳州立大学机械与航空航天工程副教授尹杰阐述了这一进展:“在我们早期的工作中,我们证明了我们的软机器人能够扭转和转弯通过一个非常简单的障碍路线。然而,除非遇到障碍物,否则它无法转弯。这种限制意味着机器人有时可能会被困在平行障碍物之间来回弹...

    作者:ROBOT@qwh    日期:2023.10.09    分类:机器人 93
热门文章
  • 与大型语言模型和机器人相关的资源、文章和观点列表

    与大型语言模型和机器人相关的资源、文章和观点列表
    我们收集了一些与大型语言模型(LLM)相关的文章,观点,视频和资源。其中一些链接还涵盖了其他生成模型。我们将定期更新此列表,以添加任何其他感兴趣的资源。本文是该系列的第三篇。(以前的版本在这里:v1 |v2.)什么是法学硕士以及它们是如何工作的什么是生成AI模型?,Kate Soule,来自IBM Technology的视频。大型语言模型简介,John Ewald,来自Google Cloud Tech的视频。什么是 GPT-4,它与 ChatGPT 有何不同?,A...
  • 在音频中将你的描述和内容分开模型AudioSep

    在音频中将你的描述和内容分开模型AudioSep
    语言查询音频源分离(LASS)是计算听觉场景分析(CASA)的新范例。LASS 旨在根据自然语言查询从音频混合物中分离出目标声音,这为数字音频应用程序提供了自然且可扩展的接口。最近的 LASS 工作尽管在特定源(例如乐器、有限类别的音频事件)上取得了有希望的分离性能,但无法在开放域中分离音频概念。在这项工作中,我们介绍了 AudioSep,这是一种使用自然语言查询进行开放域音频源分离的基础模型。我们在大规模多模态数据集上训练 AudioSep,并广泛评估其在音频事件分离、乐器...
  • 机器人烹饪方法YORI

    机器人烹饪方法YORI
    由加州大学洛杉矶分校的机器人与机械实验室一直在研究,既利用机器人友好的自动化,又利用人类技能,使事物味道正确,的烹饪机器人解决方案。   论文链接:https://spectrum.ieee.org/romela-cooking-robot...
  • 什么是边缘人工智能和边缘计算?

    什么是边缘人工智能和边缘计算?
    边缘人工智能是人工智能最引人注目的新领域之一,它的目标是让人们运行人工智能流程,而不必担心隐私或因数据传输而导致的速度减慢。边缘人工智能正在使人工智能得到更广泛、更广泛的使用,让智能设备无需访问云即可快速对输入做出反应。虽然这是 Edge AI 的快速定义,但让我们花点时间通过探索使其成为可能的技术并查看 Edge AI 的一些用例来更好地了解 Edge AI。什么是边缘计算?为了真正理解Edge AI,我们首先需要了解边缘计算,而理解边缘计算的最好方式就是将其与云计算进行对...
  • 新型的可重构机器人Tail STAR

    新型的可重构机器人Tail STAR
    Tail STAR是一种新型的可延展式机器人,具有双关节的尾巴,能够克服各种障碍。它可以用于搜索和救援应用。它可以穿过缝隙,爬过楼梯和人行道。它可以爬过比车轮半径大6倍的障碍物。视频: 论文:https://ieeexplore.ieee.org/document/10050748...