人工智能 - 人工智能机器人技术网

图像风格提取InstantStyle

从文本生成与样例图像风格一致的图像。Llama3免费使用：https://huggingface.co/spaces/radames/InstantStyle-SDXL-Lightning...
作者：ROBOT@qwh 日期：2024.05.15 分类：人工智能 438
微软静态图片视频生成框架VASA

微软公司最近推出了一种基于单一静态图像和语音音频剪辑的具有视觉情感技能(VAS)的虚拟人物逼真说话脸生成框架VASA。模型VASA-1不仅能够产生与音频同步的嘴唇动作，而且还能够捕捉到大量的面部细微差别和自然的头部动作，从而有助于感知真实性和活力。核心创新包括在面部潜在空间中工作的整体面部动力学和头部运动生成模型，以及利用视频开发这种具有表现力和解纠缠性的面部潜在空间。通过广泛的实验，包括对一组新指标的评估，我们表明我们的方法在各个方面都明显优于以前的方法。我们的方法不仅提供...
作者：ROBOT@qwh 日期：2024.04.18 分类：人工智能 1012
一种自动确定计算机游戏状态中可能动作的方法

由于手动彻底测试视频游戏软件非常困难，因此需要拥有能够自动探索不同游戏功能的人工智能代理。此类代理的关键要求是玩家动作的模型，代理可以使用该模型来确定不同游戏状态下的可能动作集，以及对代理策略选择的游戏执行选定的动作。目前使用的典型游戏引擎不提供这样的动作模型，导致现有的工作要么需要人工手动定义动作模型，要么不精确地猜测可能的动作。在我们的工作中，我们通过为游戏中存在的用户输入处理逻辑开发最先进的分析方法来演示程序分析如何有效解决该问题，该分析可以使用离散动作空间自动建模游戏...
作者：ROBOT@qwh 日期：2023.12.07 分类：人工智能 1958
康普顿未来智慧农场

康普顿未来农场，使用更少的水和1%的土地，即可实现与产统农业相同产量....
作者：airobotnews 日期：2023.11.28 分类：机器人 2227
拆解 OpenAI 的新董事会

在人工智能和技术领域掀起波澜的惊人事件中，人工智能领域的领先实体 OpenAI 最近的领导地位发生了重大转变。以萨姆·奥尔特曼 (Sam Altman) 戏剧性地重返首席执行官职位以及随之而来的董事会改组为标志，这些变化代表了该组织的关键时刻。OpenAI 以其在人工智能研究和开发方面的开创性工作而闻名，包括广泛认可的 ChatGPT 和 DALL-E 模型，站在人工智能进步的最前沿。因此，董事会的重组不仅仅是人员的变动，还标志着人工智能领域最具影响力的组织之一的方向、优先事...
作者：airobotnews 日期：2023.11.23 分类：人工智能 1964
CIFAR-10--人工智能数据集

由 Krizhevsky 等人提出。从微小图像中学习多层特征CIFAR -10数据集（加拿大高级研究所，10 个类别）是 Tiny Images 数据集的子集，由 60000 张 32x32 彩色图像组成。这些图像标有 10 个相互排斥的类别之一：飞机、汽车（但不是卡车或皮卡车）、鸟、猫、鹿、狗、青蛙、马、船和卡车（但不是皮卡车）。每类有 6000 张图像，每类有 5000 张训练图像和 1000 张测试图像。判断图像是否属于某个类的标准如下：类名应该位于“这张图片...
作者：ROBOT@qwh 日期：2023.11.13 分类：人工智能 455
什么是小样本学习？

小样本学习是指使用极少量的训练数据来开发人工智能模型的各种算法和技术。少样本学习致力于让人工智能模型在接触相对较少的训练实例后识别和分类新数据。少样本训练与训练机器学习模型的传统方法形成鲜明对比，传统方法通常使用大量训练数据。小样本学习主要用于计算机视觉。为了对小样本学习有更好的直觉，让我们更详细地研究这个概念。我们将研究少样本学习背后的动机和概念，探索一些不同类型的少样本学习，并涵盖高层少样本学习中使用的一些模型。最后，我们将研究一些小样本学习的应用程序。什么是小样本学习？...
作者：ROBOT@qwh 日期：2023.11.07 分类：人工智能 630
DevOps 中的 AI：简化软件部署和运营

就像一台运转良好的机器一样，您的组织正处于重大软件部署的边缘。您已经在尖端人工智能解决方案上投入了大量资金，您的数字化转型战略已经制定，并且您的目光坚定地瞄准了未来。然而，问题迫在眉睫——您能否真正利用人工智能的力量来简化软件部署和运营？到 2027 年，全球数字化转型市场规模将达到惊人的15,489 亿美元，复合年增长率为 21.1%，您不能只是原地踏步。随着新兴的DevOps 趋势重新定义软件开发，公司利用先进的功能来加速人工智能的采用。这就是为什么，您需要拥...
作者：ROBOT@qwh 日期：2023.11.01 分类：人工智能 468
Zero123++：从单张图像推理出多个视图模型

Zero123++，这是一种图像条件扩散模型，用于从单个输入视图生成 3D 一致的多视图图像。为了充分利用预训练的 2D 生成先验，我们开发了各种条件和训练方案，以最大限度地减少现成图像扩散模型（例如稳定扩散）的微调工作。Zero123++ 擅长从单个图像生成高质量、一致的多视图图像，克服纹理退化和几何错位等常见问题。此外，我们展示了在 Zero123++ 上训练 ControlNet 以增强对生成过程的控制的可行性。 ...
作者：ROBOT@qwh 日期：2023.10.25 分类：人工智能 687
现代机器人I - 手臂式机械手(教程)

Modern Robotics I - Arm Type ManipulatorsYou can watch a video of the introduction to the Modern Robotics I course at the link below:Introduction to the Course VideoDownload the full syllabus of the course including grading criteria at the...
作者：ROBOT@qwh 日期：2023.10.24 分类：学习教程 534