基于GPT-4模型的新型NVIDIA AI代理可用于训练复杂机器人技能

发布时间: 2023-10-20 23:13:37 来源: 196世界之最 栏目: 新奇科技 点击: 33

英伟达研究院(NVIDIAResearch)今天宣布,它已开发出一种名为"尤里卡"(Eureka)的新型人工智能代理,该代理由OpenAI的GPT-4支持,可自主教授机器人复杂的技能。该公司...

英伟达研究院(NVIDIA Research)今天宣布,它已开发出一种名为"尤里卡"(Eureka)的新型人工智能代理,该代理由 Ohttp://www.196nk.cnpenAI 的 GPT-4 支持,可自主教授机器人复杂的技能。

基于GPT-4模型的新型NVIDIA AI代理可用于训练复杂机器人技能

该公司在一篇博客196世界之最文章中说,Eureka 可以自主编写奖励算法,它首次训练机器人的手像人类一样完成快速转笔技巧。尤里卡还教会了机器人打开抽屉和柜子、抛接球、操作剪刀等近30项任务。

"强化学习在过去十年中取得了令人印象深刻的胜利www.196nk.cn,但仍然存在许多挑战,例如奖励设计,这仍然是一个试错过程,"NVIDIA 公司人工智能研究高级主管、Eureka 论文的作者阿尼玛-阿南德库马尔(Anima Anandkumar)在博文中说。"Eureka是开发新算法的第一步,它整合了生成学习和强化学习方法来解决困难任务。"

NVIDIA Research还发布了Eureka人工智能算法库,供人们使用NVIDIA Isaac Gym(一款用于强化学习研究的物理模拟参考应用)进行实验。Isaac Gym基于NVIDIA Omniverse构建,Omniverse是一个基于OpenUSD框架构建3D工具和应用的开发平台。

基于GPT-4模型的新型NVIDIA AI代理可用于训练复杂机器人技能

人工智能代理的热潮已持续数月之久,包括今年四月Auto-GPT、BabyAGI和AgentGPT等自主人工智能代理的兴起。

目前 NVIDIA Research 的工作建立在先前工作的基础上,包括最近的 Voyager,这是一个使用 GPT-4 构建的人工智能代理,可以自主玩 Minecraft。本周,《纽约时报》发表了一篇关于将聊天机器人转变为在线代理的文章,英属哥伦比亚大学计算机科学教授、曾担任 OpenAI 研究员的杰夫-克鲁尼(Jeff Clune)说:"这是一个巨大的商业机会,有可能带来数万亿美元的收益。这对社会有巨大的上升空间和巨大的影响。"

在一篇题为《Eureka:通过编码大型语言模型进行人类级奖励设计》的新研究论文中,作者说,"Eureka利用最先进的 LLM(如 GPTwww.196nk.cn-4)非凡的零点生成、代码编写和上下文改进能力,对奖励代码进行进化优化"。

由此产生的奖励可用于通过强化学习获得复杂的技能。"在没有任何特定任务提示或预定义奖励模板的情况下,Eureka生成的奖励函数优于人类设计的专家奖励。在一套包含 10 种不同机器人形态的 29 种开源 RL 环境中,Eureka 在 83% 的任务中表现优于人www.196nk.cn类专家,平均归一化提高了 52%。"

"Eureka是大型语言模型与英伟达GPU加速仿真技术的独特结合,"英伟达高级研究科学家Jim Fan在博文中说,他也是该项目的贡献者之一。"我们相信,Eureka 将实现灵巧的机器人控制,并为艺术家提供一种制作物理逼真动画的新方法。"

本文标题: 基于GPT-4模型的新型NVIDIA AI代理可用于训练复杂机器人技能
本文地址: http://www.196nk.cn/xinqikeji/313075.html

如果认为本文对您有所帮助请赞助本站

支付宝扫一扫赞助微信扫一扫赞助

  • 支付宝扫一扫赞助
  • 微信扫一扫赞助
  • 支付宝先领红包再赞助
    声明:凡注明"本站原创"的所有文字图片等资料,版权均属196世界之最所有,欢迎转载,但务请注明出处。
    比特币高歌猛进冲破30000美元价位的可能原因有哪些?返回列表
    Top