首页 科技 正文

AI,感受被“分手厨房”支配的恐惧。

蜀味 只想说 凹非寺量子位 报导 | 微信公众号 QbitAI

朋友,你体会过被分手厨房,啊不,《煮糊了》(Overcooked)操纵的害怕吗?

实际上,不要说就是你,便是AI们遇上必须多的人相互配合,又得切土豆丝,又得上锅,又得送货,地貌还繁杂的状况,也一样会一下子溃不成军。

这并不,来源于诺丁汉大学、UC伯克利大学和微软公司研究所的科学研究工作人员,如今就明确提出:不会玩《煮糊了》的深层增强学习实体模型,并不是好合作AI。

她们还发觉,当今大部分深层RL实体模型,居然都没办法在《煮糊了》里取得65%之上的成绩。

因此,她们专业写了一篇毕业论文。

用简易版《煮糊了》开展标准检测

要想在现实世界中运用深层增强学习实体模型,完成AI与人们的合作,现阶段一个大的挑戰取决于,这类系统软件在碰到开发设计全过程中不曾见过的状况、未训炼过的个人行为时,可否维持鲁棒性。

而如何去评定实体模型的鲁棒性,也是困惑学术界的一个难题。

不清楚是否分手厨房产生的吵吵当场启迪了她们,科学研究工作人员觉得,《煮糊了》可以取得成功在系统软件可以解决的范畴内,检测出潜在性的边沿实例。

例如,在游戏里面,系统软件务必解决那样的情景:菜盘被一不小心落在了银行柜台上,搭挡由于思索或是临时离去滞留在原地不动……

因此,她们依据《煮糊了》的自然环境,设计方案了简易版的单元测试卷。

关键分成三类:

情况鲁棒性单元测试卷,这时候取得成功的规范不在于搭挡的情况。如圖(a)中,绿帽子厨师早已取得了一个菜盘,因此 不管绿帽子厨师下面做出如何的管理决策,准字号厨师都只需往左边拿一个圆葱便是了。

智能体鲁棒性单元测试卷,这时候搭挡的情况会危害結果,必须考量智能体的鲁棒性。如圖(b)中,安全通道仅有一条,绿帽子厨师要想去送汤,准字号厨师就得禁开。

智能体&记忆力鲁棒性单元测试卷。如圖(c)中,绿帽子厨师还没了,出自于离去情况,那麼准字号厨师应当自身取走菜盘送汤。这一情况必须融合历史数据来检验。

科学研究工作人员表明,这套根据《煮糊了》的检测模块,能出示没法根据简易考虑到认证奖赏得到的信息内容,因而将来能够做为一个评定人工智能技术合作工作能力的标准指标值。

传送器

毕业论文详细地址:https://arxiv.org/abs/2101.05507

编码详细地址:https://github.com/HumanCompatibleAI/human_ai_robustness

参照连接:https://venturebeat.com/2021/01/15/researchers-propose-using-the-game-overcooked-to-benchmark-collaborative-ai-systems/

非特殊说明,本文由原创资讯网原创或收集发布。

转载请注明本文地址:http://www.lcvip.net/kj/2141.html