DeepMind《星际争霸2》AI碾压人类遭Gary Marcus猛怼:通用智能就是空谈

640?wx_fmt=png

来源:新智元

本文 3635 ,建议阅读 10分钟
本文介绍了Marcus对AI碾压人类以及未来通用智能研究意义的质疑。

640?wx_fmt=jpeg

针对DeepMind前几日发布的《星际争霸2》智能体AlphaStar进化版,他在Twitter再次提出了自己的质疑。不过这次,Marcus的质疑点并不是AlphaStar游戏表现本身,而是指向了更高的层面:对未来通用智能研究的意义

640?wx_fmt=png

Marcus在Twitter上表示:

DeepMind最近的《星际争霸2》 AlphaStar取得了很不错的结果,但这能称得上通向通用智能的重要一步吗?这里有几个问题:

 

640?wx_fmt=png

星际争霸要比Atari游戏难得多,这次DeepMind推出的新版Alphastar性能比1月份那版强力了很多,与真实世界中的玩家实现了复杂场景交互中的对战。但是:

 

1、在不经修改的情况下,AlphaStar能制霸其他游戏吗?虽然AlphaStar的雏形继承了击败围棋世界冠军的AlphaZero,但此次发布的模型是高度结构化的,其中单位、表示和训练域等要素都是高度针对《星际争霸2》开发并调试的。

 

2、对AlphaStar专有模型的训练,能否降低和《星际争霸2》类似的策略游戏AI的训练时间?比如《魔兽争霸3》?人类玩家是可以进行这种跨游戏的“经验转移“的。

 

3、游戏内的AlphaStar对于不同地图、不同种族都能胜任吗?人类玩家至少会擅长多张地图和不止一个种族。

 

4、只凭借大量人类精英玩家生成的数据,AlphaStar的未来迭代版本还能保持成功吗?系统所需的大量“replay”数据在现实世界中可能很难获取。

 

5、人类专业知识对于AlphaStar有多重要?2017年,DeepMind推出了AlphaZero因为宣称“无需任何人类知识”而引发大量关注,此次AlphaStar的成功离不开在《星际争霸2》的人类知识和真人对战的演示视频。也许现在是时候承认人类知识的重要价值了。

 

6、在《星际争霸》领域表现优异的AlphaStar,能否同样在其他开放端领域同样出色?如自然语言理解,该领域的句子范围基本上是无限的。

 

和上一次对OpenAI魔方机器手的“开炮”相比,本次的6点问题在语气上和深度上都弱了不少。产生的影响似乎也没有上次那么广泛了。毕竟DeepMind这次发布的AlphaStar是一款游戏AI,对于泛化性能也不是重点,只是在博客中提了一嘴。

从Twitter的网友回复中,也可以看出这一点。大部分网友认为Marcus说的有一定道理,但其实DeepMind在博客中已经承认,不利用人类的先验知识,几乎是不可能成功的。

640?wx_fmt=png

还有网友表示,其实星际争霸这个游戏,精通多个种族可不是一件容易的事情,比如他自己,就只会玩人族,其它两个种族就是菜。

640?wx_fmt=png

还有网友提出了新的问题:AlphaStar对战斗单位的强度修正(加强和削弱)的变化能做出有效应对吗?如果一些单位完全被移除,又会出现什么情况?

640?wx_fmt=png

不过,这条Twitter目前为止热度一般,回复和讨论比前些日子Marcus质疑OpenAI"魔方机械手”时的热度差了不少。
到目前为止,DeepMind还没有做出回应。

DeepMind的《星际争霸2》游戏AI “AlphaStar”碾压99.8%人类玩家

接下来给大家补充一下剧情,马库斯这次质疑的DeepMind研究到底是什么。

今年1月,DeepMind的《星际争霸2》游戏AI “AlphaStar”初级版本的发布曾引发广泛关注。当时AlphaStar使用神族挑战了《星际争霸2》中的两个专业玩家并获得了胜利。

 

时隔9个多月,AlphaStar进化成为完全版,并实现了在战网真实对战中的宗师级水平,分位超过了99.8%的人类玩家。刊载相关成果的论文已发表在Nature上。

 

640?wx_fmt=png

论文地址:

https://www.nature.com/articles/s41586-019-1724-z


DeepMind在近日发布了博客中特意将新版AlphaStar与旧版做了对比。具体来说,此次的“完全体AlphaStar”与旧版有4点主要区别:

 

1、  AlphaStar现在和人类在相同的限制条件下游戏,包括通过摄像头观察世界,对其动作操作频率也作出了更严格的限制,不会再发生APM高到离谱的现象。

2、  AlphaStar现在可以使用游戏中三个种族(人族、虫族、神族)的任意一种与人类玩家进行1v1对战,而不是像1月份时那样只会用神族。使用每个种族的智能体都是一个单独的神经网络。

3、  智能体在战网中的训练是完全自动化的,开始只由监督学习训练,而不像原来那样凭借过去的游戏经验进行训练学习。

4、  此次AlphaStar在暴雪官方战网和游戏服务器上进行游戏,使用的是和人类玩家相同的地图和条件。

 

DeepMind表示,新版AlphaStar智能体采用通用机器学习技术,包括神经网络、通过强化学习的自对战、多智能体学习、模仿学习等技术。利用这些技术,新版AlphaStar的游戏水平超过了战网99.8%的活跃玩家,使用三个种族都拿到了宗师级称号。


马库斯:深度学习怀疑论者,曾质疑OpenAI“单手解魔方”

640?wx_fmt=jpeg

Gary Marcus


加里 · 马库斯 (Gary Marcus) 是一位科学家、畅销书作家和企业家。他是 Robust.AI 公司的创始人和首席执行官,Geometric Intelligence 公司 (2016 年被优步收购) 的创始人兼首席执行官,出版著作包括《代数思维》、《怪诞脑科学 (Kluge)》、《思维的诞生》等,最新著作是与 Ernest Davis 合著的《Rebooting AI : 构建我们可以信任的人工智能》。

马库斯也是著名的深度学习怀疑论者。作为认知心理学家,他一直高调参与人工智能辩论,与 Yann LeCun、AAAI 前主席 Thomas Dietterich 等 AI 大牛都展开过激烈辩论。

在那篇批判深度学习的文章中,马库斯概括了深度学习的十大挑战,直言深度学习本身虽然有用,但它不可能实现通用人工智能。他建议把深度学习视为 “一种非普遍的解决方法,而只是一种工具。”

他说:“相比纯粹的深度学习,我呼吁混合模型,不仅包括深度学习的监督形式,还包括其他技术,例如符号处理(symbol-manipulation),以及无监督学习(它本身也可能被重新概念化)。我也敦促社区考虑将更多的内在结构纳入 AI 系统。”

就在前不久,马库斯对OpenAI“单手解魔方”提出质疑,认为 OpenAI 还原魔方的博客内容存在误导性,并表示:“鉴于 OpenAI 仍然没有更改关于 “解决魔方” 的误导性博客帖子 (博客标题是 “Solving Rubik’s Cube with a Robot Hand),所以我附上了详细的分析,将他们的说法和暗示与实际所做的进行了比较。依我之见,这些误导性对大多数对非专业人士来说并不明显。”

640?wx_fmt=gif

马库斯对 OpenAI“解决魔方” 的 7 条质疑如下:

1、这不是神经网络解决的;而是有 17 年历史的符号算法做到的。

2、这种算法是先天的,而不是学习的。

3、强化学习在选择转向哪个方向 (即大多数人所说的解决了魔方) 时不起作用。

4、所学到的是物体操纵,而不是解魔方。

5、只有一个物体被操纵,并且没有测试对其他对象的可推广性。

6、该物体装配了大量仪器 (如蓝牙传感器),机器手也安装了 LED。

7、成功率只有 20%;魔方经常从机器人手中掉落。

他说:“我强调一下,这个成果本身给人留下了深刻的印象,但描述有误导,更恰当的标题应该是’用强化学习操纵魔方’或‘灵巧的机器人手操纵物体的进展” 或类似的句子。”

OpenAI 联合创始人、机器人团队负责人 Woj Zaremba 注意到马库斯的帖子,反驳道:

1. 你的前三个论点是一样的。

2. 泛化是从模拟到现实,而不是从一个物体到另一个物体。

3. 我们没有装配仪器得到的结果稍微弱一些。

4. 你确信我们不会将性能提升到 100% 吗?

马库斯回应道:

1. 我的前两个论点完全不同:先天性≠象征性。这些是不同的。第三个论点有一点重叠,但并不明显。

2. 我当然知道,但是为了稳健性,你需要推广到新物体上

3&4:我期待看到其他结果;我相信你们最终会做得更好。

尽管是马库斯率先提出质疑,但不少人的回复并不赞同马库斯的说法,有人回复道:

“这是一个有缺陷的批评,基于对魔方的误解。魔方不是像围棋那样是一种可以学习的任务,而是需要记忆解法和熟练操作的任务;人类玩魔方也遵循一种算法。”

马库斯仍表示:总的来说,他们 (OpenAI) 没有对我的观点做出回应,我的观点是那篇博客的框架与论文的内容不相符合,虽然我同意这个工作很重要,但炒作是有误导性的。

抱着质疑和批判的态度去看待每一项研究,你支持马库斯吗?

编辑:尹传儒

校对:黄利

640?wx_fmt=png

640?wx_fmt=png

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://xiahunao.cn/news/1621542.html

如若内容造成侵权/违法违规/事实不符,请联系瞎胡闹网进行投诉反馈,一经查实,立即删除!

相关文章

星际2数据编辑器

转自:https://blog.csdn.net/xoyojank/article/details/8122886 只列了技能的划分,其余的参考链接 对象类型 星际2就对象有很多类型, 这里只说一下比较常见的. 这些类型还有子类型, 对象的实例之间是可以进行数据拷贝和派生的. Units(单位) 大多数人应…

nodejs里面的event loop

1. event loop 1.1 什么是event-loop js的标准文档定义如下 https://developer.mozilla.org/en-US/docs/Web/JavaScript/EventLoop#event_loop https://javascript.info/event-loop html的标准定义 https://html.spec.whatwg.org/multipage/webappapis.html#event-loop-proc…

chatgpt赋能python:如何用Python编写炒股软件

如何用Python编写炒股软件 随着股票投资的普及和互联网技术的发展,越来越多的人开始尝试使用计算机辅助炒股,以获取更好的投资回报。Python作为一种简单易学、高效实用的编程语言,受到了众多股票投资者的青睐。本文将介绍如何用Python编写炒…

单例模式:保证一个类仅有一个实例

单例模式:保证一个类仅有一个实例 欢迎来到设计模式系列的第二篇文章!在上一篇中,我们已经对设计模式有了初步的了解,今天让我们深入研究第一个模式——单例模式。 什么是单例模式? 在软件开发中,我们经…

RabbitMQ从原理到实战—基于Golang【万字详解】

文章目录 前言一、MQ是什么?优势劣势 二、MQ的用途1、应用解耦2、异步加速3、削峰填谷4、消息分发 三、RabbitMQ是什么1、AMQP 协议2、RabbitMQ 包含的要素3、RabbitMQ 基础架构 四、实战1、Simple模式(即最简单的收发模式)2、Work Queues 模型3、Publish/Subscribe…

lnmp架构-mysql

1.MySQL数据库编译 make完之后是这样的 mysql 初始化 所有这种默认不在系统环境中的路径里 就这样加 这样就可以直接调用 不用输入路径调用 2.初始化 重置密码 3.mysql主从复制 配置master 配置slave 当master 端中还没有插入数据时 在server2 上配slave 此时master 还没进…

Tornado服务器连接数据库

环境 python3.6.1 vscode mysql navicat 安装需要的包 pip install torndb_for_python3 pip install pymysql0.8.0 #请安装pymysql的0.8.0版本,否则可能出现一个FLAG不存在的bug。亲测0.8.0可用。 tornadb不适用于python3,torndb_for_python3 是修改过的…

Tornado框架入门教程

Tornado框架入门教程 Tornado在知乎广为使用,当你用Chrome打开网页版本的知乎,使用开发者工具仔细观察Network里面的请求,就会发现有一个特别的状态码为101的请求,它是用浏览器的websocket技术和后端服务器建立了长连接用来接收服…

Tornado自定义路由

默认路由规则 代码 由下述代码可知,路由规则都在放在 tornado.web.Application 中,强迫症的我看着不舒服不说,而且如果有多级路由的话就很难搞了,比如说用户模块、不同视图模块等等,前一级路由是固定的,后…

Tornado重定向(三)

为什么需要重定向呢?比较常见的就是当网站内部结构变动,如栏目、网址等等的变动就需要进行301重定向,还有内部一些错误的页面也可以做301重定向,提高用户体验。当因网站内部结构变动,需要删除网站中的某些目录时&#…

Tornado介绍

文章目录 特点结构Tornado实现异步原理模块Tornado服务器的三个底层核心模块设计模型 Tornado龙卷风是一个开源的网络服务器框架,它是基于社交聚合网站FriendFeed的实时信息服务开发而来的 Tornado是使用Python编写的Web服务器兼Web应用框架与主流Web服务器框架不同…

Tornado初见(一)

在之前的其他博客中介绍了Django,这里介绍一下Tornado。两者的区别可以总结为: django大而全,适合小型的压力不大的项目,一旦压力上来其是扛不住的,毕竟一是太重,而是非异步。 但是好处就是什么都有&#…

Tornado框架学习

目录 底层原理 select epoll 运行机制 Tornado中的Ioloop模块的作用 获取请求方式 文件上传与展示 通过请求头信息的判断来进行反爬验证 注册功能demo 重定向 用户登录 以及自己设置的错误界面跳转 Cookie Tornado 异步服务器端方式 客户端异步请求 Tornado基于epoll…

tornado入门必备知识总结——异步事件循环与协程

文章目录 前言同步、异步、阻塞和非阻塞socket的非阻塞io请求htmlselect、poll和epoll协程异步http请求tornado实现高并发的爬虫 前言 要想走得远,基础就得牢,路漫漫其修远兮,吾将上下而求索。 tornado简介 python web编程三剑客Django&…

【Tornado】Tornado入门教程

目录 Tornado特点结构三个底层核心模块 安装1. 安装python32. 安装tornado3. 编写简单server4. 运行流程 核心组件1. ioloop实例2. app实例3. urls路由表4. handler类 异步协程async 和 await如何工作的怎样调用 协程模式结合 callbacks调用阻塞函数交叉存取技术循环在后台运行…

【数据结构与算法篇】手撕八大排序算法之交换排序

​👻内容专栏: 《数据结构与算法篇》 🐨本文概括:常见交换排序包括冒泡排序与快速排序,本篇讲述冒泡排序与快速排序的思想及实现、复杂度分析。 🐼本文作者: 花 蝶 🐸发布时间&#…

ie ajax十分卡,解决jquery .ajax 在IE下卡死问题的解决方法

解决jquery .ajax 在IE下卡死问题的解决方法 解决IE编码问题第一步: dataType:($.browser.msie) ? "text" : "xml" 先这样做让IE 识别返回的是text 还是xml 第二步: 复制代码 代码如下: function parseXml(xml) { //XML IE编码问题…

数学分析:场论

我们之前知道的是里斯表示定理。 这里看到,对于多重线性映射,里斯表示定理会从内积变成混合积。当然我们还是只考虑三维以内的情况。 于是我们可以把不同的1形式和2形式的下标写上,表示他们相当于内积或者混合积对应的那个向量。 然后还差0形…

设计师:设计师之家装材料知识之家装八项(吊顶材料、门窗材料、五金材料、墙面材料、地面材料、胶粘材料、油漆材料、水电材料等)之详细攻略

设计师:设计师之家装材料知识之家装八项(吊顶材料、门窗材料、五金材料、墙面材料、地面材料、胶粘材料、油漆材料、水电材料等)之详细攻略 目录 家装八项 吊顶材料 门窗材料 五金材料 墙面材料 地面材料 胶粘材料 油漆材料 水电材料 参考文章:…

材料封样信息流程指引

材料封样信息流程指引 一、材料封样流程 1、新项目中标后,由设计院根据合同、招标文件、技术要求填写材料送样清单(格式按公司标准化标格填写),并正式下发给采购部、工程管理部及项目部安排后续送样确认; 2、幕墙工程…