点击上方 "程序员小乐"关注, 星标或置顶一起成长

每天凌晨00点00分, 第一时间与你相约

每日英文

Say to yourself: Regardless of what the obstacles in this life may be, I will run my race to the best of my ability.

对自己说:无论生活之路上会遇到多少障碍,我会竭尽所能地跑完这一程。

每日掏心话

许多感谢羞于表达,深埋心底,成为一生的遗憾。我们还年轻,凡事不要轻易言弃,否则遗憾的是你自己。

来自:公众号 机器之心 | 责编:乐乐

如何用python做一个简单的小游戏(还能训练AI模型丹麦小哥大学项目火了)(1)

程序员小乐(ID:study_tech)第 858 次推文 图源:百度

往日回顾: 漫画:谁杀死了MySQL?

正文

感觉用 Atari 游戏研究人工智能有点「不够接地气」?现在我们可以使用 Gameboy 模拟器了。

如何用python做一个简单的小游戏(还能训练AI模型丹麦小哥大学项目火了)(2)

如何用python做一个简单的小游戏(还能训练AI模型丹麦小哥大学项目火了)(3)

这款游戏机距离首次发布已过去了 30 年时间,不过人们对于它的热情却丝毫不减。昨天,一款利用 Python 编写的 Gameboy 模拟器在社交网络上吸引了人们的广泛关注。

如何用python做一个简单的小游戏(还能训练AI模型丹麦小哥大学项目火了)(4)

爷的青春回来了?作者在 Reddit 上发出的帖子迅速获得了上千点赞。该项目的作者之一 Mads Ynddal 宣布,PyBoy 的 1.0 版正式发布。PyBoy 是什么?

如何用python做一个简单的小游戏(还能训练AI模型丹麦小哥大学项目火了)(5)

简而言之,它是一个完全用 Python 从头开始编写的 Game Boy 模拟器,并且支持通过 API 编写脚本。研究者添加了类型定义,使其可以使用 Cython 编译软件,从而获得与用 C 和 C 编写的模拟器相媲美的性能。项目链接:github/Baekalfen/PyBoy特点PyBoy 被设计成通过 Python 访问,因此支持并鼓励人们做实验研究,机器人和人工智能在作此尝试。研究者正在构建游戏特定的包装器,目前,包装器可让程序员与俄罗斯方块和超级玛丽进行交互,而不需要对 Game Boy 有深入的了解。可以参考该文档:docs.pyboy.dk。项目作者还想学习和尝试更多奇特的功能,根据大学项目的研究,他们向模拟器添加了倒回功能,也就是说,您可以在任何游戏中倒回时间。PyBoy 模拟器架构1990 年,任天堂为 Game Boy 申请了专利。下图展示了该专利中 CPU、RAM、盒带和显示屏之间的集成与连接。

如何用python做一个简单的小游戏(还能训练AI模型丹麦小哥大学项目火了)(6)

Game Boy 专利中的架构图。PyBoy 项目成员基于此在 Python 中为每个组件制定类(class),从而在「主机系统」上为「客户系统」搭建了基础(系统运行 Python)。该客户系统就是虚拟的 Game Boy 硬件,理论上它能够运行为 Game Boy 编写的每一个软件部分。下图展示了 PyBoy 模拟器中所有类及其关系:

如何用python做一个简单的小游戏(还能训练AI模型丹麦小哥大学项目火了)(7)

PyBoy 对强化学习的意义以及与其他环境的比较这些年来,已有很多人开发过 Gameboy 模拟器,现在的电脑和手机上都有可运行的工具。为什么要用 Python 来写一款呢?当然是用来训练人工智能的。

如何用python做一个简单的小游戏(还能训练AI模型丹麦小哥大学项目火了)(8)

想打游戏?Gameboy 对于现在的人来说恐怕有点「难以上手」。最接近通用人工智能的方法——强化学习通用人工智能这一概念指的是机器能够成功完成任意一件人类能够做到的智力型任务。目前我们对 AI 的研究距离这一目标还差很远的距离,吴恩达之前就表示过,深度学习做的仅是高维的「curve fitting」。不同于那些依靠预先收集数据(甚至需要大量人工标记)的机器学习算法,强化学习是一种仅通过环境奖赏进行训练的算法,其工作机制类似于人体内部的多巴胺系统。强化学习是目前最接近于人类从经验中学习这一能力的机器学习算法,尤其适用于智能体需要根据其所处环境进行决策的情景。下图展示了 RL 智能体是如何仅以游戏图像作为输入,来学习马里奥控制策略的。

如何用python做一个简单的小游戏(还能训练AI模型丹麦小哥大学项目火了)(9)

为什么大量关于 RL 的研究都在 Atari 上进行,而不是其他更实际的问题?关于 RL 的研究使用 Atari 作为基准的原因主要有如下几点:

如何用python做一个简单的小游戏(还能训练AI模型丹麦小哥大学项目火了)(10)

Atari、PySC2 之类环境与 PyBoy 对比上一小节介绍了在 Atari 环境中训练 RL 智能体的诸多优势,然而随着 RL 的发展,这一相对较简单的环境逐渐不再适用于目前新的 RL 研究。不久之前,由 DeepMind 提出的 Agent57 在所有 Atari 环境中表现均超越了人类玩家平均水平,也预示着在 Atari 环境上的 RL 研究逐渐进入尾声。更困难环境有诸如 DeepMind 与暴雪合作的 PySC2,需要智能体学会复杂的协同、对抗策略。虽然 AlphaStar 在这一环境中取得了令人瞩目的成果,但仍存在很多亟待解决的问题。以下为 PySC2 环境示意图。

如何用python做一个简单的小游戏(还能训练AI模型丹麦小哥大学项目火了)(11)

PyBoy 环境的难度可以说介于 Atari 与 PySC2 之间,它为我们提供了一个验证 RL 性能的新基准。在将 RL 应用于更复杂的实际问题之前,我们可以先在这一难度适中的环境中进行低成本、高效的测试。就像特斯拉的人工智能和自动驾驶视觉总监 Andrej Karpathy 说的,「One should always try a BB gun before reaching for the Bazooka.」Github 介绍如何安装?如果已经配置了一个能够正常运行 Python 的环境,那么安装会非常简单:

如何用python做一个简单的小游戏(还能训练AI模型丹麦小哥大学项目火了)(12)

简短示例PyBoy 可以作为 Python 中的对象加载。所以它可以从另一个脚本进行初始化,并可以由该脚本控制和探测。看一下 gamewrapper_tetris.py 上一个粗糙的「机器人」,正在与游戏进行交互。当然,所有的外部组件都可以在 PyBoy 文档中找到。对于一般的 Game Boy 文档,可以查看 Pan Docs,其中包含了每个主题的详细信息。以下是从屏幕读取数据的简短演示,该代码也可以在 gamewrapper_mario.py 中找到:

如何用python做一个简单的小游戏(还能训练AI模型丹麦小哥大学项目火了)(13)

如何用python做一个简单的小游戏(还能训练AI模型丹麦小哥大学项目火了)(14)

作者简介该项目的作者 Asger Anders Lund Hansen、Mads Ynddal 和 Troels Ynddal 均来自丹麦。毕业于丹麦哥本哈根大学的 Mads Ynddal 表示,事实上这一 Gameboy 模拟器可以追溯到 2015 年他在大学期间的项目。

如何用python做一个简单的小游戏(还能训练AI模型丹麦小哥大学项目火了)(15)

Gameboy 模拟器的的 1.0 版发布了,但对于开发者们来说还有很多事可以去做。项目研发者表示,目前可以推进的方向包括为模拟器加入声音、彩色、Gameboy 模拟连线,以及更多游戏的封装,当然还有在其之上训练神经网络的示例。希望在人们的努力下,Gameboy 中的游戏也能重获新生。更重要的是,它现在还有了训练人工智能的任务。

如何用python做一个简单的小游戏(还能训练AI模型丹麦小哥大学项目火了)(16)

欢迎在留言区留下你的观点,一起讨论提高。如果今天的文章让你有新的启发,学习能力的提升上有新的认识,欢迎转发分享给更多人。

猜你还想看

阿里、腾讯、百度、华为、京东最新面试题汇集

Java 8 中 Map 骚操作之 merge() 的用法

为什么阿里巴巴禁止使用存储过程?

高并发之 API 接口,分布式,防刷限流,如何做?

关注订阅号「程序员小乐」,收看更多精彩内容嘿,你在看吗?

,