今天,谷歌推出首款小程序“猜画小歌”,迅速走红朋友圈。玩家中除了资深“你画我猜”爱好者,还有AI爱好者和围观“稀有生物”的吃瓜群众。毕竟隔着一层纱多少让谷歌平添了神秘感,再加上“人工智能”“首款”的噱头,这个小程序的火爆并不令人意外。

谷歌ai绘画代码(谷歌版你画我猜)(1)

小程序发布后,不少网友在社交平台抱怨“猜画小歌”的命题太广了,芦笋、萨克斯、黑莓……这些题让灵魂画手们无处下笔。但大多数网友还是对AI表现出了一致好评,毕竟画个不规则方形就能猜出是水桶,这样的AI还真是懂我们的心。

除此之外,一些人也对AI的真实性和目的提出了质疑,可以理解,毕竟质疑是了解新事物的第一步嘛,下面我们就来看看“猜画小歌”背后的秘密。

AI为什么这么聪明?

确切来说,“猜画小歌”在国外已经火了一年多了,它的前身是AI涂鸦页游“快画”(Quick, Draw!)。

根据去年谷歌发布的数据,自2016年上线以来,玩家已经为“快画”绘制了超过10亿幅简笔画,其中包括290万只猫、290万个热狗、290万朵雪花和比夜空中可见的星星加起来还多的星形图案……

而根据小程序下的文字介绍,“猜画小歌”使用的数据集包含5000万张手绘素描,鉴于它的任务和“快画”一样是分类,这个庞大数据集足以支撑它的性能。简而言之,玩家的画在AI看来就是把苹果归类为苹果的过程,命题标签就是AI的检索字典。

至于它为什么能识别灵魂画手们“扭曲”的草图,这里隐藏着一个“伤人”的事实。一般情况下,每个人都认为自己是独一无二的,但当一百个、一千个、一万个人聚在一起,他的独特性就没这么明显了。

比如画人脸:

谷歌ai绘画代码(谷歌版你画我猜)(2)

如果是一一对比,这三幅画很不同,圆脸的、长脸的,大眼睛、小眼睛。除了画上眉毛,一些人也喜欢画头发、画耳朵,总之,只要不是刻意,没有两个人能画出一模一样的画。

那么,把它们放进一千多张图里呢?

谷歌ai绘画代码(谷歌版你画我猜)(3)

朋友们,请眯起眼纵览全局,除了个别几幅图,所有脸都表现出了同样的特征:一个圆,两个点,一段弧线。而且这条弧线有大概率是两端向上的,也就是一张笑脸。虽然AI捕捉的未必是这些特征,但这是不是解释了它为什么能看懂你的画——因为大部分人对事物外形的认知是很相近的

至于这个圆为什么是蓝莓而不是篮球,下图也许能帮你答疑:

谷歌ai绘画代码(谷歌版你画我猜)(4)

这是“快画”的分类机制。玩家画了一个灯泡,但这个灯泡既像灯,又像海龟,还像太阳。对于这样有类似特征的图像,AI就要根据从数据中学到的经验预测它属于某一类的概率,如果灯泡概率更高,那就猜灯,反之亦然。

数据越多,AI学到的经验就越靠谱。所以如果你觉得自己明明画虎类犬,但它还是说对了,那可能意味着把老虎化成狗的同志不在少数,让AI觉得老虎也能一幅狗样。

玩家在给谷歌贡献数据?

虽然在这个问题下聊隐私比较奇怪,但考虑到大家比较关注,还是提一下为好。谷歌是不是在用“猜画小歌”收集数据?不出意外的话,是,但这无伤大雅

作为官方制作的页游,“快画”的定位比较明确——一个模型训练平台,AI模型利用神经网络对玩家的涂鸦进行评估,并以此作为训练数据不断自我学习,以提高对图像和光学字符的辨识能力。“猜画小歌”只是个小程序,应该还没上升到自我训练的地步,所以我们可以直接把它看作娱乐工具。

之前提到了,“快画”上线一年已经贡献了超过10亿幅简笔画,所以为什么要吝惜自己的这两三幅画呢?这些数据的作用是辅助艺术家进行创意工作、教授学生绘画基本技巧。

谷歌ai绘画代码(谷歌版你画我猜)(5)

AI从不完整图形开始,绘制不同图像

幼儿对世界的认知有限,但他们通过寥寥几笔就能描绘物体,甚至概括情感。这意味着视觉的功能是更新我们头脑中的世界内部模型,而我们画在纸上的东西概括了这个内部模型。虽然简笔画并不真实,但它能反映人类重建和表示周围环境图像的方式。

此前谷歌曾发表过一份基于简笔画的研究,他们训练了一个可以画简笔画神经网络模型,试图让它理解人类创意思维过程。研究取得了一定成果,但距离实现还很遥远。这是计算机所能做到的最接近做梦的事,如果能成功解构创意,人类可以加深对自己的理解,艺术家能拓宽思维,而幼儿也能以更直接的方式观察世界、了解世界。

小结

综上所述,这真的只是一个“让用户了解、体验人工智能的乐趣”的小游戏,没有必要怀疑,也没有必要紧张。当然,谷歌版“你画我猜”带来的乐趣可不止游戏,按照玩家地域分类,它还得出了一些有趣的结论。

夏天到了,西瓜、冷饮、电视剧是三大乐事,那么各国网友眼里的冰激凌是什么样的呢?

谷歌ai绘画代码(谷歌版你画我猜)(6)

AI堆叠了简笔画告诉我们:意大利的甜筒有三个冰激凌球!!!

,