[PConline 杂谈]AI绝对可以称得上是这几年最火爆的话题。从Alpha Go击败顶尖围棋选手开始,越来越多人意识到在很多领域,AI已经能够用接近人类的思维,更高效地完成任务。在很多领域,AI甚至已经可以涉及甚至部分取代之前只能由人类担任的工作,例如机器翻译有了AI加持后,译文的质量在很多场景下已经达到了可用的程度,电脑和互联网变得越来越聪明了。

ai绘画的人都是三条腿(简直就是黑科技)(1)

AI加持的翻译GNMT比之前的PNMT更加接近人工翻译

然而长久以来,很多人依然认为,在一些体现人类独创性思维的领域,仍是AI的禁区。例如艺术和绘画,很难想象出AI能和人的想象力和手艺一较高下。

但是,近年AI在图形学的进展,却让人惊呼时代真的变了!不少高质量的AI绘画方案纷纷面世,即使你完全不会画画,凭借着寥寥几笔涂鸦,甚至简单一两句乃至几个词的描述,就能够通过AI生成美轮美奂的绘画,简直如同黑科技,尤其是最近在Google Colab开源的Disco Diffusion,全世界都玩疯了!

ai绘画的人都是三条腿(简直就是黑科技)(2)

Disco Diffusion已经可以绘制如此高质量的图画了!

AI绘画并不是一蹴而几的,它随着算力的增强,以及算法的完善,慢慢修炼到了如今的功力。那么在这几年,都有些什么令人印象深刻的AI绘画方案?今天,就来介绍一些相当值得把玩的AI绘画,来看看AI在如何一步步在艺术领域挑战人类的吧。

Paintschainer

这可能是最早出圈的AI绘画方案了。Paintschainer在早几年就引起了人们的注意,它并不能完全靠自己来画一幅画,Paintschainer的主要作用是给线稿上色,其效果已经可以追上一些比较简陋的人工上色作品。

Paintschainer GitHub主页:https://github.com/pfnet/PaintsChainer

Paintschainer Demo:https://petalica-paint.pixiv.dev/index_zh.html

Paintschainer在当时之所以突然爆火,是因为人们突然发现,AI居然是可以辨认线稿内容的!Paintschainer的惊人之处,在于它能够识别线稿的内容,例如一张美少女人像,它可以识别某部分属于皮肤,某部分是头发,某部分是衣服,某部分是背景,然后分别涂上适当的颜色。不仅如此,它的上色范围还相当精准,尽管线稿没有封闭,但颜色依然会保留在适当的范围,而不会涂得满地都是——用过PS中油漆桶工具上色的朋友,应该知道这是什么意思。

ai绘画的人都是三条腿(简直就是黑科技)(3)

AI可以分辨对于电脑来说很抽象的线稿,并自动上色

ai绘画的人都是三条腿(简直就是黑科技)(4)

使用简单的彩色线条作颜色指定ho后,上色更精确,效果甚至已经和人工上色不相上下了

在很多人的固有认知中,电脑很难“理解”图像,从照片中辨认、总结出内容物是什么。然而Paintschainer却做到了更高的层次,能够“理解”线稿这样比起写实照片更加抽象的图像。尽管Paintschainer并不完美,但它已经足以让人们对于AI的强大有了更加贴切的体验。

NV GauGAN

NV是显卡界的大拿,无数游戏玩家将老黄视为偶像。而NV同样是AI算力的重要贡献者,它早早在AI领域布局了多枚棋子,到如今NV在AI领域无论是硬件还是配套的软件,都达到了很高的水平——游戏玩家如果用过NV增强画质的DLSS AI算法,一定深有体会。

DLSS并非是NV在图像AI领域的唯一体现,实际上,NV近年的一个开源AI项目SPADE/GauGAN,就让人啧啧称奇。

NV SPADE GitHub主页:https://github.com/NVlabs/SPADE

NV GauGAN 2 Demo:http://gaugan.org/gaugan2/

GauGAN是一个NV使用AI生成图像的方案,和上文介绍的线稿上色AI相比,GauGAN的强大之处就在于它可以生成完成度极高的图像,而前提是只需要你涂抹几笔,用不同颜色的色块和线条意思一下,GauGAN就可以明白你的意思,还你一张逼真度极高的照片。

ai绘画的人都是三条腿(简直就是黑科技)(5)

而GauGAN一直处于发展中。今年,GauGAN还推出了第二代,除了依然可以通过简笔画生成照片,现在还能够通过文字描述来生成图像了!

在GauGAN 2当中,用户只需要输入描述画面的文字,AI就可以自动生成对应的画面。而且,生成的速度非常惊人,几乎就是即时的。例如下图,输入“Ocean”出现海,继而输入“waves”则会出现波浪,继续输入“hitting rocks on the beach”则又继续生成海滩和岩石,效果非常惊人。

ai绘画的人都是三条腿(简直就是黑科技)(6)

此外,GauGAN还支持用户手动涂抹修改。如果想要对生成的内容做调整,就可以直接用简笔涂鸦,AI会如魔法般变出逼真的对应内容。

ai绘画的人都是三条腿(简直就是黑科技)(7)

GauGAN之所以有如此大能,是因为使用了对抗网络,大量数据经过机器训练后,使用生成器和鉴别器来识别对应元素,从而匹配数据生成图像。据了解,GauGAN 2使用了1000万张图像进行训练,艺术家使用它不仅可以生成现实的风景,还可以生成天马行空的艺术场景,这超越了很多人以往对电脑插手艺术的固有印象。

Disco Diffusion

这可能是今年最为人瞩目的绘画AI了!Disco Diffusion一经面世,就刷爆了全球各大社交媒体,它颠覆了很多人对AI的认知。

ai绘画的人都是三条腿(简直就是黑科技)(8)

你敢相信,这是AI作出来的画?

如果说GauGAN的强大之处,在于可以凭借人的简单想象就生成逼真图像,那么Disco Diffusion就更进一步,不仅可以进行复杂的想象,而且还可以生成各种画风的绘画!

Disco Diffusion是一个运行在Google Colab上的AI,如果要使用它,需要拥有Google账号并且能访问Google,国内的用户可以自行解决这方面的问题。Disco Diffusion的程序是面向公众公开的,在使用之前,我们可以先将其保存到自己的Google Drive网盘,以方便进一步的编辑。

Disco Diffusion:https://colab.research.google.com/github/alembics/disco-diffusion/blob/main/Disco_Diffusion.ipynb

Disco Diffusion GitHub主页:https://github.com/alembics/disco-diffusion

ai绘画的人都是三条腿(简直就是黑科技)(9)

Disco Diffusion的强大之处,在于你给出一段描述文字,就能够生成高质量的画作。尽管它没有图形界面,但使用起来并不复杂,进入到“Setting”当中,可以设置名称(AI生成的绘画会保存到Google Drive中对应的文件夹)、尺寸(不要设置太大,保持默认即可)、步数(保持默认即可)等等。

ai绘画的人都是三条腿(简直就是黑科技)(10)

接着,进入到“Prompts”(提示词)的设置当中,这就是最关键的地方了。在Prompts中,你可以输入描述绘画的词句,例如官方给出的实例为“A beautiful painting of a singular lighthouse, shining its light across a tumultuous sea of blood by greg rutkowski and Thomas kinkade, Trending on artstation.”, “yellow color scheme””,意思大致为“奇异灯塔的美丽绘画,在汹涌的血海中闪耀着光芒,参考greg rutkowskiThomas kinkade的画风,以及artstation网站上流行的风格”“黄色主调”。

ai绘画的人都是三条腿(简直就是黑科技)(11)

然后点击“代码执行程序”中的“全部运行”,静静等待即可。运算过程可能长达几十分钟乃至数小时,运算是在Google的云服务器上运行的,对本机电脑性能没要求。随后,Disco Diffusion就生成了这样一副绘画!

ai绘画的人都是三条腿(简直就是黑科技)(12)

在很多人眼里,AI能够生成这样的一幅画是非常惊人的,其完成度甚至不属于一些真正的画手。而Disco Diffusion生成这样的一幅画,流程要比手工作画来得更快,而且改一下提示词,又能生成另外不同风格的画了。

ai绘画的人都是三条腿(简直就是黑科技)(13)

ai绘画的人都是三条腿(简直就是黑科技)(14)

ai绘画的人都是三条腿(简直就是黑科技)(15)

同样的Prompts提示词,仅仅更换了作者风格的关键字,Disco Diffusion就可以生成不同的画风

Disco Diffusion对提示词的要求很宽松,完全可以用简单的词语,甚至是机翻来应对。例如笔者填入了“a modern city at night,super wide angle,artstation”这样简单的Prompts,就生成了下面这幅画作。

ai绘画的人都是三条腿(简直就是黑科技)(16)

Disco Diffusion有很多潜力可发掘。例如使用算力更强的云服务、设置更多次的迭代算法、提供更具体的提示词、甚至给到参考图片,都能够生成更高质量、更多种风格的画作。下面是一些来自互联网的利用Disco Diffusion生成的作品,大家可以感受一下。

ai绘画的人都是三条腿(简直就是黑科技)(17)

Prompts:TheVastViridescentHillsidelacksRationalityandobfuscatesitsBeauty

ai绘画的人都是三条腿(简直就是黑科技)(18)

Prompts:whenyouhavetakeneverythingaway,whatremains?willyouwalkthisroadallthewaytotheheartofthegalaxy?

ai绘画的人都是三条腿(简直就是黑科技)(19)

Prompts:forbiddenaesthetic

毫无疑问,Disco Diffusion的出现,颠覆了很多人的三观。这个AI所生成的绘画,甚至已经可以说拥有一定的艺术感了。尽管它对于动物和人物的绘制仍存在短板,而且也并不能胜任人物、场景设计这样具体的、需要扣细节的工作,但无论是给普通人一场视觉盛宴,还是给行业人员找找灵感,都已经绰绰有余了。

可以说,Disco Diffusion将绘画AI推向了一个新高度,绘画这种讲究审美、讲究灵感的技艺,也不再专属于人类了。

Tiamat

Disco Diffusion依托在Google Colab上,对于国内用户来说有网络方面的门槛,而且界面说不上易用,还需要用英文来撰写提示词(尽管可以机翻)。现在,对国人更友好的AI绘画方案,正在路上。

最近,一款名为Tiamat的绘画AI在国内展开了测试。根据内测者微博用户 @春卷 的体验反馈,它的界面比较友好,而且可以用中文来给AI命题,效果还相当不错。

ai绘画的人都是三条腿(简直就是黑科技)(20)

和Disco Diffusion相比,Tiamat的本土化做得好很多。例如,它甚至能根据诗词来绘画,画面效果相当好,还颇有意境。在微博、小红书平台上,都可以找到很多这样的案例。

ai绘画的人都是三条腿(简直就是黑科技)(21)

Prompts:天苍苍,野茫茫,风吹草低见牛羊(来自微博 @春卷)

ai绘画的人都是三条腿(简直就是黑科技)(22)

Prompts:海压竹枝低复举,风吹山角晦还明(来自小红书 @青柑普洱不甜_Tiamat)

ai绘画的人都是三条腿(简直就是黑科技)(23)

Prompts:帘卷落花如雪,烟月,谁在小红亭(来自小红书 @5 1=6)

可见,Tiamat的AI方案还是有吸引人的独到之处的。不过目前Tiamat目前仍处于内部测试阶段,如果想要亲自体验,可以通过下面的链接来申请测试资格。

Tiamat内测申请:https://tiamat-ai.feishu.cn/share/base/shrcn2uXL8wNiveykIFYqWSzsPf

希望Tiamat能够尽快推出公开的版本,让更多国人感受到AI绘画的魅力吧。

总结

随着硬件性能的进步以及算法的改进,AI仍在飞速发展。AI在绘画方面的建树,已经让人咋舌,大家有条件的话,强烈推荐把玩一下Disco Diffusion,感受AI作画的魅力。未来AI会在更多方面挑战人类的灵智吗?我们拭目以待吧。

,