作者:道长

来源:情报姬

相信每个买火车票的人,都不会忘记曾经被12306验证码支配的恐惧。

毕竟从王自如中挑出刘翔,在白百何里辨认王珞丹,真不是一般选手能做到的事情,大部分人脸盲到连自己与彦祖都区分不了。

为什么老是获取不了验证码(这年头没点知识储备)(1)

据官方的统计,当时能一次性输入对12306的验证码的人只有8%,两次输入正确的也只有27%,可以说挡住了黄牛的同时也彻底打败了普通用户。要是眼神不好,运气也不行,四十道验证码没有一个答对的奶糖哥就是标准结局。

为什么老是获取不了验证码(这年头没点知识储备)(2)

虽然如今铁道部门用实名认证等更加严格的方式来防止黄牛倒票,12306的验证码已经下岗许久,但类似让人抓狂的验证码却始终存在,毕竟在互联网上冲浪,你总得证明“你是活人而不是机器”这个很关键的事情。

为什么老是获取不了验证码(这年头没点知识储备)(3)

注册账号无疑是验证码经常出没的重要场合,而对一个玩家来说,注册一个烂橘子账号的难度完全不亚于挑战黑魂BOSS,不对,是有过之而无不及。

臭名昭著的“数骰子”验证码是第一道拦路虎。初见时,大家多半以为只是简单的数学题,算骰子点数而已。

为什么老是获取不了验证码(这年头没点知识储备)(4)

但完成一题后才发现需要做5题,然后做完5题又5题,得连续答对15题才能过关。

答错任何一题就请少侠重头来过,而且答题是有时间限制的,超时一样得重来。在此期间,你还得祈祷网络别出现任何波动,不然会发生什么不用我多说吧。

为什么老是获取不了验证码(这年头没点知识储备)(5)

无独有偶,索尼也有个类似的验证码——触摸无法够到奶酪的老鼠,同样的多次答题套路,同样的精神污染。

为什么老是获取不了验证码(这年头没点知识储备)(6)

巧合的背后是必然,不难发现这些验证码是同一家公司制作的,名为arkose labs,而这家公司基本也在国内玩家的黑名单上了。

抛开有意为难用户的例子不说,其实还有一些小众论坛、偏门网站的验证码也十分考验大家的知识储备,比如在一堆代码中找到BUG所在。

为什么老是获取不了验证码(这年头没点知识储备)(7)

或是直接出一道专业题,让用户看图写出分子化学式。

为什么老是获取不了验证码(这年头没点知识储备)(8)

也可能让你解答整流二极管的相关问题,瞄一眼就知道是自己的知识盲区。

为什么老是获取不了验证码(这年头没点知识储备)(9)

有数理化,自然不缺文史哲,既有读音标填单词,也有标志性历史事件的日期考验。

为什么老是获取不了验证码(这年头没点知识储备)(10)

为什么老是获取不了验证码(这年头没点知识储备)(11)

如果不是专业对口,恐怕只有特别博学的大神才有可能答得上来。事实上,用这种验证码本来就没想过让所有人都答对,其本意就是设置门槛,把验证码当做小圈子的入驻考试,在注册时筛选志同道合的用户。

为什么老是获取不了验证码(这年头没点知识储备)(12)

尽管很多时候验证码真的很反人类,但它的存在是其有意义的,它的诞生和进化实际上也是人类与机器之间对抗发展的缩影。

在90年代,互联网刚开始走上商业化的时候,网络邮箱是最受欢迎的服务之一,雅虎邮箱在此期间崭露头角,用户量暴增,而这也让很多人看到了“商机”,即批量注册邮箱,向其他用户发送大量营销广告邮件。

为什么老是获取不了验证码(这年头没点知识储备)(13)

除了发送垃圾邮件之外,用同样的方式和手段,稍微改造下程序就能应用于刷帖灌水、恶意爬虫、抢票倒票,甚至直接暴力破解密码。

为了解决这个问题,一位名叫路易斯·冯·安的人和他的小伙伴们设计出了最早的验证码(CAPTCHA ),其英文全称是Completely Automated Public Turing Test to Tell Computers and Humans Apart,翻译过来是“全自动区分计算机和人类的图灵测试”,说人话就是区分你到底是“人”还是“机器”。

为什么老是获取不了验证码(这年头没点知识储备)(14)

最初的验证码只运用简单的字母或数字,普通人可以轻松辨认,但对当时的机器和程序来说却难以识别,所以成功守护了互联网一段时期的和平。

然而我们都知道,技术是不断进步的,你有张良计,我有过墙梯,很快破解验证码的程序和软件就出现了。

为什么老是获取不了验证码(这年头没点知识储备)(15)

那么为了应对破解,验证码一样需要不断进化,一场防御与进攻之间的“军备竞赛”就此展开。

先是扭曲、旋转、变形、模糊、划痕,千方百计让机器无法识别,可惜验证码被改得爹妈都不认识了,还是会被破解。

为什么老是获取不了验证码(这年头没点知识储备)(16)

图片既然已经没有办法再复杂了,自然要寻求其他方向,人类的逻辑思维上线,开始把验证码设计成题目,从简单的1 1等于几,到上文各种专业难题,极大增加了破解的难度。

为什么老是获取不了验证码(这年头没点知识储备)(17)

另一方面,找出图片中的火车、飞机,辨别人物、动物等也是这个方向的延续。

不过随着机器对人类知识学习的不断深入,这类验证码同样挡不住破解的步伐,要是再加难度,可能又会演变成12306那样,杀敌一千,自损八百,把许多正常用户也挡在门外。

为什么老是获取不了验证码(这年头没点知识储备)(18)

所以只得另辟蹊径,从其他角度找到人类可以轻松做到,但机器难以模仿的事情。

那就是行为。

“我不是机器人”这个熟悉的验证码没那么多花里胡哨,仅需要点一下就行,它会通过跟踪用户点击之前、点击时以及点击之后的行为(如停留时间、鼠标移动),判断是否是人在操作。

为什么老是获取不了验证码(这年头没点知识储备)(19)

现在更为常见的滑块验证码对人来说没什么技术含量,除非你日常手抖,或者遇到下面这个长得特立独行的滑块。

为什么老是获取不了验证码(这年头没点知识储备)(20)

但其背后的程序却可以通过分析用户手指滑动速度、对齐位置等,判断当前用户是人还是模拟人类的机器。

而伴随着验证码的广泛使用,有不少人试图挖掘它更多的价值,毕竟几亿人甚至几十亿人每天都必须做一件事时,哪怕这件事只花几秒钟不值一提,也足以产生质变。

谷歌就会把路牌、障碍物等街景的验证码数据用于训练自动驾驶汽车的AI,帮助AI辨认那些模糊的道路状况,以便其更好得应对复杂路况。

为什么老是获取不了验证码(这年头没点知识储备)(21)

在庞大数据的支持下,谷歌的自动驾驶AI很可能是如今最接近L5(完全自动驾驶)级别的,而且人家大大方方的直接公布了白嫖你劳动力的行为,反正你不可能不用验证码。

事实上,也有质疑验证码的声音,觉得其效果欠佳又浪费时间,但在人工智能越来越发达的今天,一般的方法还真分辨不了人与机器。

为什么老是获取不了验证码(这年头没点知识储备)(22)

更为有效的指纹验证、人脸识别等方法,要么需要借助设备,成本太高,要么容易侵犯隐私,安全无法保障,各有各的问题。

所以在完美的替代方案出现之前,我们确实还无法离开验证码。

,