为了把机器人拦在门外,人类发明了验证码。
但不知何时起,验证码开始处处刁难人类。
它就像路上的减速带,你过是能过,但总会咯噔一下,而且越急就越难受。
黑胖和我说,那夜他突想温习两性知识,结果在某网注册账号时,被验证码卡了五分钟,可憋坏了。
他不理解,都来这种地方了,为啥还要证明自己是个有七情六欲的人。
一般来说,要是简单的识别文字,滑动滑块完成拼图,大伙倒还能接受。
但很多时候,验证码大军并不仅有这两个兵种,它们上天入地,各显神通,搞你心态。
有的跟你讲了一百字的故事,然后问你一共有几个人去踏青。
看着像小学数学暑假作业,难是不难,但是烦。
还有的干脆给你画 6 个迷宫。每个迷宫都有老鼠和奶酪,让你找到那个吃不到奶酪的老鼠。
迷宫倒也不难,但丫是真耽误时间。
更有甚者,你都不知道你得回答什么。
比如图里明明写着「 太极和猴子哪个不是动物 」。
结果你提交「 太极 」,显示错误。
因为这些奇葩验证码层出不穷,以至于后来出现的一些离谱截图,都让人难以分辨真假。
比如你是个脸盲,就被判处为非人类。
你不是娱乐圈顶级粉丝,八卦爱好者,明星绯闻通,那也肯定是个机器人。
也许这些图都是网友整活,但它既然能在网络上传播,不就是因为大伙儿被折磨多了,觉得足够真实,合情合理么。
更恐怖的是,这些年验证码还一直在进化,世超就时不时能发现一些新的验证形式, 越来越抽象。
它们就像把我们放在案板上,不停切换着姿势鞭打我们,让我们遵循它的规则证明自己的人类身份。
有网友遇到这么一个验证码,它告诉你一段话:
不错,很厚穿上很舒服,给老妈也买了,她很喜欢。请问下面选项哪个是买家的点赞的?
这道题属于阅读理解了,根据世超多年当人的经验,答案应是买家点赞「 保暖性 」。
从理解规则到思考完毕到选对答案,我足足花了半分钟。
还有人遇到一个验证码,让他用最短线连接褐色。
问题是不难,但第一次遇到谁都会有点懵逼,等你搞清楚游戏规则了,开始连线了,结果显示验证失败。
因为连的太慢。
不是,现在反应慢点,都不能证明自己是人类了吗?
而且反应慢,更应能证明我是真人才对吧。
更搞的还有,在注册某社交软件时,你要不断调整方向,直到圈内有 2 个箭头是朝上的。
这么看感觉还行,但,它需要你成功 10 次。
10 次?你们产品运营是没有新用户 KPI 吗?
还有这种图形验证码,通过点击图片交换位置,让图恢复原状。
哥们只是来注册账号的,不是来练脑子的。。。
看到这些验证码我就想啊, 是不是因为 AI 变强了,为了能对抗机器人,验证码也要跟着做更复杂?
比如之前 GPT-4 可以看懂一张梗图表达的信息,并能解释这张梗图为什么好笑;Meta 的 Segment Anything ,它能帮你识别出来任何你输入的物体。
如果脚本机器人接入了这些 AI,那么那些传统验证码,似乎确实不管用了。
所以说,验证码本身就是一场博弈,黑产们不停突破过时验证码,我们也在不停制造新的验证码。
但我觉得这并不是一个终极解决办法。
AI 发展速度很快,他的判断能力有时跟人类几乎没有差别,单纯在一些语义理解,逻辑思维上加难度,已经渐渐行不通了。
一个很困难的数学问题, AI 比人类回答得更快更准。
上面我花了半分钟通过的[ 衣服很厚 ]验证码,我把问题发给 ChatGPT ,它一秒就给出了正确答案。
以后能有效拦截机器人的,肯定不是越来越离谱的验证码问题,而应当是另一种层面上的「 验证 」。
就比如行为验证。
前面说的那个连线验证码,「 连接过慢 」这种事情不就应该会发生在人类身上嘛。
所以当有这种「 行为 」发生时,系统应当可以结合其他因素,来判别这是个真实的人类。
我们知危编辑部曾经采访过的极验公司,他们的滑块验证码时就会结合人类的行为判定。
真人用鼠标滑动时,轨迹往往不会是一条直线。他们通过大量数据建立人类行为轨迹模型,这样就能更智能化更多维去判断,此时在操作的是不是一个真人。
就好比网上有个梗说,如果有一篇文章标点符号完全正确,也没有错别字,那它基本就是 AI 写的。
因为人就是不完美的,这是机器很难模仿的。
的确,企业用验证码确定访问者的人类身份,是很有必要。
有数据表明,互联网上正常流量只占 38.5% ,大部分流量都由机器人或者脚本产生的。如果企业不做点防护措施拦截机器人,一旦被黑产找到漏洞后就产生大量损失。
但是现在,随着 AI 不断进步,单纯地加大验证问题的难度并不是一个可持续性方案。
如果能换个思路,找到简单高效的验证办法,能在拦截机器人的同时,也能照顾用户体验,那就是最好了。
毕竟真的有很多网友,都被验证码劝退过。
撰文:刺猬 编辑:莽山烙铁头
图片、资料来源:
小红书、微博