人工智能背后,站着大量人工。
文 | 华商韬略 张静波
美国好莱坞,16万人宣布集体罢工,抗议AI入侵……
但与此同时,万里之外的黄土高原上,很多没念过大学的女人,却因为AI找到了工作,改变了人生。
【他们在喂养AI】
陕西清涧,地处黄土高原。
过去,这里的特产只有红枣。但近年来,随着气候变化,红枣减产,很多年轻人背井离乡,到外地谋生。
30岁的曹亚丽,却属于少有的逆行者。
2019年,因为家庭变故,她从西安回到清涧老家。但小县城不好找工作,曹亚丽在家闲了一年多,非常焦虑。
直到2020年,一家叫清涧爱豆的公司,改变了她的命运。
《南风窗》杂志记者,通过走访,记录下了曹亚丽的故事。
在清涧爱豆,曹亚丽成了一名AI数据标注员。
她和同事每天的工作,就是通过画框、贴标签、排序、找不同等方式,为文字、图像、视频等做标注。
正是靠她们的辛勤工作,给AI喂养了大量的数据,AI大模型才越来越聪明。
尽管这份工作并不轻松,平均每天要看3万张图。但一想到,从此告别面朝黄土背朝天的生活,曹亚丽还是很兴奋。
“鼠标一点都是钱啊。”
与曹亚丽相比,34岁的王慧之所以选择这份工作,更多是厌倦了全职妈妈的身份。
三年前,她还是一位全职妈妈,全身心扑在孩子上。这样的生活,虽然也不错,但总感觉缺点什么。
一次偶然的机会,王慧在朋友圈看到了清涧爱豆的招聘广告,心动了。
“数据标注师是弄啥的?以前都没听说过。”对于在家里待了多年的王慧而言,自己还能不能出去工作,都是个问号,更别提这么新潮的工种。
但经过培训,加上自身努力,她很快就上手了。
“原来总觉得生活很难再有变化,现在我明白了,只要抓住机会,未来还有多种可能。”
不止曹亚丽、王慧,也不止陕西清涧。
近年来,随着AI大爆发,对数据标注员的需求激增。在山西、贵州……全国许多地方也都增加了这个新职业,从业者众多。
在互联网大厂中,仅字节跳动在济南、天津、武汉的数据标注员,就多达4万人。
如果再加上第三方数据标注服务公司,比如全国最大的Testin云测,以及前面提到清涧爱豆等,从业者总数更是惊人。
据《科技日报》报道,仅北京一地,就有100多家从事数据标注的公司,全国从事这项工作的人可能超过千万。
AI不但改变了很多人的命运,也在改变着中西部地区的经济面貌。
陕西清涧是著名的革命老区。
但受限于地理环境,这里的经济一直不太理想,期间曾尝试过养猪、种果树、畜牧业等很多产业。
“人们能想到的农村能干的,我们县都干过,几乎都失败了。”
相比之下,AI数据标注,成为少有在这里成功立足的产业。如今,清涧爱豆已成为当地最大的用工企业。
重庆奉节,是“朝辞白帝彩云间,千里江陵一日还”的白帝城所在地,也是李白、杜甫、白居易、苏轼、苏辙等上千诗人或旅居,或做官,留下上万首诗篇的三峡门户。
这里拥有如诗如画的壮美与秀美山川,但却长期现代化产业企业缺位,并且戴了多年的贫困县帽子。
一个工厂都没几座的地方,引入百度、京东这类浪潮之巅的企业,这在过去是想都不敢想的。但新一届县委、县政府领导,目光敏锐,大胆想象,小心求证,决定在数字经济浪潮找到一席之地,并迎来百度、京东、网易等数字化企业,融入了信息工业与数字经济时代。
其中的百度智能云数据产业基地,同样在上演着宝妈成为数据标注师的故事,并在短短一年发展到超过500人的规模,成为当地就业新增长极。
【AI背后,是大量的人工】
人工智能,在很多人的潜意识里,意味着智能取代人工,以及大量的失业。
但鲜为人知的是,AI的背后,离不开大量无名英雄的喂养,他们就是数据标注员。
为什么AI需要数据喂养呢?这涉及机器学习和人的区别。
我们知道,人有举一反三的能力。举个例子,我们看到一只猫,就能识别出它是猫,甚至是什么种类的猫。
但机器不一样,它需要举三反一,通过大量的数据来学习如何识别一只猫。
那么,谁来给AI喂养数据呢?答案是数据标注员。事实上,当投喂的数据质量越高,AI就越强大。
因此,业界流传着一句话:人工有多强大,智能才有多强大。
2005年,当人工智能还处在萌芽状态时,业界大佬朱纯松就从美国赶回故乡湖北鄂州,在那里创办了莲花山研究院。
据说,那里有当时世界上最早的大数据标注团队。
但彼时,数据质量还未被广泛关注,人工智能继续沿着算法与模型的路径,缓慢发展。直到2012年一个叫 Ale.NET的AI模型,在ImageNet挑战赛中一鸣惊人。
ImageNet是一个大型的数据库,拥有1400万张已被标注的图片。
著名华裔计算机科学家李飞飞是该数据库项目的发起人之一。在那之前,业内普遍的研究方向是模型与算法。
李飞飞另辟蹊径,从数据质量入手。
今天,ImageNet已经是世界上最大的图像识别数据库,它催生了2012年新一轮的人工智能浪潮。
在这个数据库背后,是来自160多个国家的近5万名数据标注员,他们足足花了三年时间才把这些图片全部标注完。
没有这些被标注的图片,AI就不可能完成历史性的一跃。
数据标注究竟有多重要?或许可以用业界流传的一个故事来说明。
几年前,在美国,一辆某品牌的自动驾驶汽车,钻到了大卡车下边,最终导致车毁人亡的惨剧。
事故调查显示,车的摄像系统把白卡车误认成了白云,原因是:数据标注没有做好!
“我们就像AI的眼睛,带它看世界,理解世界,快速成长。”对于数据标注的重要性,一位从业者如此形容。
正是成千上万的数据标注员,日复一日地拉框,教会了人工智能理解人类世界。
不过,真正让数据标注火了的,是ChatGPT。
2019年,OpenAI创始人山姆·奥特曼,向微软提出一个大胆想法:构建一个AI系统,永远改变人类与计算机交互的方式。
这就是今天风靡全球的ChatGPT。
为了打造ChatGPT,OpenAI除了需要微软大笔的投资支持,用来购买算力,同时还需要解决一个难题:
让大模型学会识别暴力、仇恨等带有攻击性的言论。
这个过程需要大量的人力来给攻击性言论做标注。于是,OpenAI找到外包公司Sama达成合作。
由OpenAI提供数据,然后Sama在非洲肯尼亚雇人进行数据标注。
尽管Sama的行为,被很多媒体批评为血汗工厂,但数据标注却给当地带来了大量的工作机会。
今天,在人工智能大爆发的背景下,Sama俨然成为包括谷歌、微软和OpenAI在内,全球许多AI巨头的秘密武器。
这个过程,也在全球范围内,催生了大量新的工作岗位。
【不要做勒德分子】
在人类历史上,每一轮科技革命,几乎都伴随着人们的失业焦虑。
19世纪,随着机器在英国工厂得到广泛应用,大量的熟练工人被迫下岗。其中,一个叫勒德的人,一怒之下,带领工人打砸机器。
这些人,后来成为被嘲笑的对象,经济学家给他们取了个外号:勒德分子。
法国人巴斯夏,更是无情地嘲讽道:
“你们说新技术摧毁就业,那技术倒退是不是能增加财富呢?”
反问完后,巴斯夏还举了个例子。如果你发现新的大斧头太好用了,干脆把所有大斧头都换成小斧头,这样原本一天可以砍断的树,就得三天才能砍断。
这样就能创造更多就业,就能养活更多的伐木工人吗?
巴斯夏的嘲讽,对勒德分子一击致命。
事后,人类社会的发展,也进一步证明:勒德分子的焦虑,其实是杞人忧天。
机器的普及,不但没有消灭人类的就业,相反,技术进步让人类分工更细密,生产效率越来越高,也需要更多的劳动力。
最新的一个例子是,很多人抱怨,互联网电商把实体店铺挤垮了。
但它同时,也催生了数量多到过去难以想象的快递、外卖小哥、网约车司机、程序员等众多新的岗位。
事实上,今天在中国,快递员、外卖配送员等新就业形态劳动者,多达8400万人。
AI同样不例外。
它在取代一些传统工作岗位的同时,也正在创造大量新的工作岗位。数据标注员,只是其中的冰山一角。
未来,社会对图像识别、算法研究、深度学习等岗位,必然会产生大量需求,这都是人工智能产生的就业新机会。
这还没包括因为AI,将被彻底重构的千行百业。
对此,高盛集团曾发表了一份研究报告《AI对经济增长潜在的巨大影响》。在这份报告里,高盛上来就表明了自己的立场和观点:
从历史经验来看,AI取代的工作岗位,将被它创造的新的就业机会抵消!
然而,这并不意味着,我们可以高枕无忧。事实上,自从ChatGPT大火以来,它确确实实给很多人带来了就业危机。
比如,好莱坞的演员、编剧、摄影师们,就坐不住了。
16万人宣布集体罢工,这在好莱坞的历史上,绝无仅有,也注定要被写进影史。
但罢工阻挡不了人类步入AI时代的浩荡大势。对此,正确的做法,不是像勒德分子一样砸掉机器,而是:
主动改变自己,去适应新的时代!
【参考资料】
[1]《人工智能背后人工力量:全国从事数据标注人数超千万》科技日报
[2]《黄土高原上,没上过大学的女人们在喂养AI》南风窗
[3]《训练人工智能的中国县城工人》,蓝字计划
来源:啄木鸟财经