九派新闻微信公众号消息,刚建起的办公大楼墙体粉刷的白亮,办公室内电脑办公桌整齐划一。而在办公室窗外,则是典型的陕北乡村光景:春天到来之前,植被稀疏,黄土裸露,成排的窑洞清晰可辨,偶尔,拉货的驴车从县城的柏油马路上走过…… 这里是位于陕北小城榆林市清涧县的一家名为“爱豆科技”的数据标注公司。 黄土高原上的清涧县城 黄梦琪/摄 什么是“数据标注”? 贺杰是就职于“爱豆科技”的一名“人工智能训练师”,所负责的数据标注工作。两张路况照片把电脑屏幕填满,主角是图片里的路标。贺杰要做的,是对比出两张图片的路标变化,然后做上相应的标记。这便叫做“数据标注”。 这个看起来“高大上”的工作实则简单且重复。判断、打标签、提交......贺杰一秒就能完成,一天下来,她要为14000组左右的图片打上标签。 谈起所在数据标注行业,爱豆公司负责人鱼涛略带骄傲,“有多少人工,就有多少智能。中国甚至世界上新的技术,像ChatGPT,社会上可能还没出现,我们(标注员)已经在为它做准备了。” 随着AIGC领域竞争越发激烈,这些身处供应链最前端的县城AI训练师们,成为互联网热议的焦点。 【1】县城的AI初印象 2019年12月,“爱豆科技”落子清涧县。在县城电视台播放的“爱豆公司”广告里,清涧县城被形容为榆林“硅谷”,号召在外打工的人回乡就业,喊出了“初中学历也能干高科技”“只有你才能拯救它”的口号。 良好的硬件设施,上班打卡、弹性下班的管理模式,“爱豆科技”看起来与这个2020年2月以前还是国家级贫困县的小县城格格不入。对于以依赖红枣、小米、土豆等传统种植业为生的当地人来说,“人工智能训练师”完全是陌生的词汇。在公司成立之初,鱼涛面对的第一个问题就是:如何尽可能让县城人知道“AI”。 易拉宝从广场等公共区域,摆到年轻妈妈聚集的学校门口;电线杆上的广告位也被爱豆公司占上;就连县长都在朋友圈都发出了招聘通知,要求“初中学历以上,会计算机”......大力宣传下,前两次的招聘结果却有些惨淡。 转机发生在2020年4月,疫情稍稍缓和的那个春天,一则“爆炸性”新闻在县城传开:一位名叫杨彦军的爱豆公司员工,拿到了超万元的月薪。 清涧爱豆公司 黄梦琪/摄 想在小县城里找份体面工作并不容易。对当地女性而言,月薪在两三千元的服务员、售货员是最为普遍的选择;男性则多从事体力活,做电焊、搞装修、下地开荒,收入也勉强够温饱。有人在县城“玩玩电脑”就能拿到上万的月薪,无疑突破了清涧人的认知。 消息一传十、十传百,爱豆公司一下子成了当地的明星企业——三四百人向清涧县爱豆科技有限公司投去了简历,求职者包括带娃宝妈、回乡待业大学生、前政府员工等,年龄跨度从八零后到零零后。公司一层的走廊也被挤得满当,鱼涛把三百多人分成好几拨,花两三天时间才完成面试。 如今已有超过170多名县城员工在这里上班,在此之前,他们是县城上的宝妈、农民、甚至是政府职工。 在刀削面店老板娘眼里,爱豆是县城里少数“敲敲电脑就能完成”的工作,非常时髦;一位在县政府工作人员称,爱豆公司当地纳税大户,年营收一千多万;甚至大马路边卖水果的摊贩们,都能为你指明公司的方位...... 来公司参观的县市政府人员络绎不绝,鱼涛常常从早上接待到晚上。“几个领导出门还在纳闷,说玩电脑怎么挣钱”。更有人向鱼涛发出邀请,“能不能也在我们县城搞一个AI公司?” 这也在无意间点醒了鱼涛。彼时,吕梁山区发展标注业务的只有清涧,无论从业务体量还是品牌知名度,都难以和东南部其他数据标注公司竞争。 “如果能把清涧爱豆公司的模式复制到其他县市,形成一个产业带,是不是更有竞争力?”鱼涛觉得可以一试。2020年8月,在距离清涧93公里的山西永和县,孵化下一个AI公司——永和县数字就业中心。 【2】打开了一扇窗 比起清涧,地处吕梁山脉南端的永和县更为闭塞。在当地人的印象里,十几年前,永和县城还是灰蒙蒙的,马路没有铺上柏油、尘土飞扬。由于没通铁路,上学、打工的永和县人习惯坐两个半小时的大巴,到200公里外的临汾市转车。按照永和就业中心总经理李林峰的说法,“正常的企业都不会愿意来永和这样的地方。” 这也导致当地缺乏提供就业岗位的产业。几年前,永和中小学附近密集分布着麻将馆,县城里的女性没有别的事情干,送孩子上学后就去打麻将。发展到后来,连同孩子的午餐也在麻将馆里解决。 AI公司的到来正在悄无声息地改变永和县城。数字就业中心成立不到一年,吸纳了不少待业女性,麻将馆一家跟着一家黄了。“现在身份变了,公司女员工们都是老公带孩子、做饭,自己上班工作。”用鱼涛的话说,无论是在永和还是清涧,AI的工作都给县城人“打开了一扇窗”。 清涧爱豆公司业务栏 郭梓昊/摄 来到数字就业中心前,33岁的白雪将所有精力都扑在孩子身上。要喂奶、饭打翻,孩子无时无刻不在触动这位宝妈的敏感神经,面向丈夫倾诉时,白雪渐渐不能控制自己的脾气,吵架成为家常。“在家待得越久,越是压抑。”白雪说。 如今,通过金融风险事件的标注业务这个窗口,白雪第一次认识到了外部世界。 密密麻麻文字占满了电脑屏幕,一周内的公司新闻,都会出现在需要标注的文本里。财务信息造假、实际控制人涉嫌违法、税务非正常户、延期信息披露、偷税漏税……白雪能一口气背出这串名词。 朋友们常常惊讶于白雪的见闻——在标注中,白雪了解胡鑫宇事件的前因后果,她甚至清晰记得新闻发布会召开时间;不怎么追剧的她也知道了近期大热的《狂飙》,明白了“风浪越大鱼越贵”的道理。“高启强犯了罪,涉嫌违法的是公司实控人还是公司高层,这就是我要思考的内容。”白雪说。 同样被AI唤醒的,还有鱼涛。接管爱豆公司时,鱼涛对AI业务毫无概念,直到训练机器的数据标注工作摆在他面前,困惑越发浓烈,为什么AI需要人工? 关于数据标注是怎么回事,鱼涛是从书中看来,办公室里,他买来的书摆满了两个柜子。书中的世界给鱼涛带来了冲击:测试机器是不是具备人类智能的图灵测试、击败顶尖棋手柯洁的阿尔法狗、爆火网络的ChatGPT,鱼涛惊叹于世界的改变。 鱼涛为了解“数据标注”买来的书。郭梓昊/摄 “以后是不是好多人要被AI取代了?”很长一段时间里,鱼涛一直在想这个问题。但有限的知识很难提供一个答案,他只能宽慰自己,“火车出来后,赶马车的人没了吗?这是一种时代的进步,如果工作都被机器取代了,人类就坐下来享受。” 【3】“我只是一个标注工” 面对AI公司的到来,两地政府、爱豆公司的员工都曾寄予了希望。在公司落地之处,政府提供了办公场地、电脑等办公设备;员工们纷纷把待业的家人、朋友介绍到公司里。清涧公司也很争气,2年时间,公司员工来到了170人,办公区从两层扩充到三层。 可AI公司能在多大程度上改变县城的贫瘠现状?就连鱼涛也说不准。说到底,这份工作的本质仍是流水线上的螺丝钉。 到爱豆公司工作前,惠卓觉得AI标注工作很“高大上”,而上手一段时间后,她逐渐发现数据标注的另一面——门槛低、且需要忍受不断循环。在上一个任务里,惠卓一天要给数千张甚至上万张图片打标签,判断它们是否涉及暴力。 由于左手腕轻微挪动时会与桌面产生摩擦,工作半年后,贺杰的手腕内侧就起了茧,需要在左手腕下垫一条毛巾。她形容,这就像农民干活,每天都拿着铁锹,手也会起茧,歇一段时间“护理”一下,茧子就能消下去一点。 枯燥、机械......不可否认,数据标注是一份重复性强的工作,也是消磨人的。“如果整个人工智能领域是一颗鸡蛋,我们连鸡蛋皮都没碰到。”惠卓说。 永和县城里的“人工智能训练师”。黄梦琪/摄 对着电脑屏幕,惠卓有过一闪而过的念头:“我做的东西到底有什么用”“数据标注以外,上下游到底是怎么回事”“自动驾驶的汽车,难道不怕撞到人”“机器越来越聪明,未来会不会统治人类,像电影里一样?” 偶然的瞬间,这些数据标注员负责过的业务会与他们的生活发生映照。一次,员工王慧收到花呗平台的催款电话,听着客服用生动语气报出了欠款数目,王慧感到莫名的亲切,“我就是喂养AI客服催款,它的问题、回答是怎么形成的,我都清楚。” 但“一闪而过”也就过去了,循环反复的劳动中,期待也日复一日消失。“你试试坐在电脑跟前,做一天任务。”惠卓说,目前都是照猫画虎,也没有机会接触更多的内容。在提及这样一家AI公司给自己带来什么时,员工们的答案更多是“养家糊口”。 这一切,鱼涛都看在眼里,但作为公司负责人,他有着更为紧急的事情。过去三年里,办公场地、设备都由政府提供;接到的业务订单大多来自起初合作的互联网大厂。鱼涛始终有一层隐忧:“一旦这些资源都撤了,爱豆公司是不是垮了?好不容易开启的窗户是不是就关上了?” 【4】县城的束缚与解放 鱼涛所在的数据标注行业无疑还很年轻。2017年,伴随无人驾驶与阿尔法狗带来的AI浪潮,数据标注开始真正走进大众视野。如今,经历过一波洗牌之后,京东、阿里等头部公司相继组建自己的数据标注部门和工具,标注业务也更向龙猫数据、Testin云测等头部企业靠拢。 相较之下,除了扶贫标签带来的公益属性外,小县城的AI公司在商业竞争上显得毫无竞争力。 很长一段时间,像县城AI公司这样较低端的数据标注业务,只能存活于产业链底层。李林峰坦言,很多业务都需要几千人的标注平台,体量小的公司能接到的业务可能已经被外包了好几层。大部分时候,数据标注团队都会面临两个选择——要么无订单可做,要么接受亏本价。 为了公司的运转,鱼涛和李林峰都曾寄希望于寻求更多的订单。 2023年3月,鱼涛离开黄土高原,辗转来到江南水乡杭州,这里有着最为浓厚互联网氛围以及最前沿的人工智能领域技术,鱼涛此行的目的是,给公司拿下更多订单。但很显然,签下订单并非易事,推杯换盏间的两天后,鱼涛空手而归。 鱼涛感受到了一定落差。在清涧,鱼涛有一定号召力,但到了更大的世界,这份优势消失了。“我大专毕业,虽然也愿意看一些书,但是眼界没那么开阔,很多专业上的问题未必能说得清楚。在商业谈判上也会吃很大的亏。”鱼涛说。 来不及多想,更大的危机已经到来。AI正以可感知的速度替代掉了曾经培育他们的数据标注师——如今,AI算法从“有监督学习”升级为非监督学习或强化学习,这意味数据标注门槛越来越高了。 县城AI公司的业务,从最开始听语音标注文字的基础转换,到需要培训才能上手的医疗、法律等专业领域标注。再到现在,面对陌生的英语文本,员工们只能一个一个字母去核对,不少人因为干不来,自行选择了离开。 业务的改变对AI公司提出了人才要求。初中以上、高中、大专......最新一期招聘,清涧爱豆公司要招本科以上学历的人。但这谈何容易,“如果有能耐,谁不想往外走。”鱼涛说。经过三年的运营,两家公司把县城里能招的人都招了一遍,火爆的招聘场景也没再出现。 依托于偏远县城廉价劳动力发展起来的数据标注产业,目前正陷入缺乏高学历人才而止步不前的困局。这扇窗户能开多大、开多久,没人知道,但至少现在,有人从中找到了自己的价值意义。 身处县城,白雪觉得自己是人工智能产品背后的一个“奉献者”。他和同事们不知道ChatGPT到底是这么回事,只听说这款产品很厉害、在美国很火,聊到最后总结一句话:“它再伟大,也需要我们这样的人在背后做标注。” 通过AI工作,更多县城人拥有了自己的生活和世界。永和县城没有公园,到了周末,数字就业中心的同事们就开着车,带上孩子,去临汾,或者是黄河对岸的陕西,一块去旅游。这很日常,却已经是从前的她们不曾想到的生活。 原标题:县城里的“AI训练师” 编辑:杨雁琳 责编:周尚斗 审核:冯飞 |