2023年02月14日
评论数(0)2023年开年至今,几乎每一个网友,都逃不掉狂飙和ChatGPT的“洗礼”,一个霸榜热搜一个多月话题度丝毫不减,一个让全球科技巨头连夜秀肌肉马不停歇,就在ChatGPT全球狂飙之际,传来若干令人震惊的消息:
据媒体报道,ChatGPT背后竟有一座“血汗工厂”,他们没日没夜干着数据标注的工作,却拿着最低仅9块钱的时薪,堪称复古级工业压榨;
另外,让全球科技巨头欲罢不能的ChatGPT的运营成本也首度被曝光,一次运算耗资高达450万美元,一天的成本高达3亿,正如火如荼布局的国内的科技互联网大厂们,钱能烧多久?ChatGPT会否像元宇宙一样昙花一现?
ChatGPT全球狂欢:被忽视的“底层血汗”!
近日,美国《时代周报》的一则报道,让所有关注ChatGPT的网友都感到后背一凉,据其称“为了训练ChatGPT,Open AI雇佣了时薪不到2美元的尼日尼亚外包员工,让他们不分昼夜干着对庞大的数据库进行手动数据标注的工作”
先简单科普一下,何为数据标注,一般来说,只有经过标注处理后的结构化数据才能被AI算法模型所训练使用,所以,ChatGPT的每一次运行,都离不开亿万字节的被标注的大数据库,对数据进行初级标注的称之为标注工。
数据标注工通过简单的专业培训后即可上手,主要工作内容是对图像、语音、3D点云或文本等内容载体进行标注,拿比较好理解的文本标注举例,一段话,数据标注工需要对其打上语义、构成、语境、目的、情感等数据标签,从而使AI机器人能更好地理解这些语言。
值得一提的是,数据标注本质是劳动密集型行业,它的一个显性特质是工资低微,按行业惯例,多数数据标注公司都会选择开在偏远的乡镇以节省房租和运营成本,哪怕获微软重磅注资、如日中天的OpenAI同样不例外:
《时代周刊》报道,Sama公司雇佣了肯尼亚、乌干达和印度的外包员工,来为OpenAI提供数据标注服务,OpenAI给Sama的项目报酬是每小时12.5美元,但Sama最后结算给数据标注工的时薪仅有1.32美元~2美元,相当于直接缩水了60%~90%。
也许有人说,为何不绕过中间商直接与OpenAI签合同?我只能说有这种想法的太Na?ve了,是不可能直接给你签的,外包是他们降低综合风险的最佳方式,而且Sama等外包商就是专门吃这碗饭的,除了OpenAI还有别的大客户,这是行业惯例!
分析到这里,想必你们也就明白为何数据标注工干着最苦最累的活,为何却只能拿着极其低微的报酬了,一小时9块钱,一天连续干10小时也才90,还不包吃不包住的,可能最多也就能填饱个肚子,但为了生存,他们只能选择接受。
当然,最惨的是,除了拿钱少,还要承受巨大的心理煎熬,据《时代周刊》采访到的四名员工表示,这份工作(数据标注工)给他们留下了持久的心理创伤(比如9小时完成至多20万个单词的标注工)并且他们要求与心理咨询师的会面也被Sama管理层多次拒绝。
ChatGPT的无限风光背后,是全球千万普通数据标注工的无声泣泪,毫不夸张地讲,这是一场建立在底层血汗基础之上的高端游戏,如今在众巨头与各路资本的助力下,ChatGPT已在全球开枝散叶,国内的一众巨头们也都摩拳擦掌,生怕错过这难得一见的风口。
它们是为了讲新的商业故事、还是真正为了人工智能的进化?
ChatGPT为何让巨头着迷?
除了让苹果、微软和谷歌等一众巨头兴奋难掩,国产科技互联网巨头也是当仁不让,百度前脚官宣“文心一言”,阿里达摩院紧接着官宣内测ChatGPT,科大讯飞亦表示将在AI学习机上率先落地ChatGPT……就连国内的数据标注公司海天瑞声,进入兔年以来,股价都暴涨逾200%,疯狂之象,前所未见!
来看一组ChatGPT迄今为止的卓越表现:
谷歌面试官称ChatGPT能通过年薪18万美元工程师的招聘考试;
《福布斯》报道称全美已有89%的学生用ChatGPT写作业;
北密歇根大学称全校最出色的论文,出自ChatGPT之手;
《大西洋月刊》报道称ChatGPT的出现,直接宣告了大学论文的死亡;
有人用它写《植物大战僵尸》的游戏代码,被发现直接可用,有人告它,零基础开发出了游戏;
人有用它生成了《老友记》20年后重聚剧本,情节无比自然流畅;
上面的例子可能还离普通白领比较远,感知不强烈,那好,再来一个爆炸级应用实例:
用集成了ChatGPT的微软Edge(任何一台安装了WIN10、WIN11的电脑都标配的浏览器)打开GAP的财报,并问边栏的ChatGPT:“这几十页财报说了啥?”
ChatGPT很快给你将要点拎出并总结了一番;
继续问ChatGPT:“跟Lululemon比呢?”
ChatGPT很快给你列了一个对比表,并且表格里的每一项数据都注明了数字来源;
你甚至可以想象一下这样的工作场景,打开邮箱,看到一份几十面的材料,你完全可以让ChatGPT给你总结要点,并且让ChatGPT给你列出决策项,并且可以针对每个决策写邮件发给客户,客户收到你的邮件,也可以呼叫ChatGPT来信息处理乃至完成回信的操作
……
能分析会处理还能制表,这已经是质变了,不说完全取代打工人,至少足以完成很多白领的大部分工作了。
据华西证券研报,ChatGPT目前至少能帮人类做写代码、绘画、写新闻、写相声、提供家装设计和人生规划建议与信息分类等49件事,涉及到多个行业和学习工作的方方面面。
2月13日,知名互联网大佬、猎豹移动(原金山网络)CEO傅盛兴奋发帖称:“被ChatGPT给惊到了,因为它居然猜出了我家狗狗叫3万的原因,图灵测试肯定能通过了,关键是这才刚开始……”
也就是说,理解常识和理解语义这两个对于机器语言最难的点,ChatGPT都做到了,人类独有的常识理解被AI机器人掌握,听上去确实像科幻电影照进了现实,但这一切,都只是开始;
被ChatGPT震惊的大佬绝不仅傅盛一个,据媒体报道,2020年的一次大会上,百度创始人李彦宏就准确预判了类ChatGPT产品的爆发:
“技术积累到这儿了,数据的积累也到这儿了,计算能力的积累也到这儿了,正好这三者在这个时点具备了爆发的能力,AI技术的进一步成熟,可以运用于很多领域,大幅提升效率,并改变人们的生活方式”。
微软创始人比尔盖茨直言“ChatGPT出现的重大历史意义,不亚于PC和互联网的诞生”!
于是我们看到微软火线入局OpenAI,成了当下ChatGPT的最大受利者,让谷歌和苹果都开始寝食难安,而在大洋彼岸的东方圣土,一场类ChatGPT的AI技术变革正在盛大拉开帷幕。
目前,百度布局的ChatGPT产品“文心一言”(英文名“ERNIE Bot”)预计3月份推出,阿里达摩院布局的ChatGPT也在紧张内测中,华为计算产品线相关负责人亦表示,公司在2020年就开始在与ChatGPT相关的大模型领域有布局,科大讯飞在去年还曾获得包括OpenBookQA、常识推理挑战赛QASC等在内的总共12项认知智能领域的权威评测第一名……
这么多巨头都有在类ChatGPT领域纵深布局,足以说明,相较之于空泛的元宇宙,更接地气更显成果的ChatGPT才是AI赛道最大的风口,没有之一!
尽管前途一片光明,但也不能忽视过程中所付出的巨大代价,我们的科技互联网巨头们要推出一个完成度接近于ChatGPT的产品,首先就要算一笔经济账:
据《华为尔见闻》报道,按国盛证券的分析模型推测,类ChatGPT的大模型训练一次就要烧掉200万-1200万美元,仅每日的电费消耗就高达4.7万美元;
据《36氪财经》报道,ChatGPT一次运算的成本高达450万美元,《财富》曾报道称2022年,OpenAI公司净亏损高达5.45亿美元,如若不是背后大股东微软源源不断的输血支撑,OpenAI的ChatGPT早黄了。
据《深网》透路,小冰CEO李笛曾直言“小冰框架当前所支撑的对话交互量,一天就达到14个人类一辈子的对话交互量,若使用ChatGPT的方法,每天成本将高达3亿元,一年成本超过1000亿”
……
暂且不说“血汗工厂”廉价雇佣数据标注工的问题,先回归商业本质,持续的巨额资金投入亦难平ChatGPT的无底洞,回报遥遥无期、沉没成本甚至远高于雇佣人类,这真的值吗?
参考资料:
信源综合每日经济新闻、快科技、鞭牛士、凤凰网财经、36氪财经、景联文数据标注等,部分图源网