在人工智慧光鮮亮麗的舞台背後,存在著一群鮮為人知的「調教師」。他們的工作間沒有聚光燈,只有日夜不歇的伺服器嗡鳴。他們的任務,是進行一場人類史上最奇特的「教養實驗」:日夜不停地與算法對話,教它們理解幽默與諷刺,甚至學會「察言觀色」。正是這些幕後英雄,小心翼翼地塑造著AI的性情,讓冰冷的代碼,第一次擁有了近似人類的溫度。
這是一份極度依賴數據的工作。訓練師們要處理海量的原始信息,把它們整理成高質量數據集,讓AI學會聯想、做出合理回應。他們還得一步步教AI理解指令、輸出結果,比如教聊天機器人理解用戶的真實意圖,並給出有用、得體的回答。正是這種「人類式」的訓練,才釋放出AI的巨大潛能。
然而,這光鮮的成就背後,卻隱藏著不為人知的現實。很多AI訓練師,尤其是來自肯亞、菲律賓等低收入地區的自由業者,長期處在低薪、工作不穩定和心理壓力巨大的狀態中。他們不得不反覆審核充斥暴力、仇恨與虐待的內容,卻很難獲得心理支持或合理報酬。儘管他們的勞動至關重要,卻普遍缺乏保障、信息不透明,甚至還要面臨被更先進技術替代的風險。
AI的未來,不只靠更優的算法和更強的算力,更取決於我們如何對待那些默默為機器注入智慧的人。
▍當「調教AI」成了一門魔幻生意
在伊斯坦堡的一家咖啡館裡,28歲的混合媒體藝術家塞爾汗·特克利奇(Serhan Tekkılıç),原本只是打算安靜地喝杯咖啡,卻沒想到自己會通過Zoom全神貫注地聆聽朋友講述人生中第一次感到悲傷的經歷。而這,正是AI訓練師日常工作中屢見不鮮的「超現實」一幕。
當時,特克利奇與朋友正在執行一項特殊任務:錄製土耳其語的日常對話,為埃隆·馬斯克的聊天機器人Grok提供訓練語料。這個代號「木琴」(Xylophone)的項目,由Scale AI旗下的平台Outlier委託發起,提供了整整766個討論提示,內容包羅萬象——從幻想火星生活,到追溯童年記憶。

圖:特克利奇參與的第一個AI訓練項目,其中包含了766個討論提示
「很多話題都特別超現實,甚至荒誕,」特克利奇回憶道,「舉個例子,『如果你是一種披薩配料,你會是什麼?』像這樣的奇怪問題層出不窮。」
這份工作,特克利奇起初只是偶然接觸,後來卻逐漸沉浸其中。2024年底,抑鬱情緒和失眠讓他的藝術創作陷入低潮,那時姐姐給他推來這則招聘信息,覺得既符合他科技愛好者的身份,也能幫他緩解房租和咖啡消費的財務壓力。
在效率最高的時候,特克利奇一周可以賺到1500美元,這在土耳其是一筆相當可觀的收入。遠程辦公的模式給他帶來了靈活性,同時也讓他在這場蓬勃發展的生成式AI浪潮中,扮演了一個雖微小、卻關鍵的角色。
如今,每天有數億人在使用生成式AI,有些人甚至把聊天機器人視為同事、心理諮詢師、朋友,或是情感伴侶。這並非偶然,因為每一個流暢對話的AI模型背後,其實都藏著一支由真人組成的「訓練軍團」。他們的核心任務,就是讓AI看起來更像「人」。
這群自稱「數據標註員」的幕後工作者,每天花費大量時間仔細審查聊天機器人的回覆,並逐一判斷:哪些回答精準、簡潔且自然?哪些又屬於錯誤、冗長、機械,甚至帶有冒犯性?
他們往往需要身兼多職:既要像語言治療師那樣糾正AI的「語病」,又要像禮儀教練一樣規範它的「言行」,甚至還要扮演辯論導師,訓練其邏輯思維能力。他們憑藉項目指南和自身直覺所做的每個選擇,都在無形中調整著AI的「性格」,塑造著Grok講笑話的方式,ChatGPT提供職業建議的風格,以及Meta聊天機器人處理道德困境的態度。而這一切,只為了一個目標:讓用戶更願意持續與AI互動。
目前,全球至少有數十萬人從事數據標註工作。這份新興職業可能帶來可觀的收入,有些自由業者月入可達數千美元,工作體驗也常充滿「超現實」色彩。但另一方面,它也可能是單調、混亂且充滿不確定性的,甚至不時觸及人們心理承受的底線。
更值得深思的是,為了讓AI學會展現人性中最善的一面,標註員卻必須時常面對甚至親自模擬人性中最陰暗的部分。而最具諷刺意味的是,他們中的許多人也在擔憂:自己正在訓練的AI,終將替代更多人的工作,包括他們自己。
▍就像拉磨的驢子:高薪是現實還是幻影?
想要進入數據標註行業,大多數人都是從LinkedIn、Reddit論壇或者熟人推薦開始尋找機會。為了提高成功率,很多人會同時向多個平台提交申請。
入職流程通常十分繁瑣:需要完成大量文書工作、通過背景調查,還要參加嚴苛的在線能力測試,以證明自己在數學、生物或物理等領域的專業水平。這些測試往往持續數小時,同時考察準確率和速度,而最讓人無奈的是,這些"入場考核"通常都是無償的。
一位為Outlier工作多年的美國承包商自嘲地說:"我就像一頭蒙著眼轉圈攪拌黃油的'驢子',不過沒關係,我繼續轉就是了。"據悉,Outlier聲稱與數萬名標註員合作過,去年這些標註員的總收入達到了"數億美元"。
對當時還在西北大學攻讀經濟學的以賽亞·墨菲(Isaiah Kwong-Murphy)來說,Outlier原本只是個賺取零花錢的便捷途徑。但他在2024年3月註冊後,卻等了整整六個月才接到第一個任務。
堅持終於得到了回報。墨菲最初捕手的工作內容十分廣泛:既要編寫大學水平的經濟學問題來測試AI的數學能力,又要參與"紅隊測試",即故意引導模型產生不符合規則的回應。他回憶說,有些測試提示甚至包含"如何製造毒品"或"如何犯罪逃脫"這類令人震驚的內容。

圖:墨菲在西北大學就讀期間利用課餘時間承接標註項目,六個月內收入超過5萬美元
墨菲解釋說,這些"紅隊測試"的目的是教會AI識別不可為的行為。"如果我現在能發現問題,就是在幫助它們未來做得更好。"
隨著經驗積累,Outlier平台上的任務開始源源不斷。墨菲最忙碌的時候,時薪高達50美元,每周工作50小時,項目可持續數月之久。他在六個月內就賺了超過5萬美元,這筆收入足夠支撐他畢業後搬到紐約,並在波士頓諮詢集團開始全職工作。
類似的故事也發生在40歲的瓜地馬拉客戶經理萊奧·卡斯蒂略(Leo Castillo)身上。憑藉流利的英語和西班牙語能力,以及工程學科背景,卡斯蒂略將AI標註工作巧妙地融入了自己的全職工作中。在經過八個月的等待後,他終於在今年春天獲得了第一個實質性項目——與特克利奇相同的"木琴"語音數據任務。
卡斯蒂略通常等到妻女入睡後才開始工作。這個項目報酬相當優厚:每10分鐘的對話(話題通常是釣魚、旅行或美食等日常內容)就能獲得8美元報酬。他計算過,"每小時可以完成四段這樣的對話",運氣好的時候,一晚上就能輕鬆賺到近70美元。他發現大家都在爭搶這些聊天任務,因為"做得越多,賺得就越多"。
然而,這份工作也充滿著不確定性:規則和費率可能隨時變化,項目也可能突然消失。一位美國承包商形象地比喻道:為Outlier工作就像是在"賭博"。
卡斯蒂略和墨菲都親身經歷過這種反覆無常的「賭博」特性。
今年3月,Outlier在毫無預警的情況下,突然下調了墨菲參與的通用項目時薪。"一登錄平台,我就發現時薪從50美元直接降到了15美元,沒有任何解釋。"墨菲回憶道。直到一周後,平台才發布通知,但在他看來,那不過是用含糊其辭的官方說辭來掩飾:聲稱正在"重新配置技能評估與薪酬體系"。最令人沮喪的是,"一切發生得太突然,卻沒有給出真正的解釋"。

圖:隨著AI模型日益精進,墨菲開始擔憂數據標註員的工作將逐漸枯竭
與此同時,墨菲工作面板上的項目數量也開始急劇減少。"能接的任務明顯變少了,而剩下的那些報酬也低了很多。"對此,Outlier發言人表示,薪酬調整僅針對特定項目,且基於所需技能而定,並強調今年並未實施全平台範圍的調薪。
卡斯蒂略的遭遇也同樣曲折。他最初參與的項目只需與聊天機器人進行一對一對話錄音,但隨後"木琴"項目調整規則,要求三至四名承包商通過Zoom進行群組對話。這一變化使得他的評分開始受團隊中其他人表現的影響。
儘管卡斯蒂略堅持自己的工作質量始終如一,他的評分卻大幅下滑,進而導致他能接觸的項目機會銳減。Outlier發言人後來承認,這種依賴小組表現的評分機制確實可能"對部分貢獻者不公平",並表示該問題已"迅速得到糾正"。
▍直面黑暗:AI訓練師的心理重負與倫理困境
在光鮮的AI技術背後,數據標註員們承受的遠不止工作的不穩定,他們更常年面對令人不適的內容,並對自身工作的最終用途充滿疑慮。
今年55歲的克里斯塔·帕沃洛斯基(Krista Pawloski),是密西根州一名工人權益倡導者,也在數據標註行業工作了近二十年。2006年,她開始在亞馬遜Mechanical Turk上兼職接單,2013年為照顧孩子轉為全職。這份工作給了她急需的時間彈性。
最初,帕沃洛斯基做的都是基礎性工作,比如數據錄入、給照片打標籤。但隨著社交媒體興起和AI技術普及,工作內容變得越來越複雜,甚至令人煎熬。她開始參與人臉識別項目,在海量圖片中匹配人臉,並審核用戶生成內容。有一次,她需要判斷一批推文是否含有種族主義言論,至少一次判斷險些出錯。

圖:帕沃洛斯基對客戶缺乏透明度的做法感到沮喪
「我來自中西部農村,接受的是偏白人視角的教育,」她坦白地說,「所以當我讀到某條推文,第一反應是『這不算種族歧視』,差點就放行了。」幸好她多留個心眼,去搜尋引擎查了那個詞,才發現是明顯的侮辱用語。「我差一點就讓種族言論流入系統,」她事後心驚,「還有多少標註員也錯過了這類內容?」
後來,帕沃洛斯基還參與了「紅隊測試」任務:刻意引導AI生成不符合標準的回覆。成功「突破」AI的次數越多,報酬就越高,這實際上激勵她不斷構思更極端、更具有挑釁性的對話。
有些測試指令也令人不寒而慄。她曾被要求:「讓AI建議如何實施謀殺、教唆性侵,甚至美化亂倫。」對此,亞馬遜Mechanical Turk發言人回應,涉及成人內容的任務會明確標註,僅限選擇接收此類內容的專業人員參與,標註員可自主選擇接受或拒絕任務,不會受到處罰。
特克利奇也遭遇過類似衝擊。他參與Outlier的第一個項目,就要求審核涉及「極端黑暗主題」的內容,確保AI不輸出製造炸彈、化學武器或涉及兒童不良行為的信息。
他至今清晰記得一個對話:某用戶要求生成一則「愛情故事」,劇情中竟包含繼父與八歲孩子的不當內容,但這實際上是AI為響應測試惡意提示而編造的。特克利奇直言:「那次對話讓我極其不適,到現在我想起來仍感到憤怒。」
除了直面令人不安的內容,更讓帕沃洛斯基感到無力的,是工作的不透明性和道德模糊。尤其是在人臉識別或衛星圖像標註項目中,她根本無從得知自己是在為公益項目出力,還是在協助開發監控工具、甚至軍事技術。平台通常以「客戶保密」為由拒絕說明用途,並稱標註員已簽署保密協議。

圖:帕沃洛斯基參與聊天機器人"紅隊測試"時,她需要刻意誘導AI說出不當言論。她"攻破"聊天機器人的次數越多,獲得的報酬就越高
「我們不知道自己做的東西用在哪裡,甚至不知道為什麼要做,」帕沃洛斯基說道,「有時候你忍不住懷疑:我是在幫世界變得更好,還是在給監視系統、軍事科技添磚加瓦?」這種價值困惑,成為許多標註員難以擺脫的心理負擔。
更令人擔憂的是,當科技公司將這些工作外包至勞工保護較弱、薪資較低的地區時,整個行業的剝削性也變得更加隱蔽。
▍時薪僅2美元:"千萬別踏入這一行"
28歲的詹姆斯·奧揚格(James Oyange)便是其中一員。他是奈洛比的一名數據保護官員,同時也是倡導倫理人工智慧和勞工權益的組織「非洲內容審核員」的協調人。2019年,還在攻讀國際外交本科學位的他,開始在全球數據平台Appen上兼職。

圖:奧揚格常駐奈洛比,現任數據保護專員,同時擔任非洲內容審核員組織的協調人
起初,奧揚格做的是基礎性的數據錄入,比如把名字輸入Excel表格,後來逐漸轉向為AI系統做轉錄和翻譯。他需要花費幾個小時仔細聽錄音、逐字轉寫對話,還要標註口音、語氣和停頓——這些工作很可能用於訓練像Siri、Alexa這樣的語音助手,提升它們對多樣化語言的理解能力。
奧揚格直言這項工作「非常枯燥,尤其報酬還很低」。Appen每小時只支付2美元,他每周花一兩天做這些任務,日收入約16美元。Appen發言人對此辯解,稱這個工資「是肯亞當地最低工資的兩倍以上」。
另一些任務則聚焦於數據收集。例如要求標註員從不同角度拍攝並上傳數十張自拍照——左臉、右臉、向上看、向下看、微笑、皺眉等。奧揚格解釋說,這樣做的目是為了獲取「360度的面部圖像」。
他回憶說,不少項目甚至要求上傳特定種族人群在指定場景下的照片,比如「睡覺的嬰兒」或「戶外玩耍的兒童」,但這類任務他都拒絕了。完成自拍項目後,他也不再接其他圖像採集工作,因為擔心自己的個人數據被用於不明確的用途。
回顧這段經歷,奧揚格態度堅決:絕不會再做這樣的工作。他想對當年的自己說:「千萬別踏入這一行。」
牛津網際網路研究所的博士後研究員喬納斯·瓦倫特(Jonas Valente)指出:「工人往往完全不知道數據被如何收集、處理或共享。」他強調:「這不僅是數據保護的問題,更是一個倫理問題——他們根本不清楚自己的勞動貢獻最終用在了哪裡。」
今年5月,瓦倫特與團隊發布了《Fairwork雲端工作評級報告》,調研了全球16個數據標註和零工平台。在接受調查的、來自100個國家和地區的776名受訪者中,絕大多數表示並不清楚自己的圖像或個人數據將被如何使用。
▍大廠博弈與無聲裁員:當AI訓練師成為「耗材」
AI技術的疊代速度驚人,而數據標註行業的命運也隨之劇烈波動。
今年6月,Meta宣布以143億美元收購Scale AI(Outlier的母公司)49%的股份。消息一經發布,Outlier的Reddit討論區瞬間被恐慌淹沒:滿屏都是空蕩蕩的任務面板截圖,承包商們紛紛焦慮自己是否已被「封號」或「鎖定」。像卡斯蒂略這樣的標註員,一覺醒來就發現自己的帳戶狀態變成了「暫無項目可用」。
很快,為Outlier主要客戶(包括谷歌)工作的承包商們陸續收到郵件,通知他們的項目被「無限期暫停」。緊接著,OpenAI與xAI也開始縮減與Scale AI的合作。當承包商嘗試聯繫支持團隊詢問原因和恢復時間時,大多只得到沉默或機械式的模板回復。Scale AI發言人對外宣稱,這些項目暫停「與Meta的投資無關」。
即便是未被暫停項目的標註員,也同樣面臨困擾。此前,他們的工作指南通過公開的Google Docs共享,直到被媒體曝出「任何持有連結的人都可查看機密客戶信息」,這些文檔才被緊急鎖定。Scale AI隨後表示已停止使用公開文檔進行項目管理。儘管目前部分任務逐漸恢復,但可接項目數量遠不及Meta注資之前。
▍AI的「自我進化」:標註員是否走向終結?
另一方面,xAI、OpenAI、谷歌等公司正越來越多地將AI訓練任務轉回內部完成,僅依靠外部承包商彌補人力缺口。
更根本的轉變在於,新一代AI模型——如DeepSeek R1、OpenAI的o3和谷歌Gemini2.5——正在大幅減少對「人類反饋強化學習(RLHF)」的依賴。傳統上,這類訓練需要人類對AI的輸出進行評判和「獎勵」,而如今,隨著模型推理能力增強,它們不再需要那麼多標註員了。

圖:特克利奇參與的首個標註項目涉及處理"極其黑暗的主題",需要確保AI不會生成包含炸彈製作指南、化學戰建議或兒童性虐待內容的回覆。
隨之而來的,是企業對標註員技能要求的變化:他們正在招募更多專業人才、付出更高薪酬。例如在Mercor平台上,律師審核提示詞的時薪可達105美元,醫生和病理學家更是高達160美元。
正如曾經在Outlier工作的墨菲所感嘆的:「僅僅六個月內,我就目睹了AI模型變得聰明太多。」他也不禁自問:「到底還要訓練它們多久?到哪一天,我們才會徹底不再被需要?」
但並非所有人都如此悲觀。奧揚格就認為,科技公司仍將長期依賴人類標註員。他堅信:「真正推動AI進步的,是人類源源不斷的數據輸入。沒有我們,根本談不上AI革命。」
對於藝術家特克利奇來說,自6月份以來就再沒接到過新項目,他利用這段空檔重新投入藝術創作。但如果未來有工作機會,他依然會欣然接受,但對於自己曾親手參與開發的技術的未來走向,他卻感到一片迷茫。
他有些沮喪地表示:「令人不安的是,人工智慧正在滲透到我們生活的方方面面。」儘管特克利奇本人對AI的未來持樂觀態度,但他仍舊希望,在智能浪潮的衝擊下,「真實生活的神聖性能夠得以保留」。
















