AI「調教師」:有人月入上萬,有人時薪不到2美元＊阿波羅新聞網

在人工智慧光鮮亮麗的舞台背後，存在著一群鮮為人知的「調教師」。他們的工作間沒有聚光燈，只有日夜不歇的伺服器嗡鳴。他們的任務，是進行一場人類史上最奇特的「教養實驗」：日夜不停地與算法對話，教它們理解幽默與諷刺，甚至學會「察言觀色」。正是這些幕後英雄，小心翼翼地塑造著AI的性情，讓冰冷的代碼，第一次擁有了近似人類的溫度。

這是一份極度依賴數據的工作。訓練師們要處理海量的原始信息，把它們整理成高質量數據集，讓AI學會聯想、做出合理回應。他們還得一步步教AI理解指令、輸出結果，比如教聊天機器人理解用戶的真實意圖，並給出有用、得體的回答。正是這種「人類式」的訓練，才釋放出AI的巨大潛能。

然而，這光鮮的成就背後，卻隱藏著不為人知的現實。很多AI訓練師，尤其是來自肯亞、菲律賓等低收入地區的自由業者，長期處在低薪、工作不穩定和心理壓力巨大的狀態中。他們不得不反覆審核充斥暴力、仇恨與虐待的內容，卻很難獲得心理支持或合理報酬。儘管他們的勞動至關重要，卻普遍缺乏保障、信息不透明，甚至還要面臨被更先進技術替代的風險。

AI的未來，不只靠更優的算法和更強的算力，更取決於我們如何對待那些默默為機器注入智慧的人。

▍當「調教AI」成了一門魔幻生意

在伊斯坦堡的一家咖啡館裡，28歲的混合媒體藝術家塞爾汗·特克利奇（Serhan Tekkılıç），原本只是打算安靜地喝杯咖啡，卻沒想到自己會通過Zoom全神貫注地聆聽朋友講述人生中第一次感到悲傷的經歷。而這，正是AI訓練師日常工作中屢見不鮮的「超現實」一幕。

當時，特克利奇與朋友正在執行一項特殊任務：錄製土耳其語的日常對話，為埃隆·馬斯克的聊天機器人Grok提供訓練語料。這個代號「木琴」（Xylophone）的項目，由Scale AI旗下的平台Outlier委託發起，提供了整整766個討論提示，內容包羅萬象——從幻想火星生活，到追溯童年記憶。

圖：特克利奇參與的第一個AI訓練項目，其中包含了766個討論提示

「很多話題都特別超現實，甚至荒誕，」特克利奇回憶道，「舉個例子，『如果你是一種披薩配料，你會是什麼？』像這樣的奇怪問題層出不窮。」

這份工作，特克利奇起初只是偶然接觸，後來卻逐漸沉浸其中。2024年底，抑鬱情緒和失眠讓他的藝術創作陷入低潮，那時姐姐給他推來這則招聘信息，覺得既符合他科技愛好者的身份，也能幫他緩解房租和咖啡消費的財務壓力。

在效率最高的時候，特克利奇一周可以賺到1500美元，這在土耳其是一筆相當可觀的收入。遠程辦公的模式給他帶來了靈活性，同時也讓他在這場蓬勃發展的生成式AI浪潮中，扮演了一個雖微小、卻關鍵的角色。

如今，每天有數億人在使用生成式AI，有些人甚至把聊天機器人視為同事、心理諮詢師、朋友，或是情感伴侶。這並非偶然，因為每一個流暢對話的AI模型背後，其實都藏著一支由真人組成的「訓練軍團」。他們的核心任務，就是讓AI看起來更像「人」。

這群自稱「數據標註員」的幕後工作者，每天花費大量時間仔細審查聊天機器人的回覆，並逐一判斷：哪些回答精準、簡潔且自然？哪些又屬於錯誤、冗長、機械，甚至帶有冒犯性？

他們往往需要身兼多職：既要像語言治療師那樣糾正AI的「語病」，又要像禮儀教練一樣規範它的「言行」，甚至還要扮演辯論導師，訓練其邏輯思維能力。他們憑藉項目指南和自身直覺所做的每個選擇，都在無形中調整著AI的「性格」，塑造著Grok講笑話的方式，ChatGPT提供職業建議的風格，以及Meta聊天機器人處理道德困境的態度。而這一切，只為了一個目標：讓用戶更願意持續與AI互動。

目前，全球至少有數十萬人從事數據標註工作。這份新興職業可能帶來可觀的收入，有些自由業者月入可達數千美元，工作體驗也常充滿「超現實」色彩。但另一方面，它也可能是單調、混亂且充滿不確定性的，甚至不時觸及人們心理承受的底線。

更值得深思的是，為了讓AI學會展現人性中最善的一面，標註員卻必須時常面對甚至親自模擬人性中最陰暗的部分。而最具諷刺意味的是，他們中的許多人也在擔憂：自己正在訓練的AI，終將替代更多人的工作，包括他們自己。

▍就像拉磨的驢子：高薪是現實還是幻影？

想要進入數據標註行業，大多數人都是從LinkedIn、Reddit論壇或者熟人推薦開始尋找機會。為了提高成功率，很多人會同時向多個平台提交申請。

入職流程通常十分繁瑣：需要完成大量文書工作、通過背景調查，還要參加嚴苛的在線能力測試，以證明自己在數學、生物或物理等領域的專業水平。這些測試往往持續數小時，同時考察準確率和速度，而最讓人無奈的是，這些"入場考核"通常都是無償的。

一位為Outlier工作多年的美國承包商自嘲地說："我就像一頭蒙著眼轉圈攪拌黃油的'驢子'，不過沒關係，我繼續轉就是了。"據悉，Outlier聲稱與數萬名標註員合作過，去年這些標註員的總收入達到了"數億美元"。

對當時還在西北大學攻讀經濟學的以賽亞·墨菲（Isaiah Kwong-Murphy）來說，Outlier原本只是個賺取零花錢的便捷途徑。但他在2024年3月註冊後，卻等了整整六個月才接到第一個任務。

堅持終於得到了回報。墨菲最初捕手的工作內容十分廣泛：既要編寫大學水平的經濟學問題來測試AI的數學能力，又要參與"紅隊測試"，即故意引導模型產生不符合規則的回應。他回憶說，有些測試提示甚至包含"如何製造毒品"或"如何犯罪逃脫"這類令人震驚的內容。

圖：墨菲在西北大學就讀期間利用課餘時間承接標註項目，六個月內收入超過5萬美元

墨菲解釋說，這些"紅隊測試"的目的是教會AI識別不可為的行為。"如果我現在能發現問題，就是在幫助它們未來做得更好。"

隨著經驗積累，Outlier平台上的任務開始源源不斷。墨菲最忙碌的時候，時薪高達50美元，每周工作50小時，項目可持續數月之久。他在六個月內就賺了超過5萬美元，這筆收入足夠支撐他畢業後搬到紐約，並在波士頓諮詢集團開始全職工作。

類似的故事也發生在40歲的瓜地馬拉客戶經理萊奧·卡斯蒂略（Leo Castillo）身上。憑藉流利的英語和西班牙語能力，以及工程學科背景，卡斯蒂略將AI標註工作巧妙地融入了自己的全職工作中。在經過八個月的等待後，他終於在今年春天獲得了第一個實質性項目——與特克利奇相同的"木琴"語音數據任務。

卡斯蒂略通常等到妻女入睡後才開始工作。這個項目報酬相當優厚：每10分鐘的對話（話題通常是釣魚、旅行或美食等日常內容）就能獲得8美元報酬。他計算過，"每小時可以完成四段這樣的對話"，運氣好的時候，一晚上就能輕鬆賺到近70美元。他發現大家都在爭搶這些聊天任務，因為"做得越多，賺得就越多"。

然而，這份工作也充滿著不確定性：規則和費率可能隨時變化，項目也可能突然消失。一位美國承包商形象地比喻道：為Outlier工作就像是在"賭博"。

卡斯蒂略和墨菲都親身經歷過這種反覆無常的「賭博」特性。

今年3月，Outlier在毫無預警的情況下，突然下調了墨菲參與的通用項目時薪。"一登錄平台，我就發現時薪從50美元直接降到了15美元，沒有任何解釋。"墨菲回憶道。直到一周後，平台才發布通知，但在他看來，那不過是用含糊其辭的官方說辭來掩飾：聲稱正在"重新配置技能評估與薪酬體系"。最令人沮喪的是，"一切發生得太突然，卻沒有給出真正的解釋"。

圖：隨著AI模型日益精進，墨菲開始擔憂數據標註員的工作將逐漸枯竭

與此同時，墨菲工作面板上的項目數量也開始急劇減少。"能接的任務明顯變少了，而剩下的那些報酬也低了很多。"對此，Outlier發言人表示，薪酬調整僅針對特定項目，且基於所需技能而定，並強調今年並未實施全平台範圍的調薪。

卡斯蒂略的遭遇也同樣曲折。他最初參與的項目只需與聊天機器人進行一對一對話錄音，但隨後"木琴"項目調整規則，要求三至四名承包商通過Zoom進行群組對話。這一變化使得他的評分開始受團隊中其他人表現的影響。

儘管卡斯蒂略堅持自己的工作質量始終如一，他的評分卻大幅下滑，進而導致他能接觸的項目機會銳減。Outlier發言人後來承認，這種依賴小組表現的評分機制確實可能"對部分貢獻者不公平"，並表示該問題已"迅速得到糾正"。

▍直面黑暗：AI訓練師的心理重負與倫理困境

在光鮮的AI技術背後，數據標註員們承受的遠不止工作的不穩定，他們更常年面對令人不適的內容，並對自身工作的最終用途充滿疑慮。

今年55歲的克里斯塔·帕沃洛斯基（Krista Pawloski），是密西根州一名工人權益倡導者，也在數據標註行業工作了近二十年。2006年，她開始在亞馬遜Mechanical Turk上兼職接單，2013年為照顧孩子轉為全職。這份工作給了她急需的時間彈性。

最初，帕沃洛斯基做的都是基礎性工作，比如數據錄入、給照片打標籤。但隨著社交媒體興起和AI技術普及，工作內容變得越來越複雜，甚至令人煎熬。她開始參與人臉識別項目，在海量圖片中匹配人臉，並審核用戶生成內容。有一次，她需要判斷一批推文是否含有種族主義言論，至少一次判斷險些出錯。

圖：帕沃洛斯基對客戶缺乏透明度的做法感到沮喪

「我來自中西部農村，接受的是偏白人視角的教育，」她坦白地說，「所以當我讀到某條推文，第一反應是『這不算種族歧視』，差點就放行了。」幸好她多留個心眼，去搜尋引擎查了那個詞，才發現是明顯的侮辱用語。「我差一點就讓種族言論流入系統，」她事後心驚，「還有多少標註員也錯過了這類內容？」

後來，帕沃洛斯基還參與了「紅隊測試」任務：刻意引導AI生成不符合標準的回覆。成功「突破」AI的次數越多，報酬就越高，這實際上激勵她不斷構思更極端、更具有挑釁性的對話。

有些測試指令也令人不寒而慄。她曾被要求：「讓AI建議如何實施謀殺、教唆性侵，甚至美化亂倫。」對此，亞馬遜Mechanical Turk發言人回應，涉及成人內容的任務會明確標註，僅限選擇接收此類內容的專業人員參與，標註員可自主選擇接受或拒絕任務，不會受到處罰。

特克利奇也遭遇過類似衝擊。他參與Outlier的第一個項目，就要求審核涉及「極端黑暗主題」的內容，確保AI不輸出製造炸彈、化學武器或涉及兒童不良行為的信息。

他至今清晰記得一個對話：某用戶要求生成一則「愛情故事」，劇情中竟包含繼父與八歲孩子的不當內容，但這實際上是AI為響應測試惡意提示而編造的。特克利奇直言：「那次對話讓我極其不適，到現在我想起來仍感到憤怒。」

除了直面令人不安的內容，更讓帕沃洛斯基感到無力的，是工作的不透明性和道德模糊。尤其是在人臉識別或衛星圖像標註項目中，她根本無從得知自己是在為公益項目出力，還是在協助開發監控工具、甚至軍事技術。平台通常以「客戶保密」為由拒絕說明用途，並稱標註員已簽署保密協議。

圖：帕沃洛斯基參與聊天機器人"紅隊測試"時，她需要刻意誘導AI說出不當言論。她"攻破"聊天機器人的次數越多，獲得的報酬就越高

「我們不知道自己做的東西用在哪裡，甚至不知道為什麼要做，」帕沃洛斯基說道，「有時候你忍不住懷疑：我是在幫世界變得更好，還是在給監視系統、軍事科技添磚加瓦？」這種價值困惑，成為許多標註員難以擺脫的心理負擔。

更令人擔憂的是，當科技公司將這些工作外包至勞工保護較弱、薪資較低的地區時，整個行業的剝削性也變得更加隱蔽。

▍時薪僅2美元："千萬別踏入這一行"

28歲的詹姆斯·奧揚格（James Oyange）便是其中一員。他是奈洛比的一名數據保護官員，同時也是倡導倫理人工智慧和勞工權益的組織「非洲內容審核員」的協調人。2019年，還在攻讀國際外交本科學位的他，開始在全球數據平台Appen上兼職。

圖：奧揚格常駐奈洛比，現任數據保護專員，同時擔任非洲內容審核員組織的協調人

起初，奧揚格做的是基礎性的數據錄入，比如把名字輸入Excel表格，後來逐漸轉向為AI系統做轉錄和翻譯。他需要花費幾個小時仔細聽錄音、逐字轉寫對話，還要標註口音、語氣和停頓——這些工作很可能用於訓練像Siri、Alexa這樣的語音助手，提升它們對多樣化語言的理解能力。

奧揚格直言這項工作「非常枯燥，尤其報酬還很低」。Appen每小時只支付2美元，他每周花一兩天做這些任務，日收入約16美元。Appen發言人對此辯解，稱這個工資「是肯亞當地最低工資的兩倍以上」。

另一些任務則聚焦於數據收集。例如要求標註員從不同角度拍攝並上傳數十張自拍照——左臉、右臉、向上看、向下看、微笑、皺眉等。奧揚格解釋說，這樣做的目是為了獲取「360度的面部圖像」。

他回憶說，不少項目甚至要求上傳特定種族人群在指定場景下的照片，比如「睡覺的嬰兒」或「戶外玩耍的兒童」，但這類任務他都拒絕了。完成自拍項目後，他也不再接其他圖像採集工作，因為擔心自己的個人數據被用於不明確的用途。

回顧這段經歷，奧揚格態度堅決：絕不會再做這樣的工作。他想對當年的自己說：「千萬別踏入這一行。」

牛津網際網路研究所的博士後研究員喬納斯·瓦倫特（Jonas Valente）指出：「工人往往完全不知道數據被如何收集、處理或共享。」他強調：「這不僅是數據保護的問題，更是一個倫理問題——他們根本不清楚自己的勞動貢獻最終用在了哪裡。」

今年5月，瓦倫特與團隊發布了《Fairwork雲端工作評級報告》，調研了全球16個數據標註和零工平台。在接受調查的、來自100個國家和地區的776名受訪者中，絕大多數表示並不清楚自己的圖像或個人數據將被如何使用。

▍大廠博弈與無聲裁員：當AI訓練師成為「耗材」

AI技術的疊代速度驚人，而數據標註行業的命運也隨之劇烈波動。

今年6月，Meta宣布以143億美元收購Scale AI（Outlier的母公司）49%的股份。消息一經發布，Outlier的Reddit討論區瞬間被恐慌淹沒：滿屏都是空蕩蕩的任務面板截圖，承包商們紛紛焦慮自己是否已被「封號」或「鎖定」。像卡斯蒂略這樣的標註員，一覺醒來就發現自己的帳戶狀態變成了「暫無項目可用」。

很快，為Outlier主要客戶（包括谷歌）工作的承包商們陸續收到郵件，通知他們的項目被「無限期暫停」。緊接著，OpenAI與xAI也開始縮減與Scale AI的合作。當承包商嘗試聯繫支持團隊詢問原因和恢復時間時，大多只得到沉默或機械式的模板回復。Scale AI發言人對外宣稱，這些項目暫停「與Meta的投資無關」。

即便是未被暫停項目的標註員，也同樣面臨困擾。此前，他們的工作指南通過公開的Google Docs共享，直到被媒體曝出「任何持有連結的人都可查看機密客戶信息」，這些文檔才被緊急鎖定。Scale AI隨後表示已停止使用公開文檔進行項目管理。儘管目前部分任務逐漸恢復，但可接項目數量遠不及Meta注資之前。

▍AI的「自我進化」：標註員是否走向終結？

另一方面，xAI、OpenAI、谷歌等公司正越來越多地將AI訓練任務轉回內部完成，僅依靠外部承包商彌補人力缺口。

更根本的轉變在於，新一代AI模型——如DeepSeek R1、OpenAI的o3和谷歌Gemini2.5——正在大幅減少對「人類反饋強化學習（RLHF）」的依賴。傳統上，這類訓練需要人類對AI的輸出進行評判和「獎勵」，而如今，隨著模型推理能力增強，它們不再需要那麼多標註員了。