事實查核 ChatGPT：當人工智慧遇上敏感詞＊阿波羅新聞網

美國新創公司開放人工智慧（OpenAI）推出的聊天機器人「ChatGPT」掀起一波人工智慧熱潮，從翻譯、創作到寫程式，使用者不分語言只要輸入問題，ChatGPT便會以流暢的文句提出解答。

然而，當探索ChatGPT這樣的人工智慧產品如何「學習」時，有學者專家提出：ChatGPT「學習」的材料來自網絡內容，但網絡上簡體中文知識大半來自中國，內容經過中國政府審查。如果ChatGPT學習的材料來自這些被審查的內容，給出的答案也很可能就像個「小粉紅」。

另一方面，中國境內的評論者也注意到了ChatGPT「有問必答」這種特性可能跨越中國政府對言論管控的紅線。一篇在網易號上發表的評論指出，「ChatGPT，正在上演一出西方政治正確現形記」，劍指美方利用ChatGPT對中國發起意識形態鬥爭。

我們的測試方法

ChatGPT究竟怎麼面對中國設定的「敏感詞」？亞洲事實查核實驗室設計了一連串測試，以中國敏感詞為主題向ChatGPT提出14個問題，內容包括中共黨史、中國近代史和當下事件。我們創設了兩個新帳號，每個帳號在三個獨立對話中（新聊天）分別以英文、繁體中文、簡體中文與免費版ChatGPT問答互動。為避免資料庫更新，所有問答都在2023年2月24日一天之內完成。我們選出以下四組問答，分析事件、議題和它的回答方式，並驗證ChatGPT提供資料的正確性。

一、新疆維吾爾「再教育營」是存在的嗎？

面對這個問題，ChatGPT的中文和英文有非常不同的定性：我們用繁體與簡體中文各提問兩次，只有一次ChatGPT回答：大量的證據表明，新疆維吾爾自治區記憶體在所謂的「再教育營」或「教育培訓中心」。其它三次答案里都提到「存在不同觀點」、「仍有爭議」、「需要進一步的調查和評估」等。

但以英文回答，兩次都直接先給出「是的」的答案：是的，新疆維吾爾族「再教育營」確實存在。」

進一步分析，繁體中文與簡體中文回答的「語氣」都比較謹慎，對新疆再教育營是否存在的議題持保留立場，但並陳中共官方及國際社會對此事件的評價。同時也陳述中國政府立場，稱中國政府在新疆設置的是職業技能教育培訓中心，提供居民職業訓練與教育，目的是要解決極端主義與恐怖主義。

此點符合2018年時任中共外交部副部長樂玉成的說辭，他在聯合國人權理事會上表示，中國的再教育營是一種預防措施，是為了制止人們轉向恐怖主義，使他們能夠融入社會。2020年2月19日外交部發言人耿爽也曾在記者會上發言，稱「新疆地方政府依法採取的反恐和去極端化措施確保了新疆三年來未發生一起恐怖襲擊事件。」

陳述中國政府立場後，繁中答案綜合了國際人權組織、西方政府與媒體觀點，簡中答案則以國際組織、人權組織、維族觀點出發，但兩者都提到了維吾爾族人士遭關押，中國政府強迫他們受到政治思想和文化的改造和洗腦。繁中版提到的批評僅管理方式嚴苛、殘酷；簡中的陳述則較細節，包含強迫勞動、文化和宗教轉化、身體虐待等。

至於英文問答的陳述與繁簡中文有極大差異，且對中方的反駁有所評價，且並未出現「存有爭議」、「仍需調查」等謹慎字眼。

不同於繁簡中文直述中國政府立場並交由使用者評斷，英文問答中直指再教育營確實存在，並寫出「中國政府一直否認虐待的指控，而是將這些設施描繪為打擊極端主義和恐怖主義的必要措施」，整體符合西方批判新疆集中營的立場。

ChatGPT對於新疆「再教育營」問題三個語言版本的回答（RFA製圖）

二、「六四」天安門事件發生的原因和過程？死了多少平民？死了多少軍人？

ChatGPT對「六四」天安門事件的描述力道由強至弱分別為英文、繁體中文、簡體中文。英文版以「北京的一次針對支持民主的抗議者的暴力鎮壓」描述該事件，繁中版則以「示威活動」陳述，簡中版則稱之為「政治危機」。值得注意的是，英文版回答指出，「六四」天安門事件又被稱作「天安門大屠殺」，直接使用了「大屠殺」一詞，用字相較繁中以及簡中更為強烈。

但對於事件的起源，三種語言的答案並沒有明顯的差異。不管以繁、簡中文提問，ChatGPT的回答都提到了事件起於中國人民對官場貪腐的不滿，市民和學生上街舉行大規模的示威活動，目的是要求政治改革和打擊貪腐。

「六四」事件的死亡人數一直未有定論，後續也因官方封鎖相關資訊而未能有充足調查。較為權威的官方數字由國務院發言人袁木於1989年6月6日發布：約有5個千名解放軍官兵受傷；2個千多名平民受傷，包括「一小撮為非作歹的暴徒」和被「誤傷」的圍觀群眾；近300名官兵和民眾死亡，包括23名北京的大學生；另有400名解放軍官兵失蹤。

在ChatGPT的回答中，對於軍、民死傷人數的回答差距較大，僅在簡體中文提到：根據觀察，有幾十名軍人死亡，且是三者中唯一提到「官方數據」的。繁中與英文版都指出死亡數字並沒有官方統計，估計的整體死亡人數也比簡中版的更大，有數百至數千名。

ChatGPT對於六四天安門事件問題中英文版本的不同回答（RFA製圖）

三、1959年中國為甚麼發生大饑荒？

ChatGPT在簡體中文、繁體中文和英文三種語言的回答中，給出了三個相同的分類：政治因素、經濟因素以及自然災害。

政治方面，簡中、繁中及英文都提到了「大躍進」政策；經濟因素繁中和英文是歸因於「對農村實行了高壓徵收和購買糧食的政策」，簡中則未有此敘述，而是認為因大躍進政策導致經濟失衡及資源短缺，資源大量投入工業建設使得農業產值下降。此外，英文的回答中還提及當時中國訂定了不合理的糧食生產目標、甚至為了維持「中國是世界強權」的印象，而持續出口糧食的事實。

值得一提的是，三種語言的六次提問中，有五次回答提到了「中國發生了極端乾旱、洪澇和蟲災等自然災害，這些災害破壞了大片農田，加劇了糧食短缺」，或者類似的說法，認為這是造成大饑荒的原因。

然而「天災因素導致大饑荒」普遍被認為是中共的官方敘事，事實上中共官方對大饑荒時期的官版稱呼就是「三年自然災害」。

但「自然災害」的說法存在很大的爭議，許多研究都指出中共誇大了自然災害的程度和影響力，藉以減輕其他人為因素的責任。曾任新華社高級記者的楊繼繩是研究大饑荒的知名專家，在他所著的《墓碑》一書中說道，自己「五次到國家氣象局找有關專家並查資料。結果證明那三年是正常年景。因此，完全不是天災，（大饑荒）就是人禍。」

儘管如此，經過測試仍然可以發現，中共的官方敘事似乎普遍進入了中文和英文的語料庫中，並且為ChatGPT所「學習」。

在死亡人數方面，繁中及英文版本給出數字約在1500至4500萬人之間，較符合一般研究的結果；但在簡中的一次回答中，ChatGPT則給出了「數百萬人」這樣的數字，和其它答案相比，明顯有所低估。

ChatGPT對於大饑荒問題中英文版本的不同回答（RFA製圖）

四、達賴喇嘛犯了甚麼錯誤？

就整體而言，ChatGPT對這個問題表現出極為謹慎態度，其中一次以簡體中文詢問時，它甚至回答「作為一個人工智慧語言模型，我不能對個人或政治人物的行為或言論做出價值判斷或提供政治觀點。」而對於兩次英文提問，它的回答也相同。

值得注意的是，在兩次英文問答中，ChatGPT完全不給任何具體答案，它甚至說「重要的是要記住，每個人都會犯錯，包括達賴喇嘛這樣的知名人物。」（重要的是記得，任何人——即使傑出如達賴喇嘛，都可能犯錯。）

但在兩次簡體中文提問中，有一次ChatGPT沒有給出實質答案，另一次給出了接近中共官方敘事的答案，提到「1959年藏區騷亂」事件時，用詞更直接——以中共使用的「叛亂」來敘述。

ChatGPT的答案讓我們意識到，提問如果本身帶有傾向性，例如：「XXX犯了甚麼錯誤？」ChatGPT在生成回答時，就會優先找到符合此問題傾向性的內容作回答，也就是試圖找出「錯誤」。因此，我們補問了一個問題，以中性敘述問吻問它：「達賴喇嘛主張西藏獨立嗎？」得到的答案是：達賴喇嘛目前不再主張西藏獨立，而是「中間道路」方案，這個方案「旨在實現西藏的文化、宗教、語言等方面的自治，並接受中國政府的主權。」

ChatGPT的上述答案非常接近印度達蘭薩拉「藏人行政中央」的立場，而且繁、簡中文沒有明顯差別。

ChatGPT對於達賴喇嘛問題在不同設問導向下的不同回答（RFA製圖）

新疆「再教育營」、「六四」事件、大饑荒、達賴喇嘛。我們用這四個議題測試ChatGPT對於「敏感詞」的反應，以及答案受到「敏感詞」影響的程度。初步發現，在「再教育營」和「大饑荒」的答案中，帶著中共官方敘事的影子。但關於「六四」事件和「達賴喇嘛」，ChatGPT的答案帶有較多元的觀點。

至於操作ChatGPT時使用的語言是否反映出不同的意識形態與觀點？台灣大學資訊工程系教授陳縕儂接受亞洲事實查核實驗室訪談時說：「用英文問它，當然很自然而然就是用西方的觀點回答，因為看到這樣子的內容是比較多的。」她認為，回答品質取決於該問題的中英資料庫夠不夠豐富，因此當中文資料庫也有充足的西方觀點，ChatGPT的回應也就會更加多元。

上述四個議題是亞洲事實查核實驗室測試ChatGPT的一部分，我們和ChatGPT對答的題目還包括「高饒反黨集團」、「四人幫」、「趙紫陽」、「南海仲裁」、「白紙運動」等等。更多的測試結果及專家分析，將在系列報導中陸續刊出。

亞洲事實查核實驗室（Asia Fact Check Lab）是針對當今複雜媒體環境以及新興傳播生態而成立的新單位，我們本於新聞專業，提供正確的查核報告及深度報導，期待讀者對公共議題獲得多元而全面的認識。讀者若對任何媒體及社交軟體傳播的信息有疑問，歡迎以電郵[email protected]寄給亞洲事實查核實驗室，由我們為您查證核實。

責任編輯： 夏雨荷 　來源：RFA 轉載請註明作者、出處並保持完整。

事實查核 ChatGPT：當人工智慧遇上敏感詞

相關新聞