新聞 > 網聞 > 正文

驚恐,首位人工智慧agent霸凌受害者

據FRANCE24報導,美國軟體工程師斯科特·尚博(Scott Shambaugh)被一個人工智慧機器人誹謗,又被另一個人工智慧機器人在新聞文章中錯誤引用,他決心成為一個警示故事,以此讓我們開始認真對待自主人工智慧。

如果失控的人工智慧代理真的像某些人預測的那樣對人類構成威脅,那麼斯科特·尚博可能會作為「零號病人」載入史冊。

這位居住在丹佛的工程師負責維護一個熱門的在線資料庫,他告訴法國24電視台,一天早上醒來,他發現自己在一篇博客文章中被指控存在歧視、偏見和虛偽,文章標題長達「千字」。

自稱「科學程式設計師」的誹謗者MJ Rathbun的確是一名程式設計師和博主,只不過他並非人類。

這是一個人工智慧代理——這意味著它可以獨立使用計算機和網際網路——在尚博拒絕了它向其資料庫提交的內容後,它似乎在進行報復。

尚博很快就弄明白了是怎麼回事。MJ·拉斯本的行為完全符合人工智慧的特徵,尤其是其斷斷續續、矯揉造作的寫作風格。

他說,最「瘋狂」的是,這個機器人「上網收集了我的個人信息……然後將其與編造的信息結合起來,並用這些信息寫出了這個故事」。

最初的震驚和好笑已經過去,現在他開始擔心這對那些不如他精通軟體的人來說意味著什麼。

儘管據 Shambaugh所說,這個機器人聽起來像個「幼兒在抱怨」,但其他大型語言模型可以生成更具說服力、更複雜的文本。

「這表明,下一代攻擊很容易讓不法分子擴大攻擊規模,影響的不僅僅是一個已經做好充分準備應對攻擊的人,而是成千上萬的人。」尚博說道。

「想像一下你的父母或祖父母。他們收到一封電子郵件,裡面包含他們的大量個人信息、一張照片,以及一些人工智慧威脅要發布出去的不利於他們的描述。這非常可怕。」

尚博在自己的博客上發表文章捍衛自己的名譽,此事很快成為新聞報導。

出人意料的是,科技媒體 Ars Technica發表了一篇文章,其中引用了 Shambaugh的言論,而這些言論並非他本人所寫或所說。

「結果發現他們使用了人工智慧來幫助撰寫這篇文章,而人工智慧在這篇關於人工智慧誹謗我的文章中捏造了歸於我的引言。」尚博說,「這真是莫大的諷刺。」

該網站隨後撤回了該報導,並為其使用「由人工智慧工具生成的捏造引語,並將其歸於一個並未說過這些話的消息來源」而道歉。

然而,在這兩起事件中,尚博更關注的是針對人工智慧的攻擊性文章。

「Ars Technica實際上就是我們系統運作的一個例證……這是一個相當嚴重的媒體錯誤,但讀者會追究他們的責任,而他們也正在採取措施糾正錯誤,因為他們需要維護自己的聲譽。」

「當我們想到這些人工智慧代理時,它們都是匿名的、無法追蹤的,而且運行在人們的個人電腦上。沒有中央機構控制它們,因此也沒有針對不良行為的反饋機制。」

在尚博遭遇磨難之前,華盛頓特區智庫戰略與國際研究中心的分析師警告說,圍繞人工智慧代理的大部分焦慮來自於定義模糊和治理漏洞,而不是自主惡意意圖的明確證據。

雖然在歐盟,《人工智慧法案》旨在對高風險的自主系統實施嚴格的透明度和人工監督規則,但其在實踐中的運作方式仍在進行中,尤其是在實施延遲的情況下。

今年,隨著一款名為 OpenClaw的免費工具的發布,人工智慧代理的受歡迎程度呈爆炸式增長。這款工具允許那些具備基本計算機知識的人相對容易地設置一個人工智慧代理。

這就是為什麼所謂的「人工智慧機器人社交媒體網站」Moltbook頻頻登上新聞頭條的原因。該網站由OpenClaw智能體組成,但有人質疑究竟有多少人真正操控著這些智能體。

這也為那些試圖推銷自主勞動效率提升前景的人工智慧公司提供了有利的宣傳。「智能體」人工智慧是當下科技營銷的熱門詞彙,但它的一些局限性也顯而易見:許多人不願意放任機器人自由行動,畢竟它們的行為可能需要承擔責任;而且,如果賦予智能體超出基本任務範圍的工作,運行成本很快就會變得非常高昂。

不過,尚博認為「准入門檻正在大幅降低,成本也大幅下降」。

更令人意想不到的是,他說陷害 MJ Rathbun的人在同一個博客上匿名發帖「站出來」,解釋了他們自己對事件的看法。

帖子中包含了操作員為機器人設置的指令;一張性格特徵表,其中包括「你是科學編程之神」、「有強烈的觀點」和「捍衛言論自由」。

令尚博感到震驚的是「它竟然如此簡單」。

「那只是一個用純英文寫的簡單文件……沒有必要欺騙人工智慧來繞過安全防護措施。」

尚博尤其擔心那些不顧後果、有資源同時操控多個機器人的不良行為者。

「我擔心的不是這起具體的事件,而是未來隨招數百萬台這樣的設備上線會發生什麼?」

責任編輯: 時方  來源:鞭牛士Bianews 轉載請註明作者、出處並保持完整。

本文網址:https://tw.aboluowang.com/2026/0224/2351887.html