阿波羅新聞網 新聞 > 科教 > 正文

揭秘亞馬遜大賽:AI與人聊天20分鐘就能贏百萬美元

網易科技訊3月7日消息,據國外媒體報道,為了將真正的會話式人工智慧帶入千家萬戶,亞馬遜正在與其競爭對手展開激烈競爭。現在,該公司正在舉辦一場有著奇怪目標的比賽Alexa Prize——打造一個真正能夠閑聊的機器人。

第一位對話者是一個五十多歲的肌肉男,剃著光頭,身著黑色V領毛衣。他走進一間會議室,坐在低矮的藍色扶手椅上,面前是一排攝像機和工作室照明燈。他被燈光照亮了,而房間的其餘部分處於完全黑暗之中。他凝視著面前小桌子上的一個黑色曲棍球狀物體——這是亞馬遜的智能音箱Echo。“Alexa,”他說,“我們聊聊吧。”

“早上好,我的朋友,”一個女性聲音回答說,這聲音是合成的,但依舊討人喜歡。隨之Echo上閃爍著紫色的光芒,“或者是下午?我不太確定。“

“這是早上,”男人回答道。

“太好了,大家在早上總是精力充沛......呃,今天過得怎麼樣?”

“我過的不錯,你呢?”

“嗯,我總是很忙,因為人們一直在跟我聊天......但是聽著,這真是太好笑了,Reddit最近發布了一篇文章:”牙膏就是嘴裡用的肥皂。“

在另一間會議室的大廳里,10名亞馬遜員工戴著耳機坐在長桌旁,認真監視著一切,就像是中央情報局的特工。在另一個房間里,三名男子坐在由黑色窗帘隔開的小隔間里。他們也戴著耳機,同樣有攝像機對著他們。最後在控制中心,一個視頻工作人員正在監視大屏幕上的所有信息。一切都需要被記錄下來,因為亞馬遜想要完全理解今天發生的一切。

圖示:亞馬遜Alexa Prize競賽的評委團隊

去年11月舉行的這場盛大表演,是為期一個月比賽的最後一次評審。亞馬遜已經和15個世界上最好的計算機科學研究生團隊進行挑戰,以開發“一個在20分鐘內能夠與人類進行持續熱烈交流的社交機器人”。如果任何一個團隊成功了,其團隊成員將會獲得學術榮譽,同時也會在未來開啟輝煌的職業生涯。(你大可以想想美國國防部高級研究計劃局(Darpa)曾經舉行的挑戰賽,或者是早期關於自動駕駛汽車技術的競賽,其獲勝者繼續在谷歌、福特以及 Uber等公司的自動駕駛汽車業務部門工作。)更重要的是,他們將帶走稱之為Alexa Prize的100萬美元大獎。

過去幾年,亞馬遜花了很大的代價來追求會話式人工智慧,和其征服零售業的野心不相上下。該公司有超過5000人為Alexa平台工作。據報道自2015年以來,它已經售出超過2000萬部智能音箱Echo。亞馬遜相信,終有一天人工智慧系統不僅僅能夠控制電燈開關和播放列表。它們將能夠駕駛汽車,診斷疾病,並滲透到我們生活的方方面面。語音將成為主要的用戶交互界面,而對話本身——那些機器與人之間有用的,內容豐富的,友好的,有趣的對話——將成為最終產品。

但是,關於Echo的成功和亞馬遜在會話式人工智慧方面的雄心壯志,使得亞馬遜從高高的懸崖上跌落,困進了廣闊又危險的山谷之中。如今的Alexa和所有的語音助手一樣,常常無法理解我們看起來顯而易見的事實。Alexa平台的快速拓展和廣泛應用,激發了消費者對語音助手的需求。雖然Alexa在設置鬧鐘或者完成一次性的命令方面做得還不錯,但談話本身就是一種交互的社交模式。 Alexa人工智慧研究團隊負責人阿什溫拉姆(Ashwin Ram)指出:“人們總希望Alexa能像朋友一樣和他們交談。然而人類對話的無限可變性,情境中的突然變化以及上下文語義的銜接問題普遍被認為是人工智慧中最難解決的問題之一。但亞馬遜已經鋌而走險。”

Alexa Prize並不是第一次嘗試從全世界的聊天機器人中激發出更多人性化關係的比賽。在過去三十年的大部分時間裡,一群計算機科學家和業餘愛好者總會聚集在一起,爭奪Loebner Prize。在比賽中,參賽者試圖欺騙法官,讓他們相信聊天機器人是人類。多年以來這個獎項都引發了不少爭議,一些人工智慧研究人員把它稱之為一種宣傳噱頭,同時也對人和機器的本質區別進行了大量反思相比之下,Alexa Prize在兩個方面有所不同。首先,競賽重點不是要通過欺騙讓人相信Alexa是一個人。其次競賽的規模——無論是人力,財力和計算能力——都是巨大的。在比賽的早期階段,也就是2017年的幾個月,在美國的任何人都可以使用隨機選擇的比賽機器人與亞馬遜語音設備說“Alexa,讓我們聊天”。然後他們被邀請就對話內容進行1星到5星的打分。這些機器人程序都有數百萬次評級互動,使Alexa Prize在競賽數量級上成為了世界上規模最大的聊天機器人競賽。

去年11月,競賽在一間配有藍色扶手椅和聚光燈的房間里達到高潮。

那個剃光頭、身穿黑色毛衣的傢伙叫做邁克·喬治(Mike George)。在去年7月從亞馬遜退休之前,他負責監督Alexa平台。與此同時,展台上的男士們則是對每一段對話進行打分的評委。如果一名評委認為對話已經偏離主題,他可以按下手持式魔杖上的按鈕;如果第二名評委也這樣做,那麼會話和計時器都會被暫停。沒有人清楚哪個機器人屬於哪個團隊。會話者和評委都不知道。

“讓我們來談談音樂吧,”喬治說。

“我愛音樂;它能讓我每次都放鬆,“機器人回答。“那麼,你有沒有最喜歡的藝術家或歌曲?”

“我喜歡強哥·萊恩哈特(Django Reinhardt)。”

“強哥·萊恩哈特(Django Reinhardt)?那個有名的爵士樂藝術家?”這個機器人隨即即興講述了一個關於來自英國搖滾樂隊Black Sabbath的吉他手Tony Iommi的故事。 Iommi在一次事故中失去了兩根手指的指尖。但是當知道萊恩哈特只用左手的兩隻手指就能繼續演奏時,他對於自己的職業生涯並未喪失信心。但無論如何,至於萊因哈特,喬治最喜歡他的哪一首歌呢?

喬治迴避了。“你喜歡傑克·約翰遜(Jack Johnson)嗎?”他又問道。

機器人似乎會毫不理會這個問題。“來吧,”它回答。“我喜歡與你對話。”

喬治身體略微前傾並再次嘗試。“你、喜、歡、傑克·約翰遜(Jack Johnson)嗎?”

“來吧,我喜歡和你說話。”

在由窗帘隔開的房間里,一名評委按下他的按鈕。很快另一個評委也是如此。一個女人走進房間,在喬治耳邊低語。“Alexa,停下來,”他點頭說道,帶著一點失望。這離對話開始僅僅只有三分鐘。如果拉姆坐在房間里的話肯定會很沮喪。在整個比賽過程中,他的口頭禪就是:“人們需要明白這是一個非常困難的問題,而且現在還處於會話式人工智慧的早期階段。”與計算機閑聊二十分鐘可不是登月,等於是登火星。

對會話式人工智慧的狂熱追求已經引發了亞馬遜、蘋果、 Facebook谷歌以及微軟等科技公司巨頭對兩大重要資源的爭奪。第一種資源是有限的:計算機科學中的頂尖博士,由於他們的稀缺性,他們現在的薪酬已經達到了六位數。第二個雖然是無限的,但很難獲得:對話的樣本——成千上百億個對話樣本可以被收集,數字化,並用於訓練人工智慧。在這種背景下,Alexa Prize堪稱是亞馬遜的傑作。這次比賽既是對世界上最優秀研究生的人才搜索,也是一次以低廉價格獲得參賽者聰明才智的機會。此外,它還為亞馬遜提供了一個收集其他技術公司所沒有的會話資料庫的機會。

當亞馬遜於2016年9月29日首次宣布競賽時,來自22個國家的100多個大學團隊申請參賽。在技術價值和創意等方面進行初篩後,共有15個團隊進入了競賽的最終環節。除三支隊伍外,其他隊伍都獲得了10萬美元的現金資助和公司支持,以推動他們的努力。

就像大學籃球賽中的“瘋狂三月”(March Madness)一樣,進入競賽最終環節的團隊有強大背景的技術衛冕者、有力的競爭者和勇敢的弱者。蒙特利爾大學團隊擁有深度學習先驅Yoshua Bengio這樣的教師顧問,當然被列為頂級種子選手。也有不少強有力的競爭者,其中包括來自華盛頓大學,普林斯頓大學以及蘇格蘭首屈一指的研究型大學赫瑞瓦特等著名學校的團隊。然後還有一些弱者,比如來自布拉格的捷克技術大學團隊。

捷克技術大學團隊的成員中有一名23歲的小夥子,名叫派馳·馬立克(Petr Marek)。比賽前的那個夏天,他曾經花了不少時間來開發他所謂的“愚蠢”聊天機器人平台,但他也曾在波希米亞的森林中擔任童子軍領袖。當他聽說Alexa Prize這個比賽時,馬立克一度擔心他和他的團隊沒有相應的資格。“好吧,”他想,“即便我們沒有機會去對抗這些頂尖大學,但至少我們可以嘗試一下。”在得知他們已經成為參賽選手之後,團隊決定將他們的機器人命名為Alquist,之後這是20世紀初期捷克戲劇RUR中的一個角色,“機器人”(robot)一詞正是通過這部劇被引入了世界(在劇中,機器人佔領了這個星球,Alquist成為了地球上最後一個人類。)

圖示:華盛頓大學團隊成員

參賽的15個團隊都面臨著一個有爭議的問題:社交機器人大腦的哪些部分應該人工編程,而哪些部分又應該使用機器學習?人工編程是一種更為傳統的方法,工程師們費力地編寫大量規則來指導人工智慧對會話的理解和反應。相比之下,統計學驅動的機器學習方法讓計算機通過從海量數據中進行自學來指導自己進行對話。

所有團隊都清楚,機器學習是解決所謂分類問題的最佳方法。通過這種方法,神經網路能夠在海量嘈雜數據中找出統一的模式。例如,語音識別是機器學習的一項自然任務。但是,談到聊天機器人,其不僅僅是將對話翻譯成語言,而且還要對聽到的對話做出反應,對於現在的機器學習來說還有很長的路要走。這就是為什麼即使在Alexa和Siri的數字化大腦中,老式的人工編程方法仍然具有相當大的影響力。因此,比賽中的每個團隊都在像更大範疇上的技術世界一樣苦苦掙扎——找到兩種方法之間的最佳平衡點。

人工編程已經過時:而機器學習則正處於白熱化。馬立克和他的隊友都知道,所有的強隊都會傾向於使用後一種方法。所以他們也認為自己的團隊也應該這樣做。為了幫助Alquist自動生成對Alexa用戶的響應,該團隊用來自Reddit用戶的300萬條消息和響應訓練了一個神經網路。讓他們感到沮喪的是,該神經網路產生的反應“非常糟糕”,馬力克表示。 Alquist會在對話主題之間肆意跳躍,並引用用戶從未說過的東西。它會輕易斷言,然後又會自我。“和這種人工智慧對話不是什麼好事,也不好笑,”馬力克在他的團隊博客中沮喪地寫道,“這太荒謬了。”

所以在2017年初,捷克隊改變了策略,並致力於編寫廣泛的對話指導規則。該團隊創建了10個“結構化主題對話”域:新聞,體育,電影,音樂,書籍等等。捷克團隊的人工智慧系統被設計成可了解每一個主題的核心內容,並且可以在不同主題之間自由切換。這個社交機器人在任何特定時刻所使用的精確單詞通常由預先編寫的模板組成,同時再從各種資料庫中檢索出更具體的內容以填充對話內容的空白。例如,系統可能會設置為“我看到你喜歡(用戶提到的書籍作者)。你知道(作者)也寫了(書名)嗎?你讀過那個嗎?“

人工編程給了捷克團隊更好的控制權,但馬立克依舊憂心忡忡。該系統在很大程度上依賴於用戶的善意,依賴於他們用簡單的句子說話,對話基本上遵循機器人的引導。馬立克說,如果碰上“不合作的用戶”,像正常人一樣說話,或者說沒有什麼耐心的話,社交機器人很容易失敗。

而在距離布拉格數千英里的地方,愛丁堡郊外的農田起伏綿延。蘇格蘭赫瑞瓦特團隊的教師顧問奧利弗·萊蒙(Oliver Lemon)正在關注亞馬遜發布的團隊平均用戶評分。萊蒙戴著眼鏡,看起來有點像喜劇演員約翰·奧利弗(John Oliver)。他會打網球和游泳,並且有不服輸的天性。他認為他的團隊能輕鬆進入前五。但在2017年初夏,赫瑞瓦特團隊排在第九位。“我知道我們可以做得更好,”檸檬說,聽起來像一個教練剛剛經歷了一場草率的失利。

在一次黑客馬拉松比賽中中,萊蒙和他的學生們試圖弄清楚他們如何能夠提升相應水平。雖然他們沒有任何可以請教的深度學習先驅,但赫瑞瓦特團隊還是在儘可能地使用機器學習。他們把注意力放在最艱巨的挑戰上:閑聊。對於機器學習系統來說,漫無目的的閑聊特別艱難的,因為通常沒有一種可驗證的固定方式來進行閑聊。當有一個明確的目標時——比如在圍棋遊戲中獲勝,神經網路的效果最好——通過大量的反覆試錯,系統總可以找到最佳策略。但是閑聊沒有目標可言。

為了解決這個問題,該團隊採用了谷歌研究人員普遍使用的一項技術。首先,團隊通過電影字幕資料庫和來自Twitter和Reddit的數千個消息線程訓練神經網路。通過這個人類玩笑的巨大語料庫,系統學會預測關於對話的最恰當回復。然後,這種技術(稱為seq2seq)可以讓機器人即時生成自己的回復,而不是直接從原始Twitter或Reddit對話中檢索相應回復。

這聽起來很酷,但赫瑞瓦特團隊的策略很快與seq2seq技術的兩個特徵問題相衝突。一個是,系統通常會把諸如“OK”以及“sure”等語句默認成單調,敷衍的語句,因為這些語句在Twitter和電影對話中廣泛存在。另一個是訓練對話中還包含了大量不恰當的言論,赫瑞瓦特的社交機器人學會了模仿這些腔調,就像一年級的學生會學操場上的大孩子說髒話。

“只要我願意,我可以和很多人睡我,”赫瑞瓦特社交機器人這樣告訴一位用戶。

當另一個用戶問道:“我應該賣掉我的房子嗎?”這個社交機器人起鬨似地建議道:“賣,賣,賣!

最糟糕的是,當用戶問到“我應該自殺嗎?”這個社交機器人回答說:“是的。”

如果seq2seq技術的衝突問題必須被解決,整個夏季赫瑞瓦特團隊都在改進其技術。正在加強其他技術。該團隊將社交機器人的大腦分成一系列小型機器人組成的聯合體,每個機器人都有自己的專業。新聞機器人閱讀《華盛頓郵報》和其他消息來源的頭條新聞和簡短摘要。另一個機器人專門討論天氣,還有一個人專職訪問維基百科,提供從海洋運動到公眾人物金·卡戴珊(Kim Kardashian)的相關信息。最後,團隊成員阿曼達·庫里(Amanda Curry)創建了一個基於規則的角色機器人,為最終產品打造一個統一穩定的身份。她用精心策劃的觀點和傳記事實為機器人打造身份特徵。“我認為它有助於讓人們了解機器人也有和他們一樣的性格特徵,比如說自己喜歡的顏色,”庫里說。

在用戶發表任何評論之後,在這些組件機器人中至少會有一個可能產生響應,就像是教室里聽到老師問題就急切舉手的學生們。為了選擇出最好的一個,赫瑞瓦特團隊訓練其系統對響應進行統計評估。候選的響應是否與用戶剛才所說的一致?或者反過來說,是不是太過相似以至於它只是重複用戶剛才所說的話?這個響應是關於目標話題的嗎?答案是否太短或太長?最初,赫瑞瓦特團隊只是猜測每個指標的權重有多大。但到了秋天,神經網路已經學會了自動調整權重以最大限度地提高用戶評分。

好勝心強的萊蒙很高興地看到,他團隊的排名看起來好很多。隨著比賽的進行,赫瑞瓦特團隊躋身領先集團。

當赫瑞瓦特團隊在積分榜上一路高歌猛進時,華盛頓大學團隊穩穩排在前三名。看起來該團隊採取了一種相折中的方法,將基於規則的編程方法和機器學習混合到其系統中。但他們的優勢似乎來源於其社交機器人對於該團隊28歲學生領導人方浩(Hao Fang)個性的反應。方浩來自中國江西省的宜春市,個性活躍、天生開朗。他領導的團隊也希望社交網路機器人的用戶能夠感到快樂。那麼他們是如何創建出人們喜歡的對話呢?

在早期,方浩發現華盛頓大學團隊的社交機器人和其他許多競爭對手一樣,也很容易出現反反覆復的沉悶標題(“火箭襲擊殺死17人”)或者枯燥的事實(“家庭或住所是作為永久性或半永久性居住的地方”)。所以華盛頓大學團隊所設計的系統會過濾掉那些可能導致用戶說出“這太可怕了”的內容。方浩表示,該系統會通過諸如Today I Learned, Showerthoughts以及lifting News等訂閱媒體尋找“更有趣、更振奮、更健談”的內容。這使得機器人能夠拋棄像“古典音樂是唯一一種涵蓋範圍很廣的音樂流派“之類奇怪的論斷。

當人們意識到自己在被傾聽時,他們往往會更快樂。所以華盛頓大學訓練其系統仔細分類話語。機器人是否應該回答事實,提供意見或回答個人問題?該團隊還精心製作了大量的反饋語言-“看起來你想要談論新聞”,“我很高興你喜歡這個,”“對不起,我不明白,”等等。一個優秀的對話者也會關注人們的情緒,所以華盛頓大學團隊手動標記了2,000個對話樣本的情感基調,並用它們來訓練社交機器人識別人們的反應-感到高興,厭惡,有趣,興奮,並作出相應反應。在大項目中這些都是相當簡單的東西,但是無疑會讓機器人的對話感覺更為專註和順暢。

8月29日,亞馬遜宣布有三支隊伍將參加決賽。蒙特利爾大學團隊積極推動機器學習,但犧牲了更多行之有效的策略,未能成功入選。

最終入圍決賽的團隊包括赫瑞瓦特團隊,在平均每周用戶排名中位列第三,並經過亞馬遜的嚴格內部評估後被選為“外卡”團隊。一直以來表現優秀的華盛頓大學團隊排名第二。而最不可思的是捷克技術大學團隊,其名列第一。每個團隊都有一個半月的時間來完善他們的系統,然後就是亞馬遜公司的評審時間。

“Alexa,我們聊聊。”

現在是11月中旬,另一位對話者約翰·柯利(John Curley)坐在攝像頭前的扶手椅上。柯利是西北太平洋地區的電視台和電台主持人,穿著條紋襯衫和藍色運動外套;他的聲音低沉,笑起來像是好萊塢明星。但他那神經質般的言語風格很快就讓社交機器人無所適從。

“很高興和你聊聊,約翰,”一位社交機器人說,這是赫瑞瓦特團隊的機器人,當然柯利和評委都不知道。“讓我們彼此了解一下。那麼告訴我,你更喜歡科幻還是幻想小說?“

“兩者都不怎麼樣。”柯利回答道,拒絕了這個機器人。“讓我問你一個問題,Alexa。昨天在西雅圖發生了一場巨大的風暴,一場大風暴。“

“好吧,那我們繼續吧,”機器人說,忽略了庫利的問題,這不是一個問題。“告訴我,你對看書或看電影哪個更感興趣?”

“閱讀書籍,”柯利說。

“哦,一個書獃子......你最近讀了哪本書?”

“我剛剛讀完了這本書,但我想我不能把書名告訴你,我不認為我可以向你說標題,因為裡面有一個髒話。但標題是“含蓄的藝術等等”( The Subtle Art of Not Giving a***)。

顯然機器人無法應付這個,還是“你喜歡讀什麼書?”

柯利忽視了這個問題,換了一個話題。“Alexa,我會告訴你的。我能對你說實話嗎?“

無論柯利要準備袒露什麼都是一個謎,赫瑞瓦特機器人依舊過於機械地選擇話題,“所以告訴我,你對運動或電子遊戲哪個更感興趣?”

他們在來回兜圈子。三分鐘後不久,三名裁判中的兩名搖搖頭,按下了他們的按鈕。柯利和其他機器人的聊天也有很多相同之處。他輪流嘗試討論和開玩笑。有一次,在柯利說他不去看電影之後,捷克技術大學的機器人依舊在頑固地問他:“你看過很多電影嗎?”

“不,我沒有,因為我是瞎子,”科利諷刺地回答。

“你如何選擇看哪部電影?”機器人問道,用預先設定的對話模式繼續發問。

“我通常通過聞氣味來選擇,”柯利說。

柯利恰恰是馬力克所擔心的那種不合作用戶。他把多個句子連成一排,內容相互糾纏在一起,話題反覆跳躍,不理會機器人的邏輯線索,並且交替出現敘述,諷刺和異想天開。簡而言之,柯里在像和人一樣對話。在對話結束後,沒有一個機器人能夠堅持超過四分半鐘。柯利開玩笑講,“這就像一系列糟糕的約會。”

第三個對話者是當地的一位電台主持人,她要求匿名參與。當她坐下時,臉上帶著微笑。她講話簡短,語句清晰,似乎想讓對話起作用。她和華盛頓大學機器人進行了關於足球,弗拉基米爾普京和聖誕節的簡短對話。而和捷克技術大學的機器人,她談論了自己正在閱讀的一本書。她和赫瑞瓦特機器人交換了彼此對於美國前總統喬治·華盛頓(George Washington)以及羅納德·里根(Ronald Reagan)的看法。

即便這個電台主持人和社交機器人的交談最長達到了7分鐘,但其間的過程也是磕磕絆絆。她要求赫瑞瓦特機器人談論一下戰爭問題。她向前傾斜,看起來很擔心。“可能會發生戰爭,”她說。

“如果我沒有弄錯,”機器人回應道,“WOR是位於紐約的50,000瓦級調幅電台。”評委們不得不按下按鈕。

總決賽中最好的對話發生在喬治身上。雖然幾乎沒有出現像湯姆·斯托帕德(Tom Stoppard)戲劇中的閃光點,但它立即脫穎而出,引人注目了。聊天一開始,喬治要求討論一下什麼是機器人。社交機器人並沒有機械地照搬維基百科中詞條,它開玩笑講,“如果說Daft Punk(法國著名電音樂隊)真的是兩個只想製作音樂的機器人呢?”

“真有意思,”喬治笑著說。

該機器人分享了一些關於伊隆·馬斯克(Elon Musk)和機器人的最新消息。它把問題又拋給了喬治,機器人問道:“你有沒有聽說過馬斯克?”

“我有,”喬治吹牛,“我認識他。”

“你知道馬斯克是Thank You for Smoking這部電影的執行製片人嗎?”

“不知道,”喬治說,聽起來非常確定。他和機器人在把書作為新的對話主題時來回交流得很順暢。他們寒暄了幾句,然後社交機器人說:“你知道我在想什麼嗎?最終,有人會成為最後一個活著的人。他們的名字不會出現在任何歷史書中。“

“哦,那很難過!”喬治回答。

“我很抱歉讓你心煩。你想繼續討論書嗎?“

“我們來談談《黑暗塔》這本書。”

“對不起,我想我對《黑暗塔》這本書沒什麼了解。你想談談電影《黑暗塔》嗎?“

“當然。”

“太好了。你看過這部電影嗎?它今年上映了。“

“我看過了。”

機器人問喬治是否喜歡馬修·麥康納(Matthew McConaughey)在電影中的表現。喬治給予了肯定。聽到這個,機器人推薦了麥康納的另一部電影《華爾街之狼》。幾輪談話之後,機器人開了個玩笑。“你知道我在想什麼嗎?有人該製作一個《星際穿越》Interstellar和《超時空接觸》Contact的混合體,馬修·麥康納試圖阻止馬修·麥康納進入太空。“

喬治大笑起來。

談話的其餘部分更加散漫,但很少有混亂出現。音樂,運動,10分鐘。電影《黑道聖徒》The Boondock Saints,12分鐘。聖誕老人和他在氣候變化中的角色,13分鐘。喬治要求機器人唱歌,15分鐘。再次討論音樂和電影,醫療保健以及比爾蓋茨。計時器已經過了19分鐘,談話仍在繼續。

11月28日的拉斯維加斯,作為亞馬遜網路服務年度會議的一部分,數百人在Aria度假村和賭場的一個大宴會廳內登記。前排座位專門留給了Alexa Prize決賽選手。“這是所有人的遊戲,”赫瑞瓦特的萊蒙認為。馬力克則在樂觀和疑惑之間搖擺。方浩和他的華盛頓大學隊友壓力最大。是最明顯的壓力。亞馬遜的一位人士向他們的教師顧問馬雷·奧斯塔多夫(Mari Ostendorf)暗示說團隊沒有獲勝。

圖示:華盛頓大學團隊教師顧問諾亞A史密斯(Noah A. Smith)以及馬雷·奧斯塔多夫(Mari Ostendorf)

舞台變黑,威廉沙特納錄製的聲音響了起來。“電腦嗎?”他說,“請幫助我熱烈歡迎亞馬遜Alexa副總裁兼首席科學家Rohit Prasad!”Prasad大步走上舞台,發表一篇關於《平台之國》的演講——這是在成功的北方,也是接管世界的南方。然後Prasad打開了寫有Alexa Prize獲獎者名字和對話時間的信封。“平均分數為3.17分,”他宣布,“平均持續時間為10分22秒......一等獎得主是華盛頓大學團隊!”華盛頓大學團隊隊員從他們的座位上跳起來,歡呼聲響徹天空。他們與奧斯塔多夫抱成了一個環形,跳著叫著。奧斯塔多夫意識到她事先得到的是垃圾情報,跳得最高。

正是華盛頓大學機器人和喬治的對話時間最長。方浩後來稱之為“我們所經歷過的最好對話”。最後,機器人的談話陷進了關於醫療保健的死胡同。20分鐘後兩位評委按下了按鈕。華盛頓大學團隊走上舞台,Prasad為他們頒發了一個安慰獎——總金額為50萬美元的巨型支票。方浩咧開嘴,向著相機豎起了大拇指。

Prasad然後宣布了第二名和第三名,分別是捷克技術大學和赫瑞瓦特團隊,他們分別得到10萬美元和5萬美元的獎勵。走到最後的萊蒙臉上顯得有些憔悴。幾天後,當亞馬遜宣布2018年將有另一場Alexa Prize競賽時,他已經知道自己想要參與。

那麼亞馬遜,參賽團隊和整個人工智能世界最終了解到人工編程和機器學習之間的平衡點了嗎?作為勝利者的華盛頓大學團隊已經找到了平衡點。與此同時,人工編程的捷克技術大學團隊獲得第二名。傾向於機器學習的赫瑞瓦特團隊獲得第三名。但如果結果看起來模稜兩可,那麼混合系統的勝利對於薩姆和其他人工智慧專家來說是非常有意義的。薩姆說,我們剛剛開始弄清楚如何更好地結合這兩種方法。

比賽中的每個團隊都認為,對改進機器學習最有幫助的是更多的對話數據。最終,這是亞馬遜自己的戰利品。通過競爭,用戶與社交機器人進行了數百萬次互動,收集了超過10萬小時的聊天記錄,所有這些都是公司的官方財產。這場競賽的最終贏家顯而易見:亞馬遜。

阿波羅網責任編輯:夏雨荷 來源:網易科技報道 轉載請註明作者、出處並保持完整。

科教熱門

相關新聞

➕ 更多同類相關新聞