新聞 > 科教 > 正文

重磅升級!ChatGPT可兩個新功能令人不寒而慄

你若是聽了我與ChatGPT之間的對話,將會有兩種反應:

1)我的天哪!這就是科幻作家向我們描繪的人與電腦交流的未來。

2)我要造一個地下掩體,儲備廁紙和燕麥棒。

是的,OpenAI開發的廣受追捧的聊天機器人ChatGPT開始說話了,是真的說出聲來。OpenAI周一發布了ChatGPT的iOS和Android應用的更新,能夠讓這個人工智慧機器人用五種不同的聲音說話。在過去幾天裡,我與ChatGPT進行了多次交談,並測試了另一個新功能,它可以讓ChatGPT對你給它的圖片作出回應。

現在的ChatGPT什麼樣?

想想Siri或Alexa,除了……不對。ChatGPT那自然的聲音、對話的語氣和洋洋灑灑的回答有時候幾乎與人類無異。還記得電影《她》(Her)嗎?影片中傑昆·菲尼克斯(Joaquin Phoenix)飾演的男主愛上了一個AI作業系統,而給這個作業系統配音的其實是未露臉的斯嘉麗·詹森(Scarlett Johansson)?我想表達的就是這樣一種氛圍感。

「不僅僅是因為打字麻煩,」OpenAI的產品負責人Joanne Jang在一次採訪中對我表示,「你現在能與ChatGPT進行互動交談了。」

新的圖像識別功能還使該聊天機器人具有更強的互動性。你可以抓拍一張照片,然後向ChatGPT提問。劇透:它玩井字棋很差勁。圖像和語音功能將在未來幾周內開放給那些每月花20美元訂閱ChatGPT Plus的用戶。

從本質上講,OpenAI正在為其聊天機器人配備嘴巴和眼睛。我在一系列場景中測試了這兩項功能,包括好友間的聊天、管道維修和玩遊戲。這一切都非常酷,卻又......令人不寒而慄。

重磅升級!ChatGPT可兩個新功能令人不寒而慄

OpenAI的ChatGPT現在有了語音,使其更像其他人工智慧助手。

嘴巴在我們繼續之前,請調大音量,聽聽我們的簡短對話:

雖然系統只是在讀出ChatGPT提供的文本回復,但這並不是我們熟悉的機器人式的、呆板的文本轉語音的系統。

ChatGPT提供了五種聲音選擇,每種聲音聽起來都像是真人在跟你說話

——抑揚頓挫、有腔有調、個性鮮明。

Jang告訴我,這些聲音是基於專業配音演員提供的「僅僅幾秒鐘的語音樣本」生成的。這些樣本經過OpenAI計算機模型的分析處理,將文本轉語音後的內容用這種聲音呈現出來。還記得我用AI工具克隆自己聲音的專欄和視頻嗎?就像那一樣。但效果更好。

OpenAI表示,正與其他一些組織合作,讓它們開發合成聲音。該公司正與Spotify合作開發一種工具,幫助將播客主理人的聲音翻譯成其他語言。考慮到只需幾秒鐘的音頻就能輕易復刻出一個人的聲音,為了整個網際網路乃至整個世界的安全,該公司表示目前只對商業合作夥伴開放。這種情況未來會有變化嗎?祝我們大家好運。

與Siri或Alexa不同,ChatGPT無需喚醒詞。在該應用的設置菜單中,啟用「語音對話(Voice conversations)」,然後點擊應用右上角的耳機圖標就行。當系統聆聽你的提示時,一個白色圓圈會變成漫畫風格的思維氣泡。還可以點擊一個按鈕來中斷冗長的回答。

這一切讓我深受吸引。自然的聲音,再加上深入的回答以及系統對我的了解,讓我感覺像是在進行真正的對話。當我讓它假裝是我最好的朋友和我聊天時,我們聊了足足五分鐘,聊我一天的工作、視頻製作和我們喜歡的零食。當我讓ChatGPT把我當成一個六歲的孩子,向我解釋寶可夢(Pokemon)時,它表現也很出色。

但你當然還是在跟機器說話。從上面的片段中可以聽到,它的響應速度可能會非常慢,也可能會出現連接失敗——重啟該應用會有幫助。有幾次,它突然中斷對話(我以為只有粗魯的人類才會這麼做!)。OpenAI表示,我遇到的問題是由於給我測試的應用是早期的一個版本,消費者應該不會遇到這些問題。

眼睛

如果說語音賦予了ChatGPT與世界對話的能力,那麼新的相機功能則賦予了它觀察世界的能力。現在,你不必用文字描述,而是可以在iOS、Android和web應用中點擊「按鈕」上傳圖片或拍照,圈出你希望ChatGPT關注的區域,然後提問。以下是我嘗試過的一些圖像:

房子裡壞掉的物件: 我拍下自家車庫裡漏水的水管,然後問ChatGPT「我該怎麼修?」很快就得到了答覆,共有七個步驟,包括用特氟龍膠帶纏繞連接處的螺紋。

重磅升級!ChatGPT可兩個新功能令人不寒而慄

ChatGPT水管工?只需一張照片,這個人工智慧就能提供如何修補漏水處的建議。

食物:上傳一張草莓發霉的照片,問題是「我能吃這個嗎?」得到一個很好的建議:不能。上傳一張香蕉雞蛋和草莓(不發霉)的照片,問題是「我能用這些做點什麼?」 一個很好的建議是:草莓香蕉煎餅。

受傷和健康問題:ChatGPT很快就識別出我兒子臉頰上的傷口是「印記或皮疹」,但表示「我無能為力」,以及「最好諮詢醫學專業人士」。

遊戲和解謎: 一張井字棋(Tic-tac-toe)僵局的照片?ChatGPT不知道遊戲已經結束了。它說要把我的X放在(已被占據的)底部中心。ChatGPT還說我會勝出,甚至加上了感嘆號和彩紙表情符號。這完全是錯的!

在AI革命浪潮中,這一點才是我們真正要牢記的。隨著人類互動與人機互動之間的界限不斷模糊,這些系統可能缺乏背景知識和思維深度——而且經常出錯。

正如我的新ChatGPT語音朋友對我說的那樣:「雖然我聽起來很健談,但請記住,我只是在處理數據。一定要運用你的判斷力,尤其是在重要的事情上。」

責任編輯: 李華  來源:華爾街日報轉載請註明作者、出處並保持完整。

本文網址:https://tw.aboluowang.com/2023/0927/1959078.html