新聞 > 科教 > 正文

OpenAI 又要放大招了

今天凌晨,OpenAI宣布將於美國時間13日上午10點(北京時間14日凌晨1點)在官網直播,演示ChatGPT、GPT-4的更新內容。

據外媒The Information今日報導,OpenAI正在構建具備音頻和視覺理解能力的AI語音助手,其中一些功能已經開始向客戶展示,可能在下周的發布活動中預覽。

知情人士消息透露,OpenAI可能會在今年內完成GPT-5的開發並公開發布。此外,OpenAI還計劃推出一種新的定價模式,客戶通過預付費預定Token,最高可以享受50%的折扣。

此前有多家外媒和博主曝料,稱OpenAI將在近日發布AI搜尋引擎。其CEO阿爾特曼對此回應道:「不是GPT-5,也不是搜尋引擎,但我們一直在努力開發一些我們認為會得到喜歡的新東西。」

值得注意的是,其競爭對手谷歌的I/O開發者大會時間定在美國時間14日上午10點(北京時間15日凌晨1點),預計可能發布Gemini大模型的重要更新。OpenAI此次發布時間沒有定在之前外媒曝料的5月9日,而是「恰好」卡在I/O大會的前一天,火藥味可謂濃厚。

要知道,這已經不是OpenAI第一次「卡點」狙擊谷歌新品。今年2月,谷歌放出Gemini1.5 Pro大招,結果沒過幾個小時,OpenAI就掏出文生視頻「王炸」模型Sora,狠狠搶了Gemini1.5 Pro的風頭。

01.

AI語音助手仍存在「幻覺」問題

或將集成至ChatGPT免費版

據The Information報導,阿爾特曼的終極目標是開發出類似電影《她》(Her)中,可高度響應的虛擬助手,提升蘋果Siri等現有語音助手的可用程度。

OpenAI認為,具有視覺和音頻功能的AI語音助手具有像智慧型手機一樣的變革性潛力,理論上其可以做到一系列現在的AI助手無法做到的事,例如充當論文、數學問題指導老師,或是翻譯交通標識、幫助解決汽車故障等。

但類似的技術目前所需硬體門檻太高,無法在個人設備上運行,用戶可以在短期內使用基於雲的版本來獲取這些功能,例如自動化客戶服務Agent。

OpenAI目前已經推出具備音頻轉錄、文本轉語音等功能的軟體,不過這些功能是基於獨立的對話AI模型實現,而新的語音助手則將這些功能整合在一起。據知情人士透露,該AI語音助手的音頻功能能夠幫助客服人員更好地理解對方的語氣。

目前尚不清楚OpenAI何時向付費客戶提供這些新功能,但據試用過該語音助手的人士透露,OpenAI最終的計劃是將這些功能都納入ChatGPT免費版本,目標是比目前其最先進模型GPT-4 Turbo的運行成本更低。該人士還談道,AI語音助手在有些類型的問題上回答優於GPT-4 Turbo,但仍然存在幻覺問題。

對此,OpenAI發言人沒有回應置評請求。

02.

與谷歌競爭iPhone合作位

GPT-5或於年底前發布

OpenAI推出AI語音助手主要目標是與谷歌競爭。

谷歌的AI模型Gemini能實時響應語音命令,並識別圖像、視頻等。不過這些功能目前仍需要研究人員附以圖像和文字說明,且並不能理解許多傳統的語音指令,也不能像Siri和谷歌助手等傳統語音助手那樣與用戶對話。

▲谷歌展示Gemini多模態功能(圖源:谷歌)

另一方面,提高模型的視覺、音頻能力也有助於OpenAI與蘋果達成合作。

最近幾個月,蘋果與OpenAI就下一代iPhone作業系統如何整合OpenAI的模型進行了討論。然而,與此同時,蘋果也與谷歌進行著類似的談判。

這場競爭的最新消息是,據彭博社今早報導,蘋果已接近與OpenAI達成協議,將在下一代iPhone作業系統iOS18中使用ChatGPT;與谷歌尚未達成協議,但談判仍在進行中。

除了可能在下周推出的AI語音助手外,OpenAI還一直致力於構建一款AI搜尋引擎,旨在與谷歌競爭。此外,其也在開發一種被稱作「計算機使用Agent」的自動化軟體,用來輔助軟體開發和其他計算機任務。

阿爾特曼還在與iPhone開發者喬尼·艾維(Jony Ive)合作開發一款獨立的AI硬體。然而,最先進的AI模型體積龐大,需要在雲端運行,並需要網際網路連接才能工作。要使具有視覺和聽覺功能的複雜AI模型變得足夠小巧,以便在設備上運行,可能需要幾個月甚至幾年的時間。

不過,大家最關心的可能還是GPT-5。據The Information報導,一位接近OpenAI領導人的人士稱,其可能在今年年底完成GPT-5並公開發布。

OpenAI的新產品和AI模型開發工作進展得如火如荼,與此同時,其此前宣布的一些項目卻變得不再那麼受關注。儘管OpenAI曾向開發者承諾,會在今年第一季度推出GPT Store開發者激勵計劃,但目前仍沒有實現。

03.

計劃推出預付費定價模式

最高提供50%折扣

在定價方面,據知情人士透露,OpenAI計劃推出一種新的定價模式,如果客戶通過預付費預定Token,最高可以享受50%的折扣。

這樣的優惠形式在雲端運算領域比較常見,微軟Azure、谷歌雲、亞馬遜雲服務(AWS)等都提供提前預定伺服器容量折扣的方式來降低成本。

目前,按需定價提供API(應用程式接口)是OpenAI大模型的主要付費形式,通過每生成100萬Tokens,向開發者收取幾美分至一百多美分不等的費用,其中大客戶可以享受批量折扣。

此前OpenAI已經提供了一種降低開發者成本的方式,其在4月推出Batch API,如果開發者批量上傳模型查詢,並接受等待最長24小時的時間,就可以獲取更低的價格。

Together AI和Anyscale等AI伺服器經銷商曾表示,在他們的軟體上運行開源模型要比使用OpenAI的模型便宜6倍。通過更靈活的定價,OpenAI與其他模型開發商的競爭將更具優勢。據透露,其今年的營收可能達到數十億美元。

04.

結語:OpenAI谷歌相爭

蘋果微軟得利?

OpenAI與谷歌之間的競爭愈發激烈,二者之間的「商戰」火藥味也愈發濃厚。OpenAI又一次將新品發布時間定在了谷歌重大發布時間附近,似乎執著於搶奪谷歌風頭這件事。

這一邊,蘋果同時與OpenAI、谷歌商談模型集成至iPhone事宜,再次加劇了兩家公司之間的競爭。雖然OpenAI被曝已與蘋果達成合作,但谷歌那邊的談判也仍在繼續。

而另一邊,微軟作為OpenAI最大的財務支持者,可以優先使用其先進技術來改進自己的語音助手。而微軟也並非「孤注一擲」,除了積極自研模型外,還投資了OpenAI有力競對Mistral AI,後者成為第二家在微軟Azure雲平台上提供商業AI模型的公司。

下周的OpenAI新品發布和谷歌I/O大會,或許會將這場「商戰」推向新高度。究竟誰的「大招」會更厲害,我們拭目以待。

責任編輯: 李華  來源:智東西 轉載請註明作者、出處並保持完整。

本文網址:https://tw.aboluowang.com/2024/0512/2053732.html