一覺醒來,程式設計師怕是真要失業了。
首個AI軟體工程師一亮相,直接引爆整個科技圈。只需一句指令,它可端到端地處理整個開發項目。
在SWE-bench基準測試中,它無需人類幫助,可解決13.86%的問題。
相比之下,GPT-4隻能處理1.74%的問題,且都需要人類提示告知處理哪些文件。
可以說,它遠遠超過了此前所有AI大模型。
從零構建網站、自主查找並修復Bug、甚至是訓練和微調自己的AI模型通通都不在話下~也可為一些成熟的代碼庫做貢獻。
就是一些不熟悉的技術,給它看一篇博客文章。它也能立馬搞定。
比如用ControlNet,生成帶有隱藏文字的圖像,Devin就是一點就通~
據介紹,它已經成功通過一家AI公司面試,並且在Upwork上完成了實際工作。
而這背後的公司Cognition,雖然是初創公司,但小而精悍。
在招人信息中明晃晃寫著:我們有10個IOI金牌。
讓同行們直呼:哦莫,瘋了吧~
目前Devin尚未公測,不過已經有少部分人拿到了資格,開始實測了一波……
Devin一亮相,讓不少工程師大驚失色:軟體工程師…要失業了???
不過也有人依然樂觀:終於有AI讓我們從繁重的編程任務中解脫出來。
前特斯拉AI總監卡帕西倒是給了一顆定心丸。
自動化軟體工程,目前看起來與自動化駕駛類似。
具體體現在發展進程上:首先人類手動編寫代碼,然後 GitHub Copilot自動完成幾行,再之後ChatGPT編寫代碼塊,現在就是Devin的出現。
接下來,他認為自動化軟體工程會演變成為協調開發人員需要串聯的許多工具一起編寫代碼:終端、瀏覽器、代碼編輯器等。以及人類負責監督,逐漸轉向更高級別工作。
結合卡帕西的經歷和對自動駕駛的理解,他表達的更多是一種漸進式推進,即會有一段時間的人機共駕,然後在數據和疊代反饋後,才能實現完全無人駕駛。
自動化軟體也類似,先低代碼,然後零代碼,最後完全不需要人寫代碼。
Perplexity AI CEO給出了個高度的肯定:這應該是任何Agent的第一個演示。
它似乎跨越了人類水平的門檻並且可靠地工作。它還告訴我們通過結合 LLM和樹搜索算法可以實現什麼……
德撲AI之父、前FAIR(Meta)研究科學家、現已加入OpenAI的Noam Brown轉發開麥:
2024年是AI激動人心的一年。
所以,程式設計師們做好被解放的準備了嗎?