今天小編分享的科技經驗:人類程式員真要失業?首位“AI軟體工程師”亮相引爆科技圈,歡迎閲讀。
Cognition 推出了一款名為 Devin 的人工智能(AI)助手,可以協助人類軟體工程師完成諸多開發任務。Devin 不同于現有其他 AI 編碼者,它可以從零構建網站、自行部署應用、修復漏洞、學習新技術等,人類只需扮演一個下指令和監督的角色。
一家成立不到兩個月但擁有十名天才工程師的初創公司 Cognition,搞了一個引爆科技圈的大動作。
他們推出了一款名為 Devin 的人工智能(AI)助手,可以協助人類軟體工程師完成諸多開發任務。Devin 不同于現有其他 AI 編碼者,它可以從零構建網站、自行部署應用、修復漏洞、學習新技術等,人類只需扮演一個下指令和監督的角色。
這是第一個真正意義上完全自主的 AI 軟體工程師,一亮相即掀起軒然大波,因為人們擔心:人類程式員是不是真要失業了?
測試表現超越 " 同輩 "
據 Cognition 官網報道,Devin 只需一句指令,即可端到端地處理整個開發項目。
按照用户需求,Devin 可以同時執行多步驟工作流程,人類工程師則可以實時觀察其進度,發現錯誤時,跳出指令進行修正。這便于工程師們将大部分工作 " 外包 " 給 AI,自己則可以潛心于創意性工作。
在 SWE-bench 基準測試中,Devin 的表現遠超 Claude 2、Llama、GPT-4 等選手,能夠完整正确地處理 13.86% 的問題。相較之下,GPT-4 只能處理 1.74% 的問題。更重要的是,Devin 在測試中沒有得到任何幫助,而其他所有模型都需要幫助,即人們要準确告知模型需要編輯哪些檔案。
這一進展,标志着 AI 在自主理解和解決軟體開發問題方面取得了顯著進步。目前,Devin 已經成功通過一家 AI 公司面試,并且在 Upwork 上完成了實際工作。
運作幾乎完全自主
Devin 的厲害之處,還在于可以規劃和執行異常復雜的工程任務,這類任務通常需要數千個決策才能完成。在這之中,無論進行到任何一步,它都可以回調所有相關的上下文信息,保證任務的邏輯性,也便于随時校正。
更讓人震撼的是,Devin 不僅能幫人們解決代碼,還囊括了與之相關的整個工作流。
譬如,當工程師需要設計一個網頁遊戲時,Devin 首先能生成網頁,接着還能完成衣務端的部署,最後直接發布上線,省去了中間大量人工操作。甚至在發現漏洞之後,Devin 還會回溯報錯出現的位置及對應的數據,然後分析原因并給出解決方案。
此外,作為一個 AI 全能助手,Devin 還可以幫助人類訓練和微調其他 AI。對于一些常見的模型,你只需要提及模型的名稱,Devin 自己就知道要怎樣去訓練。
那人們需要做什麼呢?按設想,最終的 Devin 會讓人類只需要發号施令,其他什麼也不用做。
對軟體開發業影響深遠
初創公司 Cognition 雖然只有十名員工,但他們手中卻握着十塊 IOI(國際信息學奧林匹克競賽)金牌,核心創始團隊為 3 名華人。
Devin 現處于内測階段,有意用户可申請提前試用。目前,團隊尚未透露更多核心技術細節,但他們表示,Devin 源于其長期推理及規劃研究的進展。編碼只是第一步,這一 AI 助手其實可推廣到更寬領網域。
Devin 的出現,可能對軟體開發行業產生深遠影響,甚至可能減少對人類開發者的需求。但須注意到,該技術仍處于早期階段,其成熟度和效果需要業界作進一步評估。
就目前而言,Devin 的成功可以説為當今軟體開發人員帶來更新更好的 AI 協作體驗。人們從繁瑣工作中 " 解放 ",只需監督 AI 系統去處理,而自己将精力投入到創新性任務上,實現生產力的真正提高。