今天小編分享的互聯網經驗:Sora跳票這10個月,AI應用界翻天覆地.,歡迎閱讀。
文 | 明晰野望
這幾天,你是否刷到過大火的各地博物館讓文物 " 舞動起來 " 的短視頻?
又是否看到過讓馬斯克都直呼驚嘆的,那些被 " 復活 " 的世界名畫?
再或者,你一定看到過 AI 魔改過争議很多的老牌影視劇。
是的,這一切背後都是 AI。
就在 2024 年最後一個月,國内外科技大廠更是集體炫技,AI 應用正在以迅雷不及掩耳之勢加速落地。
在人工智能時代,技術創新的速度讓摩爾定律、新摩爾定律不斷被打破。
我們此前就讨論過,随着這兩年科技公司對算力和 AI 的史詩級投入,大模型底座技術漸成熟并由大廠開源後,AI 界走向了更務實的道路——應用落地。
最新的權威數據統計:幾乎每六個中國人中,就有一人正在使用 AI 產品。
更有從業者直言," 最快 5 年之内,中國人一周只需要工作 4 天 "。
我們做好準備來迎接這個新時代了嗎?
用 AI 造世界:文生圖、生視頻、生 3D 大模型加速開源
12 月 10 日,OpenAI 旗下視頻生成模型 Sora,終于在首次亮相 10 個月後正式開放,新版工具 Sora Turbo 可以生成最長達 20 秒的視頻。或許是由于等待的太久,用戶火熱的試用熱情一度讓 OpenAI 緊急關閉用戶注冊。
但是 Sora 姗姗來遲的這 10 個月的空檔期内,AI 圈已經翻天覆地。
比 Sora 早一周,12 月 3 日,有着 "AI 教母 " 之稱的李飛飛聯合創立并擔任 CEO 的 AI 公司 World Labs 官宣了首個成果—— 3D 世界生成模型,可以讓用戶從單張圖片生成 3D 世界的 AI 系統,并且用戶可以與之互動。比如,通過鍵盤和滑鼠在生成的 3D 場景裡移動、轉換視角。
緊随其後,12 月 4 日,谷歌也發布了 Genie 2,一個能把靜态照片變成可玩遊戲的 AI 系統,同樣可以實現從靜态照片到可互動 3D 場景的轉換。
就在一個月前,著名遊戲公司任天堂旗下寶可夢公司也宣布過一項類似的技術,用 " 大規模地理空間模型 ",讓用戶距離空間智能更近了一步。簡單說,用戶可以自行上傳影像,構建 3D 地圖,能精确而真實地看到放置到物理環境中的數字内容,而且這些内容是持久的,還能與他人共享。
大洋的另一端,中國 AI 技術同樣突飛猛進,在 Sora 跳檔的這 10 個月裡加速趕超。
就在李飛飛官宣新技術的同一天,騰訊版 Sora 大模型面世,并免費開源!
12 月 3 日,騰訊混元大模型官宣了最新的文生視頻大模型 HunYuan-Video,用戶只需要輸入一段描述,即可生成視頻,該模型參數量達 130 億,是當前最大的視頻開源模型。從文本、到 AI 繪圖到 3D 生成再到視頻,騰訊混元大模型已經全系開源。
有參與測評的博主發布評論稱,其生成的視頻不僅語義理解精準,更是 " 最有電視劇質感的 AI 大模型 ",甚至看不出一絲的 AI 味,對比以往文生視頻模式,即使面面占比很小的人臉都不會糊。
半個多月前,字節跳動視頻生成模型 PixelDance 和 Seaweed 在即夢 AI 正式上線,并面向公眾免費開放使用,僅需 60 秒即能生成時長 5 秒的高質量 AI 視頻。
更早的半年之前,今年 6 月快手可靈文生視頻 APP 發布,至今已經經歷了十餘次更新,包括發布圖生視頻功能以及 1.5 模型的上線等。
在文生圖領網域,AI 技術也在快速迭代。例如,12 月 2 日,字節即夢 AI 上線了最新的圖片 2.1 模型,解決了 AI 影像無法生成中文字體的問題,讓海報設計的效率再次大幅提升。
某種意義上,ChatGPT 停止服務中國市場并不是壞事。
今年中國大模型廠家底層技術不斷降價并開源,帶動了更多中小創業者走上 AI 新牌桌。更重要的是,上述這些文生圖、文生視頻等以及文心一言、騰訊元寶、字節豆包、阿裡千問等 C 端 AI 應用,在中國速度下都以免費的形式飛入了尋常百姓家。
QuestMobile 數據顯示,2024 年 10 月,AI 原生應用行業月活躍用戶規模達到 8976 萬,同比增長 373.0%。
AI+SaaS:智能體将是通往未來的新船票
視覺 AI 應用火,更火的是 " 智能體 "。
在 AI 改變虛拟和真實世界視覺聯系的同時,AI 正在各式各類的 SaaS 應用中落地,各種形式的智能體已成為 AI 大模型落地的新載體,并且展現出強大的商業化前景。
所謂智能體,又叫 AI Agent,是以 AI 大模型作為基礎,構建的可以進行互動、完成特定任務、或提供專業知識的智能系統或應用程式。
通俗說,智能體可以體現為,裝在傳統軟體 App 裡的 AI 插件,也可以是一個獨立的 AI APP。
相比較傳統的 SaaS 需要完全由人工來操作完成,智能體最大的特點是,接受互動對話指令,并直接產出結果,包括生成視頻、圖片、文章或完成一件工作。簡言之,所有的 AI 應用都可以稱之為智能體。
OpenAI 首席執行官 Sam Altman 曾提出,未來每個人都可以擁有一個智能體。
Salesforce 首席執行官 Marc Benioff 更是直言,AI 的未來發展不在于大語言模型,而在于開發 AI 自主代理,即智能體。
產品智能化已經是 SaaS 廠商在新時代下必須迎接的事實,在一些 TO B 場景内,許多傳統 SaaS 應用在 AI 加持下獲得了新的發展。
比如,做電商服務的有贊最新推出了 " 加我智能 " 功能,其智能體功能包括商機指引、智能托管、營銷專家、智能經營報告、智能穿搭、智能銷售等等。
正是有贊創始人白鴉預言,未來的生意,數字化是基礎,客戶運營是抓手,所有這些都可以交給智能技術完成。" 我非常堅信,最多 10 年,最快 5 年之内,中國人一周只需要工作 4 天。用工具解決問題,數字化和智能化帶來效率提升是必然的趨勢。"
再比如,做教育的粉筆,最新更新了粉筆 AI 老師產品,這個智能體以對話形式存在,具備 AI 導練、學習規劃、考情咨詢、智能督學等在内的多項功能,可以幫用戶規範的作答思路,形成标準化作答習慣,并詳細解答答案,優化學習方向和可改進細節,主打一個專業、細心的教育陪伴。
互聯網大廠中,百度、阿裡、騰訊、字節跳動、華為等皆已布局智能體賽道,并推出一站式智能體開發平台,為開發者、創作者提供更為便捷的操作應用路徑。
美國著名孵化器 YCombinator 最新一期圓桌讨論中提出觀點:垂直 AI 智能體的規模可能是 SaaS 的十倍。
美國一線 AI 從業者提到,AI 大模型技術正在重塑軟體行業。如果說 2004 年在浏覽器中可以增加 XML HTTP 請求這個功能,開啟了互聯網應用程式的新時代,帶來了整個 SaaS 軟體行業的 20 年繁榮;那麼大型語言模型—— LLM 的出現,則是開啟了智能體時代的新篇章。
這一切正在發生。
QuestMobile 最新報告提到,當下 LLM 的落地應用在網頁端、移動端都已比較成熟,正逐步拓展至智能硬體端,不斷深入用戶日常生活并提供更自然便捷的互動體驗。
市場研究機構 Research and Market 在 11 月 11 日發布的報告中指出,未來五年 AI 智能體的市場規模将增加 420 億美元。
在騰訊研究院最新發布的《2025 數字科技前沿應用趨勢》中指出,AaaS 催化 AI 原生應用落地将是明年大趨勢之一。
AI 的新時代已經勢不可擋。