今天小編分享的教育經驗:OpenAI急了?我們應該抓住哪些變量?,歡迎閲讀。
在過去的一個月,OpenAI 連續推出 12 場重磅發布會:
Day 1:滿血 o1 上線,ChatGPT Pro 會員上線,o1 pro 推出,AI 有了類人 " 思考 " 能力。
Day 2:基于 o1 的強化微調,人人都能訓練專家模型,專業門檻直線下降。
Day 3:Sora 正式發布,AI 開始 " 看懂 " 現實世界。
Day 4:ChatGPT Canvas 全員開放以及小功能更新,寫文章、寫代碼一氣呵成。
Day 5:全面接入蘋果生态,打造更自然的多設備跨平台操作體驗。
Day 6:4o 的實時視頻理解上線,多模态讓 AI 看懂視頻内容。
Day 7:ChatGPT 上線 "Projects 項目 " 功能。
Day 8:ChatGPT Search 全量開放,更新 AI 搜索功能,挑戰傳統網絡搜索。
Day 9:滿血 o1 API 正式開放,大幅降低 API 調用價格。
Day 10:從最新款的 iPhone 到老式的翻蓋機,能直接和 ChatGPT 打電話聊天了。
Day 11:應用更新,桌面版 GPT 可以跨應用互聯,告别繁瑣的復制粘貼對話。
Day 12:OpenAI o3 正式發布,超級智能模型震撼登場,向 AGI 又邁進了一大步。
每一天的發布會都是振聾發聩的技術突破與產品創新,這些前所未有的技術加速度正在深刻改變全球的商業格局、產業生态以及個體的能力邊界。
AI 将帶來哪些行業巨變?
AI 離取代人類又近了一步?
AI 在哪些能力上已達到了人類的水平?
12 月 28 日,混沌邀請到了硅谷知名華人 AI 科學家田淵棟博士,脈脈創始人兼 CEO 林凡,雲迹科技創始人、混沌學園校友支濤,雲九資本合夥人、混沌創新領教任鑫,混沌合夥人、混沌創新領教張雷等 AI 行業從業者、專家們一起解讀了 OpenAI 的這 12 場發布會。這不僅是一場關于 AI 技術趨勢的分享,更是一場關于個人未來發展的思考。AI 帶來的不僅是工具的進化,更是思維的迭代與格局的重塑。在 2025 即将到來之際,讓我們站在技術與人性的交匯點,重新審視未來的可能性。
以下為部分分享内容精華筆記:
田淵棟博士:OpenAI o3 的表現依然驚豔
前段時間,OpenAI 連續開 12 天的產品發布會,内容大致包括增強的 ChatGPT o1 模型、Sora 視頻生成模型和 o3 模型。另外,還有一些技術上的突破,包括推理模型 o1、強化微調技術、文生視頻 Sora、寫作和編程工具 Canvas、與 Apple 生态系統的深度整合、語音和視覺功能、ChatGPT 搜索、打電話和 WhatsApp 聊天等功能。
總體來説,前 11 天沒有什麼太多的驚喜,第 12 天出現的 o3 相對具有一定的創新能力。它的能力主要表現為解決了之前的一些技術難題,我認為有三個值得一提的亮點:
1. 在 ARC-AGI 測試中 o3 的成績遠超其他模型。ARC-AGI 測試就像是為人工智能準備的一個特殊 " 考試 "。它不是考 AI 背誦了多少知識,而是測試 AI 是否真的具備 " 理解力 " 和 " 思考力 "。對目前的 AI 技術而言,一般的大模型在 ARC-AGI 測試中的成績大約都在 25%-50% 之間,而 o3 的最低成績為 75.7%,最高成績為 87.5%,有着巨大差距。
2. o3 在全球著名的編碼競賽平台 codeforces 中刷出 2727 分,達到此分數的程式員不到 200 人,之前 2073 分已相當于終極者,而 o1 是 1891 分。這意味着在競争性代碼方面,o3 已經達到了世界頂尖程式員水平。
3. 今年 11 月 o3 在陶哲軒等 60 餘位全球數學家共同推出的号稱業界最強數學基準的 EpochAI Frontier Math 中創下新紀錄,準确率達到 25.2%。而今天所有其他模型的準确率都低于 2%。聯手 60 多位數學家出題的陶哲軒,曾認為這項測試能夠難住 AI 好多年。如今,這一説法被 OpenAI o3 推翻了。
可以看到,o3 在各方面的表現都讓人驚豔,因此很多人判斷它會影響未來世界的樣态。
田淵棟博士:AI 正在掀起一陣洪流
計算機普及以後,它的普遍性就像水一樣。反觀大模型,随着它的不斷發展,也會出現同樣的情況。AI 出現之前,創業的模式是找很多人組建一個團隊,團隊裏的每個人需要不斷地試煉和培訓才能成為一名有用之才,這一過程大約需要 20 年的時間。但如果 AI 變得非常便宜,創業者就可以以極低的成本獲得穩定性和樂此不疲的勞動力。到那個時候,市場會是什麼樣子難以想象,但對于創業者來説,成本和風險會降低很多。
AI 的分析能力非常強大,因為它有一個巨大的資料庫。我用過一些 AI 工具,我感覺它們很像小鎮做題家,通過大量的訓練不斷地提升自身的能力,最終尋找到解題的方式。因此它的出現未必對所有人來説都是好事情,例如那些習慣用做題思維解決問題的人。因為 AI 的水平很大程度上可以取代一些重復性的勞動,做題思維可替代性很高。這告訴我們:不要以一種高考做題家的狀态去工作和生活,要保持思維的活力和創造力。這樣我們才可以盡量避免被 AI 淘汰。
AI 到來之前,我們的世界布滿了山峰,每個山峰上都站着行業裏最優秀的人。AI 到來之後,它掀起了一陣洪流,讓一些山峰上的人被衝刷,以至掉落。留下來的人,只會是最具創造性、不可替代性的人,同時也是領網域裏的專家。這大概會在十年内發生。
田淵棟博士:2025 的活法,是讓 AI 來加速自己
我認為在 2025 年,AI 會更快速地發展。加速到一定程度之後,每個人都會開始使用 AI,以防止自己的效率遠低于其他人。如果這一猜想變成現實,人的價值感會受到影響。我的價值是什麼?人類獨一無二的價值是什麼?這是每個人都要面對的問題。
這個問題很難回答,但我們可以在行動中不斷地接近問題的答案,比如我願意通過寫小説找到一些存在的價值,這是我自我定位的一個錨點。AI 的出現在提醒我們,人最終要找到自己的獨一無二之處,立足世界的生态位。在尋找的過程中,我們可以利用 AI 加速自己的發展,把 AI 集合起來,讓它們成為自己的将領,協助你做成想做的事。
脈脈林凡:OpenAI 的發展遇到了瓶頸
從這次 12 天發布會來看,OpenAI 的發展受阻了。整個模型的核心能力沒有如預期一樣實現 Scaling law 增長,這其中的主要問題不是算力,而是數據。總體來看,現在所有的模型訓練基本上耗盡了高質量的數據,哪怕通過合成數據或其他方式來逼近都無法產生足夠的效應。
這是為什麼?首先,AI 的聽覺能力目前無法增強;其次,視覺數據方面有太多的噪音(比如 YouTube 上的視頻),海量信息的雜糅,讓 AI 去理解世界、生成内容存在比較大的限制。
因此我們可以判斷,OpenAI 遇到了瓶頸期。有一個很簡單的道理——如果核心能力足夠強,其實不用講太多的内容。正如此前的 ChatGTP-4,只需要一場發布會就足以震驚世界。而這次為期 12 天的發布會卻沒有掀起之前那麼大的火花。對我們創業者來説,可以根據這次 OpenAI 的情況來計劃未來一兩年的創業路徑。一定要記住一件事:對于核心基座的能力,它的突破速度沒有那麼快。
脈脈林凡:o3 大大提高了 AI 應用爆發的可能性
打一個比方,如果用高鐵來去形容 AI 的能力進展的話,GPT3.5 相當于每小時 120 公裏的火車速度一下提到了每小時 200 公裏,速度翻了将近一倍,對于很多人來講,已經是一個很大的進步了。GPT4 出來的時候,相當于每小時 200 公裏提高到每小時 350 公裏。那麼 o3 呢?相當于提升到了每小時 450 公裏。對于做研究的同學來講,已經是很大的提升了。但是,作為一個普通消費者,一列 350 公裏時速的高鐵和一列 450 公裏時速的高鐵,對生活的影響就比較小了。為什麼?從 3 小時的旅程變成了 2 小時 20 分鍾的旅程,時長變化的體感并不強烈。
在技術上,不管是九月份發布的 o1,還是 12 月份發布的 o3,其實都是在 Post-Train(後訓練)環節做出了比較大的突破,比如思維鏈的訓練、強化學習方面做了很多處理。很多跟我們一樣做過 AI 應用,尤其是 To B 的 AI 應用的人會有一種體感,我們去做 agent,去做工作流,其實是在 OpenAI 上面去打了一堆的業務補丁,業務的狀态機控制在頂層,然後通過頂層的狀态機去讓 AI 做 1、2、3、4、5、6 的事情。當然,這個過程很痛苦,因為有的時候它真的很不聽話,你要它這麼幹,它卻幹出了另外一件事情出來。
所以,現在 OpenAI 做的 Post-Train 這件事情,相當于把你上層的邏輯内化到了模型内部,做了内置,這樣就會降低後鏈路開發的難度和復雜度。在新的一年裏,AI 應用開發的難度會降低,效率和大爆發的可能性會極大提高。這件事情我覺得是需要關注和重視的。
脈脈林凡:AI 的創業機會不在 To B,在 To C
對于中國創業者而言,To B 行業的 Agent 開發或 workflow 的優化都不是我們的機會。美國的 To B 生态非常發達,很多創業者做完 workflow 的優化後馬上就能賺到錢,但中國只适合大廠去做這件事,并且他們自己就能做,不需要找創業者。
在這種情況下,To C 是創業者們唯一的機會。Realtime API 是一種實時語音互動 API,支持文本和音頻作為輸入和輸出,比我們原先用的 TTS、ASR 的效果好很多。在這個方面,Realtime API 的出現會讓 To C 行業的互動產生巨變。例如,面向兒童群體的實時語音互動應用肯定會很受歡迎。但當前還缺乏一種類似于 Agent 這樣的框架與之協同,因為僅依靠大模型的話準确度不高,需要一個可以控制的介質。一旦控制能力與實時語音互動能力結合在一起,會為整個 To c 行業的創業者帶來一次巨大的突破機會。
雲迹科技創始人支濤:AI 已超越了工具,其能力好比擁有了大理段氏的 " 六脈神劍 "
人類為了延伸體力和腦力制造了很多工具,比如火車、電腦、電動工具。這次 OpenAI 的發布會也發布了一系列我們夢寐以求的工具。在我看來,這些工具超越了 " 工具 " 的定義,變成了六脈神劍。它有自主力,學習力、互動力、适應力、情感力和社會力。按照目前的發展來看,AI 已經是生產關系和生產力的重要組成部分。
看完發布會以後,有沒有覺得 AI 像是一個正在現實世界不斷學習的學生呢。在回答我們問題的時候,是語文;在幫我們進行推理的時候,是數學和經濟學;在輔助我們工作的時候,是工程技術、生命科學和管理學。一旦它們試圖創新,則會逐個攻讀哲學、心理學,甚至是組織行為學。
AI 這種硅基生物通過不斷地迭代,從開始的輔助工具,逐漸演變為人類身邊的助理,如果有一天,它們變成了智能體,就會成為我們的夥伴。一旦它們開始洞察世界,找到人類還沒有發現的問題時,它們則化身為一個創新者的面貌出現在我們面前。
我們人類如何實現成長?對今天的我們來説,要先學習使用它們的方式,在它們的發展過程中掌握自身的領導力,最後創建一個 " 超級智慧的超個體意識 ",與 AI 做到你中有我,我中有你。這其中要讓他們跟我們一樣,使命、願景、價值觀對齊;在社會裏高度統一的法律、法規、道德形成一致。
雲迹科技創始人支濤:AI 在 To B 的應用場景需要進一步打開
重塑與 AI 的對話能力十分重要,因為這樣才能讓 AI 更好地為我們服務。中國企業在 To C 場景的推進較好,在 To B 的應用場景需要進一步打開。To B 裏,需要更多的人轉換思維模式,理解并用好 AI 來做職業增強,解決實際問題,創造價值。這也提醒了我們企業,不僅要給 To C 場景提供生產力,還要在 ToB 場景裏提供生產關系。未來,希望中國企業能夠快速發展,加大 To B 對 AI 的使用率。
雲九資本合夥人任鑫:OpenAI 發布會與你無關
由于大家都是從業者,因此對 AI 格外關注,還會守着這次 OpenAI 發布會的直播。在這裏我想給大家提供另一個視角,僅代表我個人的觀點,只是給一些業外的朋友們一點建議:建議大家不要關心這件事,它不重要。
首先,如果你不是專業人士,不要花太多精力預測 AI 的未來。我常常會跟一些 CEO 或者研究員聊到這個話題,最後的結論是,很多業内專業人士的觀點并不一致。這告訴我們要充分相信一件事——沒有人知道未來會怎樣。既然沒有人知道未來會怎樣,我們只要明确一件事:你現在的狀态如何以及你想不想蹭到 AI 的紅利。如果你的狀态足夠好,你可以有選擇。但如果你現在的狀态欠佳,心裏又躍躍欲試,這個時候其實更不需要預測,因為你沒有選擇,必須參與。如果想要跟上時代趨勢,你只能投身其中。
其次,要具體地思考問題,不要抽象地評判。OpenAI 會不會被 Google 打敗?Deepseek 與 GPT-4o 哪一個更好?如果你是應用方,最好不要這樣去思考問題。你的思考落點一定要非常具體,把具體的事物放置在你的場景裏,判斷它會產生什麼樣具體的結果,這才是業務導向的思維方式。
雲九資本合夥人任鑫:不要想太多,先要多用起來
大家有可能聽過一種説法,説 AI 應用不夠廣泛。但是實際我們調研下來發現,現在 AI 的應用已經極其廣泛,只是大家沒有大聲吆喝。比如前幾天的 OpenAI 掉線了一會兒,然後推特上鋪天蓋地都是學生在哭喊:我的論文怎麼辦?我要交作業!小朋友們用它來寫作業這件事情已經非常普遍。然後國内大模型的應用場景當中,一個非常巨大的板塊叫做寫公文,寫報告,也是鋪天蓋地地在用。
還有當你在網上招聘,你給他電話面試、視頻面試的時候,很多小朋友已經在他的電腦上開了一個 copilot,你問任何問題,copilot 都會結合他的簡歷和回答來幫他實時作弊。所以,我建議大家不要低估世界的發展,年輕人已經都用起來了,如果我們沒有用起來,只是我們老了而已。
我們是一家孵化器,我們會支持一些創業者幫他們把他們的產品實現。在大半年前,我們就已經做到了後端的代碼沒有一行是人類寫的,全部都是 AI 寫的。現在我知道已經有無數的公司做到了。
再舉一個例子,前幾天有一個同事讓我看一個美國項目的招聘計劃。但是實際上我是外行,我招他是因為他比我内行,如果按照以前的做法,我會跟他説,這個點你再想一想,我覺得可以怎麼樣,要不要再修改一下,外行指導内行。但是,前幾天我給他的反饋已經變成了:" 這件事情你分三個維度,去跟 o1 聊半個小時,看看它能不能給你更好的建議。如果有的話,你回來告訴我這件事情還有可能往哪些方向優化。" 我也沒有 AI 懂,你不如直接去問 AI。所以,大家會發現在工作當中,我們相當于引入了一個更好的第三方。
最後,在決策上也是這樣,我們現在已經不是拍腦袋想了,而是每一次都跟 AI 聊聊。我的很多想法都是跟 AI 聊出來的。
所以,我強烈建議大家在關注新聞的同時,自己更多地用起來。所有事情都是可以用上 AI 的,就看你想不想得到。真正稀缺的不是知識,而是實踐的機會。大家一定不要挖空心思去搞懂 OpenAI 在幹嘛,業外人也搞不懂,趕緊把這些東西全部用一遍,然後在生活當中創造 100 個實踐的機會。這些機會會逼着你去更好地學習,然後這些更好的學習可以幫助我們創造更多的可能性。
////// END //////