今天小編分享的科技經驗:一口氣看完OpenAI前四天内容,歡迎閱讀。
OpenAI 發布了長大 12 天的 "Shipmas"。
Shipmas,是「ship」和「Christmas」的組合。簡單講,在特殊時期,推出很多產品更新,既給用戶帶來驚喜,也像在慶祝節日一樣。
剛開始發布時,我還跟朋友說,國内大模型公司在搞發布會,應該跟 Open Ai 取取經。
冬天那麼冷,去現場聽演講,結果講的内容也不多,大家在台下,有的玩手機,有的只是來打個卡,說實話,花那麼多錢,最後只換來幾篇報道和幾條朋友圈,對客戶和宣傳效果都很有限。
OpenAI 的做法有些不同。
他們只要一個小黑屋、一張桌子、兩台電腦和四個人,就能搞定一切。 雖然更新速度有點像擠牙膏,但是這樣能讓關注他們產品的客戶、用戶清楚地知道他們在做什麼。
有人覺得這種漸進式的發布會缺乏吸引力,但實際上,它在傳播信息同時,讓客戶、關注的人有機會更深入地了解背後的模型和技術理念。
比如說:
關于技術微調的細節。如果在大型發布會上簡單提及,可能幾句話就帶過了,大家的印象也不會很深。
但如果單獨用一天時間深入講解,就能展示更多的例子和演示,讓技術人員和用戶更直觀地理解這些技術細節,從而達到更實際和深刻的認識。
所以,這種辦法很适合經濟實用型的公司嘗試一下。 發布會已經進行到第四天了,我連續熬了三個大夜。如果你錯過了前幾天的内容,我來幫你補上。
活動第一天,OpenAI 推出 o1 完整版及 o1 pro 模式。
什麼是 o1 模型完整版呢?
這個版本在之前的 o1 預覽版上做了全面提升。它現在不僅能處理文本,還能處理截圖、照片、網頁、上傳的檔案等等,功能更強大了。
而且,它還采用了新的推理方式。就像人的思維方式一樣,o1 模型完整版會一步步推理,這樣在回答專業問題時就更準确了。
跟預覽版比,這個版本的 o1 模型思考問題更簡潔,速度提高了 50%,而且在回答難題時,出錯的可能性也降低了 34%。
作為個人博主,這些數據我肯定沒辦法測試,但我可以跟你講講官方給的例子。
發布會上,o1 模型的負責人畫了一個草圖。這個草圖是關于一個系統,用來收集太陽能,供應給太空數據中心。
因為太空裡不能用水冷卻系統,所以得靠一個巨大的散熱片來散熱;研究員問 o1 模型,如果要給數據中心提供 1 吉瓦的電力,需要多大地方的散熱片才能保證 GPU 正常工作?
o1 模型準确地識别了草圖,經過分析和計算,得出結論:需要 242 萬平方米的散熱片來滿足散熱需求。
不說别的,至少從演示上看,的确很強大。
不過,強大歸強大,之前大家說的那個「有點貴」的版本,第一天就出現了,他們推出的 ChatGPT Pro。
這個服務,每個月要 200 美金,可以随便用他們最先進的模型和工具,包括 OpenAI 的 o1、o1-mini、GPT-4o 和 Advanced Voice,主要給需要解決特别復雜計算問題的人準備的。
我覺得,這種服務可能更适合那些需要搞高級數據分析、處理的科研人員、工程師還有其他的一些專業人士,能幫他們提高工作效率,也能讓他們跟上人工智能的最新技術。
有專家測試說 o1 pro 模式在處理那些復雜的數據科學、編程和案例分析問題時,确實能給出比以前的模型更準确的答案;在數學、科學和編程這些領網域的機器學習測試裡,o1 pro 模式比 o1 和 o1-preview 模型表現更好。
但是,他們會花 200 美刀用這個嗎? 我不知道。 當時, 還開玩笑在朋友圈說,有這麼多預算,還不如用集合工具 Monica,一個月不到 20 美金,能用十幾個模型,不是更劃算嗎?
第二天 open AI 推出了什麼呢?
一句話總結即: 推出強化微調能力(Reinforcement Fine-Tuning)。 什麼是強化微調?簡單的說:給 AI 模型一個 " 專業培訓課程 "。
通過強化微調,可以用很少的實際案例(比如:幾十個例子)來教這個 AI 模型成為一個領網域的專家。
直播裡,四個人在場,唯一的華裔女研究員 Julie Wang 介紹了這個能力。她說,這個能力能讓小體量的模型 " 從高中水平跳到專家水平 "。
實操環節,他們舉了兩個例子。
一個是和湯森路透合作的,為法律專業人士打造的 AI 模型。他們覺得,在很多行業裡,雖然專家有很深的專業知識和豐富的經驗,但在處理大量數據和復雜任務時,可能會因為時間和精力的限制。
比如:在法律領網域,律師要處理好多法律條文和案例。
他們可以用專業知識分析,但如果用經過強化微調的 AI 模型,可以更快地找到相關案例,進行初步的法律條文匹配,給律師提供決策參考,提高工作效率。
但這個例子是一個展示,似乎沒什麼說服力。 另一個例子是, 生物醫學任務的實驗 。
伯克利大學的罕見遺傳病研究員 Justin Reese,把很多臨床病例數據通過 API 輸入到 o1 mini 模型裡。
這些數據包括病人的基本信息、症狀描述。比如:一個 51 歲的女性,症狀有眼距過寬、睑裂狹小、軟腭咽閉合不全、甲狀旁腺功能減退、全身發育遲緩和感覺神經性聽力障礙、等等。
然後,用強化微調技術訓練 o1 mini 模型做醫療診斷任務。 訓練時,模型要根據症狀描述找出可能的基因,并排序。
評分模型會對答案打分,分數從 0 到 1。0 表示模型輸出中沒有正确答案,1 表示正确答案在輸出的第一個位置,通過性能監控,可以看到微調過程中模型指标的變化。
結果表明,經過強化微調的 o1 mini 模型在特定任務上的表現超過了更強大的 o1 模型,在 top@1、top@5 和 top@max 這些指标上,o1 mini 模型都明顯超過了 o1 模型。
這個案例,在 OpenAI 的官網可以看到。 不過,兩個能力都是「期貨」,明年才正式推出,主要面向企業或科研部門等潛在客戶。
千萬不要小看微調技術,說實話,現在大型語言模型(LLM)還做不到復雜的創造性活動,比如:批判性思維和深度頭腦風暴。
這既是壞事也是好事, 因為這樣,我們就可以把模型用在那些瑣碎、重復、無聊而且不需要創造性的任務上,這樣做,它們就能慢慢提高自己的準确性。
這就是,第二天的内容,一個詞總結即:微調技術。
Open AI 第三天推出了 sora。 鴿子一年多的期貨來了,不過,因為之前連續熬夜,我實在撐不住,12 點半就睡了。第二天醒來想試試 Sora,但登錄時發現因為用戶太多,暫時用不了。
沒關系,我看了 Sora 的發布會。
OpenAI 團隊在會上展示了這個工具的厲害之處,還教大家怎麼用;他們教我們怎麼生成視頻,包括設定分鏡、輸入視頻指令、選風格、畫面比例、時長等等。通過演示,讓所有人對 Sora 有了更深的認識。
Sora 的使用過程相當靈活,你可以用分鏡功能看不同角度的畫面,然後,輸入你想要視頻怎麼做。OpenAI 說:指令越簡單,Sora 自己發揮的越多;指令越詳細,它就越聽你的。
在直播中,Sora 把兩個不連着的視頻片段合成了一段有故事感的視頻。雖然細節有點出入,但整體效果的确令人驚訝。
Sora 還能讓你上傳圖片或視頻,然後生成後續視頻的文字描述。你可以随便改指令,在時間軸上調整,決定視頻啥時候播。這個功能挺有創造力的。
還有一點,生成視頻後,還能用 remix 工具改。
這個工具看起來很絲滑,它能對視頻進行各種創意上的改編。怎麼改呢?可以調強度,從 1 級到 8 級,想要多大變化都行。
還有預設的選項,比如:溫和、适中或者強烈。用這個工具,可以保留視頻裡想要的部分,其他的,想怎麼變就怎麼變,比如:把猛犸象換成機器人,或者變人物表情等等。
我覺得,Sora 不光是視頻工具,它把視頻生成和工作流程結合起來了,這對 OpenAI 挺重要;因為 Sam Altman 在直播裡說,他們想讓 AI 理解視頻,改變我們用電腦的方式。
想要做到這點,在通往 AGI 的路上,得做很多優化,而把工作流和視頻生成結合起來,是個不錯的辦法。
不過,Sora 看着不錯,但是價格有點高。比如:
你要是選 Plus 會員,每個月得花 20 美元,能做最多 50 個視頻,視頻質量一般,最高只能到 720p,而且每個視頻最長也就 5 秒。
如果你想要更好的,得選 Pro 會員,一個月得 200 美元,最高清晰度能到 1080p,每個視頻才能生成 20 秒,而且 Sora 尚未在歐盟、瑞士和英國上線。
這就是第三天關于 Sora 的内容,感嘆又期待,你會付費嗎?
今天,OpenAI 直播到了第四天,由他們的首席產品官 Kevin Weil 來主持。重點是什麼呢?即:Canvas 正式上線了。
之前,Canvas 的一些功能已經在 ChatGPT 裡展示過,但那時它是單獨的一個模型。現在,它和其他模型融合在一起了。
那麼,Canvas 這次和以前有什麼不同呢?有三個:
一,現在可以直接 從首頁的輸入框跳轉到 Canvas ; 二,集成了一個 Web Assembly 的 Python 模拟器, 可以直接運行 Python 代碼,還能在線修 bug ; 三,Canvas 功能 整合進了 GPTs。
為了讓大家更清楚地看到 Canvas 的新功能,OpenAI 的工程師 Lee 和 Alexey 還做了現場演示。Lee 教我們怎麼用 Canvas 寫一個兒童聖誕故事。
在 ChatGPT 的輸入框裡,點一下新加的工具按鈕,就能切換到 Canvas,你可以和 ChatGPT 一起編輯文檔,不管是改标題、加表情,還是調整文章的長度和閱讀難度,都變得很簡單。
這就像百度的自由畫布,用戶和 ChatGPT 可以一起創作,寫作和修改的過程都很自然。
發布會上,Alexey 還展示了 Canvas 怎麼幫我們改文章。 他把一篇關于 " 聖誕老人、暗能量和馴鹿推進力 " 的物理論文貼到 ChatGPT 裡,然後用 Canvas 打開。
ChatGPT 不僅能給出專業的修改建議,還能在文章裡直接加評論,這樣用戶就能很方便地查看和修改。用戶可以根據自己的思路來改文章,想復制最終版本也随時可以。
Alexey 還演示了怎麼用 Canvas 調試 Python 代碼和生成圖表。 Canvas 裡内置了一個 WebAssembly Python 模拟器,可以快速加載幾乎所有 Python 庫,運行代碼,還能即時反饋,這對提高編程效率真的很有幫助。
另外,Canvas 的功能也整合進了 GPTs 裡。比如:
Lee 就創建了一個叫 " 聖誕老人助手 " 的 GPT,用來幫聖誕老人回復孩子們的信件。
只要在自定義 GPT 的說明裡加上 " 使用 Canvas 工具 " 的指令,再勾選 Canvas 功能,自定義 GPT 就能自動在 Canvas 裡生成信件草稿,聖誕老人可以根據實際情況修改草稿,用自己的風格和語氣回復孩子們。
我之前一直在用 Canvas,還想過,國内廠商啥時候也能引進 Canvas 這樣的功能。 我覺得 Canvas(畫布)是讓大家一起工作更聰明的一個關鍵步驟。
因為不管是自己用,還是大家一起用,總得有個地方能三個人一起做事情,以前可能用類似于在線文檔的工具,實現共同編輯的動作,以後,畫布可能是首選協同之一了。
這就是今天發布會的内容,關于 Canvas。
好了,總結下四天的内容,分别是:推出 o1 完整版及 o1 pro、推出強化微調能力、推出新產品 sora、以及把 Canvas 進行全新更新。
接下來的 8 天裡,還有什麼新產品呢?值得期待。