今天小編分享的科學經驗:大模型預測,下一個token何必是文字?,歡迎閲讀。
太快了太快了…
大模型的生成技能,已經到了普通人看不懂的境界!
它可以根據用户過去 5 年的體檢報告,生成未來第 1 年、第 2 年、第 3 年的體檢報告。
你看,這個生成的過程,是不是像極了 ChatGPT,根據歷史單詞預測下一個單詞。
它能查看過去 7 天機組子部件的運行情況,生成未來 3 天每小時的子部件報告 。
還能基于歷史水文數據和未來 7 天氣象數據,生成未來第 1 天、第 2 天……至第 7 天的每小時降水分析報告,包括詳細降水量、降水分布。
如今,大模型的生成内容,早已不只是文字 / 影像 / 視頻了。
如上生成的這些報告分析涉及諸多專業知識,普通人很難基于自己的知識儲備評價其合理性和正确性。
最多只能評價一句:不明覺厲!
怎麼説呢?"AI 似乎正在生成一切"。
LLM+ 行業數據,路走錯了?
簡單理解大模型,就是Predict the Next "X"。ChatGPT 是 Predict the Next "Word"。
但行業需要的往往不是預測下一個字。
比如對于慢性病患者的健康管理規劃,它需要基于一系列生理指标數據,從醫學角度進行數據預測。舉個不恰當的例子,這更像是用數學方法解題。
如果在大語言模型基礎上投喂大量專業的醫學語料,更像是用語文方法讀題。盡管能理解相關的術語和指标,可是給出的預測結果大概率不準确。因為問題本身超出了 " 語言 " 範疇,不能用語文方法求解。
如果 "X" 的模态從 " 文字 Word" 變成了 " 體檢報告 ",模型則可以根據歷史體檢報告數據去預測下一個體檢報告,這才是一個健康管理大模型。
它的邏輯更像是 "種瓜得瓜、種豆得豆"。即輸入 "X"、輸出 "X"。
這裏的 "X" 可能包含水文數據、健康報告、設備監測數值、設計推演等不同樣式的專業數據。
它能基于音樂廳的幾何模型和房間數據,從聲源發射 5000Hz 頻率射線,生成射線分布圖,找到聽覺最佳的音源擺放位置。
如何預測 "X"?
所以,這些能預測下一個 X 的行業大模型,如何構建出來?
通過剛剛發布的先知 AIOS 5.0。其核心特點是基于各行各業場景的 X 模态數據,構建行業基座大模型。
解決了當前行業大模型只能将行業文本數據喂給大語言模型、生成下一個字的問題,讓大模型能來到的領網域更加廣泛。
先知是 AI 公司第四範式的核心產品。2015 年,先知 AIOS 1.0 版本首次發布,通過高維、實時、自學習框架提升模型精度;2017 年,先知 AIOS 2.0 版本利用自動建模工具 HyperCycle,降低模型開發門檻;2020 年發布的先知 AIOS 3.0 版本規範 AI 數據治理和上線投產;2022 年,先知 AIOS 4.0 版本引入北極星指标,更大化發揮 AI 應用價值。
AIOS 5.0 版本則從生成式 AI+ 行業這一角度出發,給行業大模型提出了一種新思路。
而在公認的大模型應用落地元年裏,行業大模型的發展和影響一定是此前的數倍。這種更具規模化的動向,由此也形成了 AIGC 趨勢的下一個範式。
One More Thing:AIGC 邁向新範式?
從圖片、文字、視頻,再到健康、水利……我們不難看出 AIGC 現在正以迅猛的速度朝着 AI生成一切的方向飛奔。
通常來説,一切事物的發展似乎都需要一些範式來推動,而且不是新範式取代舊範式,而是它們之間互補使其更加深入和全面。
正如科學研究中的四種範式一般,即實驗歸納、理論推演、計算機仿真和數據密集型科學發現,它們相互補充,共同推動了科學研究的進步。
那麼若是以這種邏輯來看待 AIGC,似乎類似的四種範式也已經開始出現。
AIGC 的第一範式以文本生成為核心,通過智能客服、内容續寫等應用,展示了 AI 在理解和生成自然語言方面的能力。這一階段的 AIGC 技術,為後續的發展奠定了基礎,使得機器能夠與人類進行有效的交流和互動。
AIGC 的第二範式将應用領網域擴展到了影像生成。
如生成對抗網絡(GAN)、變分自編碼器(VAE)等,可以學習從随機噪聲生成逼真影像的映射。并能将輸出結果用于藝術創作、影像增強、虛拟場景生成等領網域。這一範式進一步展現了 AI 的想象力。
AIGC 的第三範式則是聚焦在了視頻生成,例如 Gen2,例如 Sora。
視頻生成一定程度上反映了 AI 對于世界的理解。從 Sora 誕生以來,能否理解世界?是否是世界模拟器的説法一直争論不休。因為如果确定 Sora 可以理解世界,将意味着 AGI 大門正式開啓。
而 AIGC 的第四範式,就是以行業為主,技術将全面滲透到各個行業之中。
這一階段的核心任務是将 AI 技術與行業知識深度融合。今年作為大模型應用落地的元年,我們看到 AIGC 技術開始在醫療、教育、金融等關鍵領網域發揮重要作用。
具體怎麼做才能更快推進 AIGC 扎入行業?各路玩家都還在不斷嘗試中。以大語言模型為底座?還是直接訓練行業大模型?不同路線都有各自的底層邏輯,誰的路線更能跑通,還言之過早。
但可以确定的是——
在 AI 生成一切的進程中,那些能夠率先利用 AI 技術的個人和行業,将能夠更早地享受到技術帶來的紅利。他們将有機會引領行業變革,塑造未來的社會和經濟格局。
而且也只有 AIGC 進入到了第四範式,才意味着完成了技術創新到商業創業的飛輪轉換,意味着生成式 AI 開啓新質生產力變革。
— 完 —
點這裏關注我,記得标星哦~
一鍵三連「分享」、「點贊」和「在看」
科技前沿進展日日相見 ~
>