今天小編分享的科學經驗:小米交卷大模型,全新小愛同學實測來了,歡迎閲讀。
果然只有雷軍和小米,能搶走風口上大模型的熱度。
在雷軍的年度演講分享中,講武大求學經歷,分享學霸 4 年大學 2 年完課經驗;講被《硅谷之火》點燃,勤奮練習寫最好的代碼,開啓第一次創業的往事;最後加入金山、創辦小米,一路堅持夢想、實現夢想、不斷成長的知行合一……
于是雷軍超燃演講刷屏之下,自家大模型前腳刷新的紀錄、引發的熱議,都被蓋過了。
不僅如此,發布會上一系列小米技術的最新進展,也被蓋過了——但再回頭來看,其實都很重要很值得關注,比如AI 大模型裝進手機、小愛同學的大模型更新、仿生四足機器人新落地……
以及雷軍還親自公布了小米的科技戰略、AI 公式,AI 即将對小米展開的全方位刷新。
這也是為什麼小米的這波 AI 新進展值得詳談。
我們先從四兩撥千斤的小米大模型説起。
AI 全面賦能,把大模型塞進手機
小米自研大模型 MiLM,在雷軍演講前一日就現身 GitHub,也卷也不卷。
不卷在規模,主打 6B、1.3B(64 億參數,13 億參數)版本,妥妥的輕量級選手。
卷在了性能,把更小巧的 1.3B 參數版本塞進手機,做到在很多場景上可以媲美雲端大模型效果。
小米大模型團隊由栾劍帶隊,向小米集團技術委員會 AI 實驗室主任王斌博士匯報。從今年 4 月開始研發,短短 4 個月時間已經交卷。
成績如何,先上評測結果:
6B 參數版本,在 C-EVAL 權威榜單上取得同參數量級排名第一,CMMLU 中文向大模型取得排名第一。
具體來説,C-EVAL 數據集是一個全面的中文基礎模型評測數據集,涵蓋了 52 個學科和四個難度的級别。
CMMLU 數據集是一個綜合性的中文評估基準,專門用于評估語言模型在中文語境下的知識和推理能力。CMMLU 涵蓋了從基礎學科到高級專業水平的 67 個主題。
自去年 11 月 ChatGPT 來襲,最先行動起來的多是雲計算公司如微軟谷歌亞馬遜。
但随着技術進一步成熟,端側大模型成為行業下一個發力點,蘋果方面已有傳聞,而小米搶先跑進第一梯隊。
把大模型塞到手機裏,好處在哪?
首先,本地運行不用擔心信号差、飛機無網絡等情況,且響應速度更快。
同時,用户隐私更有保障,也便于提供更個性化的服務。
總結一下就是:随時随地享受 AI 帶來的先進生產力。
與此同時,量子位也獲得了新版小愛同學邀測資格。
還是那個熟悉的聲音,不過在大模型加持下,小愛同學真的可以説進化成智能助手了 。
先按能力推薦,解釋一下最近很火的超導概念,不成問題。
還記得當初難倒一眾國内外大模型的弱智吧難題 " 我爸媽結婚為什麼不邀請我 " 嗎?
小愛同學表示根本不上這個當好吧。
如果一時不知道小愛大模型還有什麼玩法,也可以來到探索專區找找靈感。
從這裏也可以看出,小愛大模型還與系統做了一定程度的融合。
比如在小米金牌客服模式,剛剛上新沒幾天的旗艦折疊手機也介紹的頭頭是道,并能一鍵跳轉去商城。
據小米透露,小米搞大模型就是瞄準系統級能力,或許未來整個手機作業系統都會像這樣進化成 " 智能作業系統 " 也説不定。
但手機大模型并不是小米 AI 唯一的發力方向,這次一起亮相的機器狗二代鐵蛋就藏着不少 AI 秘密。
為什麼二代鐵蛋能比一代體型更小、運動能力更強呢?
背後小米自研的CyberGear 力控微電機,就是通過 AI 算法模拟,讓電機在性能優化的同時,還輕了 20%。
行為方面為了更加仿生,小米也基于真狗的動作,在小米機器人強化學習平台,模拟了 3 萬只機器狗進行并行訓練。
AI 技術像這樣離開純虛拟環境,來到手機、機器狗,未來到更多智能家居設備上,不單純是一種 " 賦能 ",還能發現新的創新優化方向。
過去我們就曾看到,小愛同學語音互動技術用在機器狗上,就與手機、音箱的環境大不一樣。
機器狗自身會移動,也常出現在室外噪音較大的環境,給語音識别和降噪算法提出了更高的要求,反過來推動了算法的進化。
語言大模型、多模态大模型将來同樣會遇到類似的情況,最終把新應用場景需要的特性内化到模型本身。
這也就是學術界也在探索的具身智能,大模型之後最重要的新方向之一了。
我們可以看到,今年小米發布會除了新機型之外,AI 的比重明顯更高了。
對于背後更深層次的思考,雷軍從一個公式開始講起。
小米的科技戰略,為什麼有 AI 次方?
在小米給出的(軟體 × 硬體)ᴬᴵ 公式裏暗含了一層意思:
AI 是最為關鍵的變量,它能帶來指數級的改變。
這也更進一步體現出小米對于 AI 的重視。
而背後原因不難理解,結合 AI 趨勢本身的發展以及小米所處終端市場的動向,便能找到答案。
先來看 AI 領網域内。
大模型趨勢之所以轟轟烈烈,是因為它給技術底層、行業應用都帶來深刻影響。
一方面,ChatGPT 騰空出世驗證了當模型規模突破一定量級後,會出現智能湧現的現象。這種特性讓大模型具備 " 舉一反三 " 的能力,更進一步讓 AI 應用規模化落地成為可能。
同時 ChatGPT、Stable Diffusion 也推動 AI 向生成式方向發展。當 AI 具備更豐富的創造力後,人機互動方式也會因此發生改變。最直觀的體現便是當智能助手接入大模型後,能推動人機互動向更加自然便捷的語言溝通方式發展。
另一方面,ChatGPT 引發全球全社會熱議,讓 AI 概念迅速破壁,走進千行百業和普羅大眾認知中,這使得 AI 應用落地及商業化腳步加快。
業内普遍認為,在基礎大模型之上搭建的行業大模型,将會成為未來大模型市場中的主要構成,也是帶動實際應用的主力之一。
大模型側,廠商們在過去半年來都在積極推動和產業界合作;垂直領網域内,也有以大模型為底層技術的玩家開始展露頭角,如 InflectionAI —一個主打感情陪伴的聊天機器人公司估值已達 40 億美元。
透過這些當下最新的趨勢變化,不難感受到一個事實——
AI 作為一項底層、基礎且核心的技術,正在快速變革當下時代。
而在以往技術周期裏,能夠承擔如此角色的代表技術,分别是蒸汽技術、電力驅動、計算機。
換言之,如今的 AI 也能如同它們一樣,成為未來生產力,帶來指數級增長。
那麼,怎麼利用好這一未來生產力,就成為各行業當下最關心的事。
以小米所處的終端市場為例,大模型趨勢正在向這裏演進。
現在,手機接入大模型成為諸多廠商的 " 大招 "。
不僅是讓智能助手和雲端大模型結合,并從自身場景出發大力開拓端側模型。
比如谷歌被視為拿來對标 GPT-4 的 PaLM 2,就在發布時推出了最小 " 壁虎 " 版本,可在移動設備上快速運行,包括離線狀态,每秒可處理 20 個 token。
更底層的芯片層面,也在為端側部署大模型做好準備。
高通目前通過量化、編譯和硬體加速優化,能夠在搭載第二代骁龍 8 移動平台手機上,以 15 步 20 步推理的速度應用 Stable Diffusion,生成 512 × 512 像素的圖片。
這背後反映出,大模型和手機終端正在雙向奔赴。
對于大模型來説,手機場景構建了最為豐富、廣闊的移動應用,是離普羅大眾最近的一塊螢幕,是大模型加速落地的關鍵地帶。所以為了适應手機場景,更輕量化、可端側部署的模型一定要出現。
對于手機而言,大模型正在加速重構移動應用、變革人機互動,手機行業一定會受到影響。在激烈變革下,抓住趨勢就能抓住新的增長動力,所以對于手機乃至終端廠商而言,擁抱大模型也是必然。
綜上,也就不難理解小米的最新動向裏,為何 AI 含量如此高。
無論是推出大模型版小愛同學,還是發布自研端側模型,都是從小米自身出發,擁抱趨勢後的成果。
雷軍在今年個人演講中提出(軟體 × 硬體)ᴬᴵ 這一公式,也更深入揭示了小米當下對于最新 AI 趨勢的理解。
今年,雷軍的年度演講主題選定了 " 成長 " 這一主題,在三小時的演講和年度新品發布中,他分享了過去 30 多年經歷的幾次關鍵成長和感悟。
對應來看,在這個 AI 發展史上一定會被重點标記的年份裏,小米也站在了新的關鍵節點上——
小米集團宣布進行科技戰略更新,公布科技理念,明确科技探索原則。
而這些新變化裏,AI 含量非常高。
AI 成為新小米的關鍵變量
在小米最新更新的科技戰略裏,确立了四個原則:
深耕底層技術
長期持續投入
軟硬體深度融合
AI 全面賦能
裏裏外外傳遞出一層信息:AI 将成為新小米的關鍵變量。
實際上,趨勢内外,小米這次直接生在風口裏。
首先,最新一波 AI 浪潮引發的變革,與小米技術布局和長板 " 天然适配 "。
在 2016 年,AlphaGo 騰空出世把 AI 概念更進一步推向大眾時,小米成立了首支 AI 團隊。
當時 AI 趨勢裏,深度學習和計算機視覺領網域快速發展,這不僅體現在基礎算法上,也體現在應用落地方面。如國内 AI 四小龍,最初都是以計算機視覺起家。
小米成立的第一支 AI 團隊,錨定的也是計算機視覺方向。
緊接着 2017 年,"Attention is all you need" 來了。
Transformer 架構的出現,不僅直接推動 NLP 領網域發展,同樣影響計算機視覺、語音等領網域,更是當今 AIGC 趨勢的核心底層技術——要知道,目前市面上絕大多數大模型,底層都是基于 Transformer 架構。
這一年,小米在 AI 方面的動作更大,正式成立 AI 實驗室,多方位布局,覆蓋聲學、語音、NLP、知識圖譜等領網域,甚至大模型也被列入其中。
之後幾年裏,AI 趨勢正酣,有了較為堅實的底層算法做基礎,行業應用落地腳步更快,尤其是細分領網域進展迅速。
從手機這一場景來看,典型的兩個例子是智能助手和 AI 影像。
它們都需要和產品深度結合,才能完成更進一步的探索。這方面,小米 AI 有布局,更可以説是有長板。
這次全面更新的小愛同學誕生于 6 年前,應用了小米 NLP 技術,并為如今大模型的接入應用積累了海量場景訓練數據。AI 影像算法方面,小米也專門成立團隊,如 " 夜枭算法 " 已應用在了成熟產品上。
今年 4 月,小米大模型團隊火速成立,完成了趨勢下的最新一次擴展。到如今小米 AI 團隊規模已超 3000 人。
所以 AI 大模型浪潮,小米生在其間,積累和蓄力早已完成,需要的只是把好鋼用到 " 刀刃 " 上,聚集資源實現更大的突破。
其次,技術因場景而強大,小米技術的天然優勢背後,核心還是小米業務和產品具備的場景優勢,而且小米上下都已經敏鋭地感知到了這一趨勢。
一方面,技術深入到場景中去,才能發揮更大價值。
遠的不説,就説今天最火的概念 " 大模型 " 早在 2017 年就已起步,但一直以來 AI 研究屆以刷學術指标測評榜單為主要前進方向,并未掀起太多波瀾。
直到 ChatGPT 以直面普通消費者的姿态問世,才打開聊天機器人和智能助手的應用場景,以及後面的 AI 物種寒武紀大爆發,幾乎要把每個行業改造個遍。
小米多年來正是這個理念的踐行者。這也是為什麼最新提出的公式中,(軟體 × 硬體)作為底數。
小米的場景天生從軟硬體一體出發,如智能助手小愛同學,擁有 1.1 億月活用户,支持 5900 餘款智能設備。
在多終端方面," 手機是基本盤,IoT 是想象空間 " 是很多人對小米的描述。
主陣地手機端,小米就是以軟硬體一體奠定地位的。AIoT 方面,雷軍在 2013 年便看到智能硬體和物聯網的趨勢,并率先成為 AIoT 智能生活的定義者。
2021 年,雷軍親自挂帥小米造車,補齊了小米在 " 人車家 " 的最後一環,由此小米全場景智能生态構建完成。
乃至仿生機器人方面,小米如今已推出兩代 CyberDog、人形機器人 CyberOne,提前布局未來家居場景。
另一方面,技術深入到場景中去,才有了融合進化的空間。
比如小米手機上廣受好評的 " 萬物追焦 " 功能,其實最早是從 CyberDog 機器狗上的 " 主人追蹤 " 技術;小米自動駕駛進展非常快,得益于 2017 年創辦的小米人工智能實驗室;同樣,自動駕駛部門的很多技術,也應用在 CyberOne 上,又構成了仿生機器人的大腦。
而在最新大模型趨勢下,如手機、仿生機器人等,都是正被廣泛熱議的落地場景。
也正是小米擁有的如此豐富的場景,讓 AI 的技術應用和迭代更加令人期待,畢竟 AI 歸本溯源,不論是深度學習算法還是如今的大模型範式,背後最核心的競争力還是基于數據的迭代。而小米擁有的場景、終端、數據體量,都是 AI 技術落地和體驗的絕佳保障。
以及别忘了,小米還有 AI 迭代的最可靠保障——米粉用户。
在 ChatGPT 的一鳴驚人之後,基于人類反饋的強化學習機制被反復提起,而這種關鍵的機制方法要素,沒有哪個玩家比小米更有方法論和話語權。
最後,AI 之所以一定會刷新小米,最關鍵的還在于決心。
這種決心,既是小米的技術底色和研發投入上的有史為鑑,更有程式員出身的雷軍始終如一對技術的堅定和知行合一。
一直以來,小米的產品體驗太強而讓技術被迫 " 失色 ",以至于不少人忽略了小米的技術之強,布局之全。
所以 " 新小米 " 并不是説小米才剛剛開始改變,而是把一直以來在技術創新上做出的持續努力更好地展現在台面之上。
在雷軍演講現場,他專門強調了小米技術研發已布局 12 個技術領網域,包括 5G 移動通信技術、大數據、雲計算及人工智能,同時基于智能制造,進入機器人、無人工廠、智能電動汽車等,涉及 99 個細分賽道。
從軟體、硬體,從微觀技術棧到宏觀產業賽道,都堪稱全面。
2016 年以來小米在技術上的持續布局,造就了今天 " 新小米 " 開始展現技術的滾雪球效應。
雷軍披露,在最體現實力的技術專利方面,截至 2023 年 3 月 31 日,小米全球授權專利數超3.2 萬件。其中,在中國信息通信研究院發布的 5G 标準必要專利聲明有效全球專利族企業排名中,小米全球專利族占比 4.1%,首次進入前十——是最年輕玩家。
當然,這些技術積累的背後,也離不開研發投入的持續增加,從 2017 年到 2022 年,小米在技術研發方面投入增幅為 38.4%。
2022 年,小米研發投入約 160 億,同比增長 21%。預計 2023 年全年總研發投入将超過 200 億,未來五年(2022-2026)研發投入将超過 1000 億。
所以當 "AI 成為新小米的關鍵變量 " 的説法一出,質疑的聲音或許有多個維度,但沒有一個維度是關于戰略定力、決心和執行力的。
小米這家公司," 永遠相信美好的事情即将發生 ",但這種信念背後,是知行合一、日拱一卒的執行力,一步步把事情做成,把夢想變成目标,把目标拆解成一個個量化指标,最後總能做好、做成。
實際上,大模型趨勢發生以來,追逐風口、看到機遇的人很多,制定 AI 戰略規劃的公司也不在少數。
但當小米入局,沒有人不關注,沒有人不重視。背後正是小米這種創業 13 年積累的江湖戰績和商譽。
不過如果非要歸本溯源,小米的 AI 想象空間和戰略定力,或者小米技術相關的一切,最終都歸于一個人,只要他在,外界就相信小米對于技術的認真、堅持和一定能成。
這個人就是雷軍,小米的掌舵者,中國最早一代程式員,也是早期最厲害的技術大佬之一——他大二寫的匯編代碼,時隔三十年後還在知乎上被熱議。
如果説中國有多少企業家真正有敏鋭的技術洞察和趨勢,雷軍肯定是排在名單最前的一個,也正因如此,他能更容易看懂、看透技術趨勢,也對 AI 這樣的底層技術開發,也會更有耐心。
技術也好,AI 也好,對于小米不會是三分鐘熱度,而是始終不變的底色。
這也是為什麼小米從成立以來,就始終強調技術為本。包括在 " 新小米 " 的戰略更新中,雷軍也特意強調了其中 " 小米的不變 ":
無論時代如何變化,小米依然會堅持自己的使命、願景、價值觀,堅守 " 技術為本 " 的鐵律。
這種技術為本,可以本質到什麼程度?
雷軍在今年的演講中也給出了答案:選擇對人類文明有長期價值的技術領網域,長期持續投入。
這是一段算不上簡潔的表達,但似乎琢磨幾遍之後,會發現一個字都不能少。
足夠遠大的夢想是胸懷人類文明,判斷投入的标準是長期價值,雷軍和小米的方式是技術,而一以貫之的方式則是:長期、持續、投入。
— 完 —
點這裏關注我,記得标星哦~
一鍵三連「分享」、「點贊」和「在看」
科技前沿進展日日相見 ~
>