今天小編分享的科技經驗:微信聊天框内置元寶,超級App又一輪進化開始,歡迎閲讀。
頭圖來源:視覺中國
微信終于在聊天框放了個 AI 助手。
雖然名稱上還是「元寶紅包封面助手」,但在介紹裏可以看到其是依托于騰訊混元大模型的 AI 服務,可以提供陪聊、答題、作圖以及定制紅包封面等功能。
微信作為國内最大的社交平台,這次内置 AI 助手元寶或許意味着 AI 技術正在從獨立功能向基礎設施轉變,騰訊正在将微信的生态優勢轉化到 AI 領網域。
這會是騰訊重回 AI 牌桌的絕殺開端嗎?
實測,用 AI 更絲滑了
極客公園做了一番簡單實測。先是問了一下它和元寶 app 的異同有哪些:
然後我丢入一篇極客公園昨天發布的公眾号文章鏈接,内容是關于 DeepSeek 發布 V3 模型更新,「元寶紅包封面助手」回復説「收到,我問問元寶~」,這個回復有點人性化的。
随後它也沒問我是否需要開啓深度思考,就直接進行了 21 秒的深度思考:
元寶的深度思考過程|圖片來源:極客公園
然後給出了我一份分析:
DeepSeek 公司于 2024 年 3 月 24 日發布了 V3 模型的重要更新,該版本雖非預期的 V4 或 R2 迭代,但在性能表現和開源政策上實現了顯著突破。以下是本次更新的核心要點:
該更新标志着 DeepSeek 在保持成本優勢的同時,通過技術迭代縮小了與頂尖閉源模型的差距,特别是在編程領網域展現出颠覆性潛力,其開源策略調整或将重塑大模型生态格局。
技術規格與發布信息
模型參數規模達 6850 億,屬于小版本更新(V3-0324)
基于全新 32K GPU 集群進行後訓練優化
已通過官網、App 及小程式等多渠道開放使用
開源版本同步上線,延續初代 V3"557.6 萬美元成本比肩 Claude3.5" 的高性價比特性
核心能力提升
編程能力跨越式突破
前端開發能力接近 Claude3.7 專家級水平,用户測試顯示:
能生成包含 CSS 動畫與 JavaScript 互動的完整 HTML 檔案(如天氣卡片動态效果)
代碼質量顯著優于舊版 R1 模型(對比案例顯示視覺效果與功能實現差距明顯)
在網站搭建測試中生成效果與 Claude3.7 Sonnet 相當
支持復雜指令解析(如通過函數 / 按鈕組實現多天氣動畫切換)
多模态理解增強
上下文理解能力提升,尤其在多輪對話場景
可精準處理跨語言混合編程需求(示例未展示但文中暗示)
開源生态建設
采用更寬松的開源協定,降低商業應用限制
延續初代 V3 作為首個衝入 Chatbot Arena 榜單前十開源模型的優勢
發布 1 小時内即吸引全球開發者參與測試驗證
行業影響與用户反饋
被專業用户評價為 " 相當于 Claude Sonnet3.5 到 3.6 的更新幅度 "
在無官方基準測試情況下,用户實測數據成為主要驗證依據
開發者社區高度關注其開源協定調整帶來的商業化可能性
未來展望
官方未透露 V4/R2 研發進展,但用户期待值持續升温
當前版本已确立開源大模型領網域新标杆,可能加劇行業競争
眼看清明節就要到了,我也問了問它「清明節做點什麼好」,對這個問題它倒是沒回復「收到,去問元寶」,也沒開啓深度思考模式,而是很快就輸出了答案:
清明節,作為中國傳統節日之一,不僅是緬懷先人、寄托哀思的時刻,也是親近自然、感受春天氣息的好機會。以下是一些清明節期間可以進行的活動建議:
無論選擇哪種方式,重要的是要用心感受節日的意義,珍惜與家人朋友相處的時光,同時也要注意安全和環保,讓清明節成為一個有意義且愉快的假期。
祭掃祖先:前往祖墳或陵園,清掃墓地,獻上鮮花、紙錢等,表達對逝去親人的懷念和敬意。
踏青賞春:利用清明假期,與家人朋友一同外出踏青,欣賞春天的美景,呼吸新鮮空氣,放松心情。
植樹造林:參與植樹活動,為大地增添一抹新綠,既是對自然的回饋,也是對生命的禮贊。
品嘗清明食品:制作或購買清明節特有的食品,如青團、清明果等,體驗傳統節日的風味。
文化體驗:參觀博物館、文化遺址,了解清明節的歷史文化背景,增長知識。
家庭聚會:利用假期與家人團聚,共叙親情,享受家庭的温馨。
靜思冥想:在寧靜的環境中,進行冥想或靜思,反思生活,規劃未來。
公益活動:參與社區或慈善機構組織的公益活動,幫助需要幫助的人,傳遞正能量。
户外運動:進行徒步、騎行、野餐等户外活動,鍛煉身體,享受户外的樂趣。
攝影創作:帶上相機,捕捉春天的美麗瞬間,進行攝影創作,記錄生活的美好。
還有分析檔案的功能我也試了一下,之前如果看到比較復雜的檔案想讓 AI 先幫忙概括總結一下要點再去細讀的話,得先去打開 AI 產品或者去相應的網頁,但現在可以直接在微信裏丢給這個助手,使用體驗更絲滑了一些。
這次「元寶紅包封面助手」也自行開啓了深度思考模式:
在 21 秒的深度思考後,助手給出了出一份分析:
對文檔内容的技術分析與行業洞察
一、語言模型技術演進
核心突破:
從 N-gram 到 Transformer 的範式轉變,語言模型參數量級從百萬級(GPT-1)躍升至萬億級(GPT-4)
自監督學習(MLM/NSP)解決了海量數據标注難題,預訓練 + 微調模式成為行業标準
詞嵌入維度從 768(BERT)擴展到 12888(GPT-3),語義表征能力呈指數級提升
關鍵技術指标:
訓練數據量:GPT-3 使用 45TB 數據(約 1 萬億詞),相當于 1351 萬本牛津詞典
算力成本:ChatGPT 訓練需 1 萬張 V100 GPU,成本超 10 億人民币
模型效率:DeepSeek 通過稀疏注意力等技術,将訓練成本降低至同規模模型的 1/3
二、Transformer 架構創新
技術革命性:
自注意力機制實現 O ( n ² ) 的全局關聯建模,相比 RNN 的序列依賴突破顯著
多頭注意力層數從 12 層(BERT)增至 96 層(GPT-3),上下文視窗從 512 擴展到 32K(Llama2)
位置編碼從絕對位置(Sinusoidal)發展到相對位置(RoPE),更好處理長序列
工程實踐突破:
混合精度訓練(FP16/FP32)節省 40% 顯存消耗
梯度檢查點技術(Gradient Checkpointing)實現百倍序列長度擴展
張量并行 + 流水線并行将千億參數模型訓練效率提升 80%
三、DeepSeek 的技術突破
開源生态貢獻:
模型架構:提出動态稀疏注意力機制,推理速度較 Llama 提升 2.3 倍
訓練效率:MoE 架構實現萬億參數模型在千卡集群上的可行訓練
中文優化:構建包含 2.6 萬億 token 的中英雙語預訓練語料庫
性能指标對比:
數學推理:DeepSeek-Math-7B 在 GSM8K 達到 83.5% 準确率(GPT-4 為 92%)
代碼生成:HumanEval 得分 68.9%(CodeLlama-34B 為 53.7%)
多模态理解:ViT-22B 在 ImageNet-21K 上 top-1 準确率達 88.7%
四、行業發展趨勢
技術前沿方向:
多模态融合:GPT-4o 實現 200ms 級跨模态響應延遲(人類平均反應時間 250ms)
推理能力突破:DeepSeek-V3 在定理證明任務上達到 IMO 金牌選手水平
能源效率:新型混合架構(如 DeepSeek-R1)實現每瓦特算力提升 5 倍
中美競争格局:
開源模型差距從 12 個月縮短至 3 個月(Llama3 vs DeepSeek-v2)
算力基建:中國在建智算中心規劃算力達 2000EFLOPS(美國當前運營 1200EFLOPS)
行業應用滲透率:中國制造業 AI 質檢部署率達 37%,超越美國 29%
五、關鍵數據啓示
經濟學視角:
大模型訓練邊際成本曲線:參數規模每提升 10 倍,部門 token 訓練成本下降 28%
ROI 周期:頭部企業模型商業化回報周期從 36 個月縮短至 18 個月
人才密度:頂尖 AI 研究員中美薪資差距從 50% 收窄至 15%
技術倫理考量:
安全對齊:最新 RLHF 技術将有害輸出概率從 3.2% 降至 0.07%
能耗優化:液冷集群 PUE 值從 1.5 優化至 1.08,碳排放減少 40%
可解釋性:因果歸因算法實現 85% 的決策路徑可視化
注:文中涉及企業及技術參數均來自公開資料,分析基于技術演進規律推導,具體實施需結合行業動态調整。建議關注浙江大學 CCAI 中心官網獲取最新研究成果。
看來關于是否開啓深度思考模式,「元寶紅包封面助手」有自己的判斷,如果任務很簡單,就不開啓,反之自動開啓。
加速 AI 布局
過去一個月,騰訊在 AI 應用領網域加速布局。
2 月起,騰訊旗下多個核心產品,如微信、元寶、QQ 浏覽器、QQ 音樂、ima(騰訊智能工作台)、騰訊文檔、騰訊地圖等,均接入了 DeepSeek 模型,并同步支持自研的混元大模型;元寶走向日更級迭代,35 天版本更新 30 次;混元大模型推出騰訊首個自研推理模型混元深度思考模型 Thinker ( T1 ) 、發布新一代快思考模型 TurboS、推出 5 個全新 3D 生成模型并全部開源……
業務線也作出整合,為了更好地發揮 AI 技術的協同效應,2 月,騰訊将 QQ 浏覽器、搜狗輸入法、ima 等十餘款 AI 產品及團隊從 PCG(平台與内容事業群)劃歸 CSIG(雲與智慧產業事業群),形成以 " 元寶 " 為核心的 "C 端工具 +B 端服務 " 矩陣。
在資金投入上,騰訊也展現了其在 AI 基礎設施建設上的決心。在 1 月的 2024 年度員工大會上,馬化騰提到騰訊會持續投入資源進行算力的儲備。據報道,騰訊計劃在 2025 年加大算力基礎設施的投資,投資金額或達 1000 億,其中計算約 580 億(GPU 約 400 億、伺服器約 110 億、存儲設備約 55 億、網絡設備将近 58 億),IDC 部分,自建及相關費用加起來将近 131 億,租用部分将近要花 200 億。3 月 19 日,騰訊總裁劉熾平在财報後的電話會議上稱,資本支出占收入的百分比将上升到十幾個百分點,人工智能将成為戰略投資的重點。
微信這次将大模型產品 " 元寶 " 内嵌于聊天界面,看似是功能更新,實則是騰訊對 AI 時代的戰略卡位。
通過将大模型產品以「AI 版檔案傳輸助手」形态嵌入高頻聊天場景,微信将用户的工作流、信息流統一收束,通過總結公眾号文章、解析檔案、圖片等剛需功能,微信在原有的功能之外,新增了一個可以持續產生價值的 AI 助手角色,這可能會讓用户在微信的停留時長和打開頻次迎來結構性增長。
微信作為國内最大的社交平台,這次内置 AI 助手元寶或許意味着中國互聯網正式進入 "AI 原生應用 " 時代,AI 技術正在從獨立功能向基礎設施轉變。
而随着開源日漸成為行業趨勢,單純的大模型技術能力越來越難以成為產品和市場競争的絕對壁壘。當微信這樣的龐大生态,帶着海量用户接入 AI 功能,對于所有的 AI 創業者來説可能都要思考:到底什麼樣的功能和創新,可以讓小公司與微信這樣的生态競争用户接觸 AI 的入口;到底什麼樣的壁壘,才能不被現有的超級產品生态,以接入新功能的方式吞噬。
DeepSeek 重塑了 AI 行業的格局,技術公司、大廠和 AI 原生創業者,都要重新思考自己的生态位。