今天小編分享的科技經驗:通義千問與文心一言對比評測:誰才是蘋果AI的“黃金搭檔”?,歡迎閲讀。
4499 元起,iPhone 16e 來了,該不該買卻要慎重考慮。
僅看硬體配置,同價位的安卓手機應該沒有比它更差的,但對于蘋果用户而言,iPhone 16e 是價格最低的 AI iPhone,是預算有限又想體驗蘋果 AI 功能的消費者的最佳之選。
去年 10 月蘋果就表示,Apple Intelligence 将于 2025 年 4 月初推出簡體中文版。現在 iPhone 16e 商品頁面又顯示 Apple Intelligence 推出時間将依監管部門審批情況而定,表明該功能已完成開發并送審,大概率可以如此前的宣傳一般,在 4 月初與 iOS 18.4 一同上線。
(圖源:蘋果)
為确保 Apple Intelligence 符合國内相關要求,蘋果需要在中國尋找 AI 企業作為合作夥伴,方能為中國用户提供 AI 功能。最初豆包、百度等 AI 公司傳出過與蘋果合作的消息,經過一番篩選後,蘋果被曝選擇了阿裏巴巴作為合作夥伴,放棄了百度。2 月 13 日,阿裏巴巴聯合創始人蔡崇信在阿聯酋迪拜舉辦的 World Governments Summit 2025 峰會上,确認了與蘋果合作的消息。
然而據科技媒體 The Information 報道,蘋果并未放棄百度,同時與阿裏巴巴和百度兩家企業合作,百度也會參與部分 AI 套件的研發工作,包括中文版 Siri 語音助手更新、圖片和文本智能搜索等。
百度、阿裏巴巴、騰訊三家企業曾并列中國互聯網三巨頭,合稱 "BAT",進入 AI 時代後分别開發出了文心一言、通義千問、騰訊混元三大 AI 大模型。蘋果同時與百度和阿裏巴巴合作,令小雷想到了當初蘋果讓供應商内卷的畫面,唯有實力強勁的供應商才能加入果鏈。那麼問題來了,百度和阿裏哪個才是蘋果 AI 領網域的 " 黃金搭檔 "?
在之前關于 AI 大模型的測試中,小雷曾多次對比過通義千問、文心一言、豆包、Kimi、DeepSeek 等國產 AI 大模型,但當時文心 4.0 及更強的大模型收費服務,為公平起見,小雷選擇了免費的文心 3.5 大模型。
現在,百度已宣布文心一言将于 4 月 1 日起免費服務,6 月 30 日起開源模型。在免費服務之前,每天還會發放 VIP 體驗券,幾乎等同于已經免費服務。因此,小雷決定用文心一言最強的文心 4.0 Turbo 對比通義千問屢獲殊榮的 Qwen 2.5 模型。
考慮到阿裏巴巴、百度與蘋果合作是為了向 iPhone 用户提供 AI 服務,小雷将此測試項目問題全部設為我們日常使用手機時,可能會遇到的問題或需要處理的事項。
常識問答:PC 端通義千問才是完全體?
在針對 AI 的測試項目中,常識問答一般最為簡單,小雷本以為這場測試難以體現出 AI 大模型的差距,結果卻令小雷有點驚訝。
早有假期旅遊計劃的小雷,向 AI 提出的第一道問題為 " 今年高速哪些時間免費 "。通義千問并未将今年高速所有免費時間段全部告知小雷,僅給出了春節期間高速免費開始和結束時間。不死心的小雷問了兩次,得到的回答完全相同。文心一言則将春節、清明、勞動節、國慶節四個時間段,高速免費開始和結束時間全部統計出來,并備注了免費通用型車輛的标準。
(左:通義;右:文小言;圖源:App 截圖)
需要注意的是,當小雷切換至 PC 端,再向通義千問詢問該問題,居然得到了正确答案。可小雷第三次使用手機端通義 App 詢問該問題,通義千問依然給出了與前兩次相同的錯誤答案。
(圖源:通義千問截圖)
從結果來看,通義千問在常識解答方面的能力不輸文心一言,只是自身網頁版和手機 App 似乎存在差距,手機端三次回答全部錯誤,PC 端一次就回答正确。考慮到這層因素,接下來的幾輪測試,全部改用網頁版通義千問和文心一言。
工作提效:文心、通義各有所長
許多較長的論文、文檔小雷總是沒有時間從頭看到尾,好在 AI 大模型基本加入了内容總結功能。本輪測試小雷便選擇了此前清華大學新聞與傳播學院、新媒體研究中心、元宇宙文化實驗室聯合推出的《DeepSeek:從入門到精通》檔案,讓通義千問和百度為我們分析、總結 DeepSeek 的使用技巧。
通義千問總結的内容分為六大板塊,前四個板塊均為分析 DeepSeek 的領先性和應用場景,第五板塊為清華大學的貢獻,最後一個板塊為未來展望,每一個板塊的内容都極為簡略,倒是可以作為 DeepSeek 入門前了解基礎知識的閲讀材料,跟 " 精通 " 二字完全無關。
文心一言總結出的内容分為 12 個小板塊,每個板塊同樣簡略,但并未忽視提示語的重要性和使用技巧板塊,忽略了對于用户沒有意義的清華大學貢獻一欄。當然,文心一言總結的内容僅僅是略勝一籌,如果説通義千問總結的内容像大标題及簡單介紹,文心一言總結的内容則是小标題加内容梗概,實質性内容依然稀少。
(圖源:文心一言截圖)
車轱辘話亂轉,重點内容過于簡略,罕有實用性的内容,是當前 AI 大模型總結内容時普遍存在的問題。數萬字的檔案,濃縮成數百字,難免需要舍棄大量内容,在使用 AI 總結篇幅較長的文檔時,最好還是自己按照生成的内容,再大致看一下原文檔。
為進一步測試兩款 AI 大模型的能力,小雷決定縮小範圍,讓大模型根據檔案中提示語鏈相關的内容,撰寫一篇提示語鏈作用與設計原則的文章。
這輪測試中,通義千問一改之前簡略的風格,提示語鏈的作用、設計原則、設計模型三大板塊均面面俱到,教導用户該如何設計和使用提示語鏈。
文心一言則延續了簡約的風格,作用機制的分析和設計原則的解讀給人一種未能準确理解檔案的感覺。
本輪測試中,PDF 全文解讀方面,文心一言表現稍好,提示語鏈專項内容生成方面,則是通義千問領先,二者互有優勢。蘋果同時與阿裏巴巴、百度合作,或許可以綜合二者的特點,為用户提供更完善的 AI 體驗。
360 開發的納米 AI 搜索 App,便提供混合模型方案,聯合 15 家大模型廠商打造 AI 助手,能夠自動調整大模型回答問題。未來或許其他企業也會采取此類方案,通過混合模型解決單一模型不擅長部分領網域的問題。
圖片修改:文心再勝一場
AI 攝影、AI 修圖在今天已是極為常見的功能,許多手機廠商還會在新機發布時宣傳 AI 修圖功能。小雷也對通義千問和文心一言的圖片修改功能進行了測試,但本輪測試出現了一點意外。
通義千問本身不支持以文字指令修改圖片,雖提供諸多可修改圖片的智能體,但這些智能體卻均不支持上傳圖片,無法正常使用,唯一可上傳圖片的修圖智能體是 AI 擴圖,又僅是等比例縮小或放大圖片,并非根據畫面已有内容,額外繪制不存在的内容。
文心一言倒是根據小雷的要求,成功将圖片的背景從灰蒙蒙的天空替換成藍天白雲。可燈塔主體卻重繪,不再是原來的燈塔,根據拍攝照片和要求重新繪制了一張圖,僅保留了主體的特征。
為進一步測試兩款 AI 大模型的制圖能力,小雷以 " 海邊矗立着一座孤獨的燈塔,唯有藍天白雲和海鳥與其相伴 " 為描述語,要求通義千問和文心一言各生成一張圖。從圖片質量來看,文心一言生成的圖片意境、清晰度、美感等方面均更勝一籌,而且文心一言會一次生成四張圖片供用户選擇。
(圖源:通義千問生成)
(圖源:文心一言生成)
本輪測試文心一言再次獲勝,既可以根據原圖重新繪制圖片,也能根據用户的描述生成圖片,而且生成的圖片質量更高,原圖大小為 1.48MB,通義千問生成的圖片原圖大小則僅為 73.2KB(注明:兩張圖片原圖分辨率均為 1024×1024)。
通義千問 Qwen 2.5 作為一款開源模型,追求的是便于用户部署、使用、修改,更注重 B 端場景,對于 C 端用户的需求似乎沒有那麼上心。文心 4.0 Turbo 曾是閉源模型,面向 C 端用户收費,因而需要豐富手機 App 和 PC 端的功能。本輪測試的落後,并不等同于通義千問 Qwen 2.5 落後文心 4.0 Turbo。
以上幾輪測試中,通義千問和文心一言均有自己的優勢項目:百度在圖片生成和文檔總結方面表現較好,通義千問則在提取重點内容并撰寫文章方面更加出色。
因模型架構、訓練所用的數據存在差異,AI 大模型之間自然也會出現優勢領網域不同的情況。蘋果同時與阿裏巴巴、百度合作,可能有充分利用兩家企業的優勢,實現揚長避短,在各種場景下均能為用户提供行業第一梯隊的體驗的考慮。
中文版 Apple Intelligence 與英文版在體驗方面很可能會存在較大差距,哪一個更領先還不好説,阿裏巴巴加上百度的 AI 實力加持的 Apple Intelligence,值得期待。
4499 元起的 iPhone 16e 略貴,好在 128GB/256GB 版本定價低于 6000 元,可享受政府補貼,3999 元 /4999 元即可入手,各大電商平台大概率也會推出一定的優惠方案。相較 iPhone 16 系列其他機型,擁有價格優勢且支持 Apple Intelligence,能否推動蘋果銷量翻盤?關鍵還要看蘋果在中國市場端出來的 "AI 大餐 " 的體驗。
在蘋果 AI 亦步亦趨時,安卓 / 鴻蒙陣營的手機品牌在 AI 上進展神速。
在海外市場,聯想(Moto)和三星靠着 Google Gemini 和運營商支持正 " 大殺四方 ";在國内市場,小米、華為、OPPO、vivo、榮耀等品牌已完成各自 AI 化進程,AI 功能可圈可點甚至讓人眼花缭亂,甚至成了手機廠商 " 卷 " 的新焦點。
25 年春節後 DeepSeek 爆火,國產手機廠商(除了小米)大都第一時間接入了 DeepSeek,這其實證明了安卓手機開放性的優勢:以後 DeepSeek 新模型,或者比 DeepSeek 更強的 AI 模型出現,安卓手機都可在第一時間接入,絕不掉隊。
然而 iPhone 就只能讓用户等,因為蘋果封閉模式必須點對點合作,這會讓 iPhone 用户的智能體驗有代差。其實在中國用户等待蘋果智能這半年時,DeepSeek R1/V3,xAI Grok 3 以及百度文心 4.5(即将發布,開源且免費)就已紛紛發布,AI 技術進步可謂是一日千裏。姗姗來遲的蘋果智能真能打嗎?小雷很悲觀。
對中國用户來説," 蘋果智能 " 依然是懸而未決的 " 餅 "。從春節到現在,中國用户正在習慣使用強大的 DeepSeek 以及接入 DeepSeek 的微信、百度以及國產安卓手機等產品的 AI 服務,對 AI 的期待正在變得越來越高。蘋果與阿裏或者百度合作落地的 " 蘋果智能 " 能否滿足中國用户預期,依然有待觀察。