文心一言向社會全面開放，到底是誰需要誰？

今天小編分享的互聯網經驗：文心一言向社會全面開放，到底是誰需要誰？，歡迎閲讀。

圖片來源 @視覺中國

文 | 太平洋科技

8 月 30 日晚間，百度旗下 AI 大模型文心一言宣布向全社會全面開放，所有用户都可以體驗這款 AI 大模型了。

8 月 31 日的時候，百度方面又公開表示，開放下載 12 小時後，文心一言 App 登上了蘋果商店免費榜榜首，成為首個登頂的中文 AI 原生應用。

與此同時有多家媒體報道稱，國内将有 11 家大模型陸續通過審批備案，從 8 月 31 日起陸續向全社會公眾開放服務。顯然，文心一言是其中最早與用户見面的那個。

相關的消息也受到了互聯網、科技圈的聚焦關注，各類觀點、分析、報道層出不窮。不過雖然互聯網、科技圈嗨了，但似乎普通用户對文心一言乃至整個 AI 大模型的感知都并不高。

PConline 随機詢問了多位非互聯網、科技圈的用户，普遍表示并不了解文心一言以及眾多 AI 大模型，即便對于此前爆火的 AI 大模型 ChatGPT，也僅僅只是聽過名字而已，對于具體的功能内容并不了解。

從數據來看也是如此，更多的人或許還并不了解和關注 AI 大模型。百度搜索指數顯示，文心一言、ChatGPT 的相關搜索熱度始終保持着較為平緩的曲線，并未出現太大的波動，而從熱度數值的對比來説，則是遠遠低于抖音這樣的主流 App 應用。

這其實與大模型尚處于發展早期，相關平台還需要經歷長期的迭代完善，缺乏現象級的應用與用户產生連接等方面有關。即使是如今面向社會開放的文心一言，也還有許多不盡如人意的地方。

文心一言，總出錯？

按照百度方面的介紹，文心一言并非倉促上馬的項目，而是經歷了數年的發展積澱。文心一言的基礎模型文心大模型發布于 2019 年，近期更新的文心大模型 3.5 也持續在十餘個國内外權威測評中位居第一。

例如今年 7 月據多家媒體報道，人民數據研究院選取文心一言、訊飛星火、通義千問、ChatGPT 四個主流 AI 大模型進行評測，結果顯示文心一言排名第一。

從評測維度可以看到，在内容生态、數據認知、邏輯推理等方面，文心一言均有着一定的優勢能力。這其實不難理解，畢竟百度深耕 AI 領網域多年，有着很強的 AI 技術積累，作為頭部搜索平台，在大數據方面自然也是有着一定優勢的。

不過雖然文心一言在各類測評中取得了好成績，但在實際的使用體驗上仍然有不少被用户吐槽的地方，其 AI 智能程度也似乎并未達到部分用户的預期。

例如在文心一言榜單登頂的蘋果商店中，按照時間順序查看到的用户評論幾乎都為負面，主要集中在答非所問、内容錯誤等方面。PConline 也發現，在華為應用商店、vivo 應用商店的文心一言評論區，同樣出現了不少類似的吐槽評論。

PConline 在實際體驗中也發現了一些事實錯誤的情況，同時也有一些表現得不夠智能，不夠出彩的地方。

例如 PConline 在百度搜索裏找到了一張羅納爾多的照片，拿來問文心一言時得到的回復卻是貝利。

同樣的，PConline 在百度搜索中獲取了一張姆巴佩的照片，文心一言通過一番推理，用一種不太确定的口吻回答説這人可能是姆巴佩。與此同時，法國隊并未獲得 2022 年世界杯冠軍，即便在 2018 年奪冠的那一屆，也不存在制勝一球的説法，法國隊 4 粒進球中也只有一球來自于姆巴佩，所以無論從哪個維度來説，文心一言給出的信息都算不上準确。

在文心一言宣傳中提到的寫文章功能上，PConline 在簡單的測試中發現結果似乎并不太智能。

PConline 用今年暑期曾備受關注的上海迪士尼門票争議的新聞話題，讓文心一言寫一篇文章，得到的内容只能説是一篇較為初級的分析文章，重點是全文完全沒有提到此前發生的一些新聞事件和輿論争議内容，而這些恰恰是百度搜索引擎中最容易獲取到的信息數據。

在體驗中 PConline 還遇到了一個有趣的小插曲，當你問類似" 百度遇到過什麼失敗 "等與百度公司相關的非正面話題時，文心一言要麼拒絕回答，要麼直接結束對話。但當同樣的問題，主體換成其他企業時，文心一言會正常給出回答内容。

當然，作為百度開發的一款 AI 大模型，維護百度的形象、避開百度的一些負面内容，這并沒有什麼問題，但如果能在這方面也保持客觀公正的态度，像回答阿裏失敗案例那樣坦然回答百度過往的一些不足的話，就可以視為 " 出彩 " 的表現了。

用户來體驗，順便當個 " 工具人

回到文心一言被吐槽的内容錯誤問題上。"AI 大模型怎麼總會給出錯誤答案？"有意思的是，PConline 也将這個問題抛給了文心一言，得到了一個頗為誠實的回答。

文心一言将原因分為了這幾點。首先是數據訓練不足，AI 大模型的準确性與其所依賴的數據訓練密切相關，如果訓練數據不足或不夠多樣化，AI 大模型可能無法準确解析結果。

第二點是語義理解存在一定的挑戰。AI 模型往往是通過深度學習算法來學習和理解文字、影像等内容形式的，這個過程存在着非常多的困難和挑戰。比如當面對抽象畫或有着多重含義的内容時，AI 大模型可能無法進行準确的解析。

文心一言也表示，為了克服這些問題，研究人員可以通過增加訓練數據、改進模型架構和提高算法精度等方式來優化 AI 大模型。同時對于含有特定語義信息的影像，如抽象畫，可以通過額外的标注或特定的訓練來提高模型的解析能力。

簡單來説，AI 大模型想要變得越來越完善，越來越好用，就需要更強的大數據庫，更精準的訓練算法，更高強度的使用頻次。

那麼該如何更好地解決這些問題呢？AI 領網域有一個十分直白的法則，" 人多力量大 "。不妨試想一下，面向大眾開放，讓海量的用户參與到使用中來，是不是能滿足這幾大關鍵條件？

用一個故事可以很好地理解這一點。人工智能、計算機視覺科學家李飛飛曾在 2009 年就發表過一篇論文，講述了來自全球 167 個國家近 5 萬名工作者，以眾包的方式通過三年努力，人工标注出了 1500 萬影像。

正是這 5 萬人的努力，讓 AI 產業收獲了一個有标志性意義的數據集，這龐大規模的标注性數據，對 AI 領網域中的計算機視覺技術的發展，起到了極為重要的推動作用。

無獨有偶，在遊戲領網域，一款網絡遊戲在正式上線運行之前，必須要經歷内測和公測階段。顧名思義，公測就是公開測試的意思，主要就是為了邀請更多的用户參與進來，側重于客户端可能出現的問題，測試伺服器的性能和查找程式的 BUG 等等，是產品正式上線運營以及不斷迭代優化的必要環節。

所以簡單來説，大家可以把文心一言此次的 " 對全社會開放 " 理解為公測，只有越來越多的用户參與進來，不斷使用文心一言，產生越來越多的使用體驗、反饋意見等數據，才能讓文心一言更好地完善功能、迭代發展。

實際上，從文心一言的功能設計也能看出用户的真實體驗和反饋對其 AI 大模型發展的重要性。幾乎在每一次與用户的互動後，文心一言都會出現一個比較醒目的按鈕圖示，方便用户對回答内容和互動體驗的評價，用户可以點擊贊或者踩，無論點擊哪一個按鈕，文心一言都會彈出新的視窗，希望用户能更為詳細地記錄和反饋真實意見。

其實百度創始人李彥宏説的一段話也值得大家關注，" 當文心一言向數以億計互聯網用户大規模開放服務後，能夠獲得大量真實世界中的人工反饋，這将進一步改進基礎模型，并以更快速度迭代文心一言，創造更好的用户體驗。"

這段話其實也意味着，所謂的百度文心一言向全社會全面開放，并不是百度單方面給予社會、用户的一項利好，用户的體驗和反饋，對于百度文心一言來説或許才有着更為重要的意義和價值。

但 PConline 需要指出一個十分重要的地方，文心一言在面向全社會開放的階段，是否更應該先完善好信息錯誤這個最核心的問題，而不是指望在後續的用户使用中，讓用户來幫忙完成。

不妨想想，如果這是一款新上市的汽車，廠家跟消費者説，我們的車子可能會偶爾失靈、失控、開到錯誤的路上，我們的車子還存在很多安全漏洞，不完善的地方，希望各位消費者在後續的使用體驗中多多反饋這些問題 ...... 那麼這家汽車廠商還有存在的必要嗎？

回看文心一言，用户在使用過程中如果得到的信息和内容本身就存在錯漏，會引發的負面後果是難以估量的，尤其在文心一言對全社會開放，大量的用户湧入後，這樣的風險和危害性或将成倍增長。

試想一下，如果每天有一定數量的虛假、錯誤内容經由 AI 大模型傳遞給了海量的用户，會出現怎樣的後果？最直接的就是會出現無數個現代版的 " 三人成虎 " 案例，嚴重的話會導致整個互聯網空間充斥着謠言、虛假新聞、錯誤信息等不可信内容。

量子位就曾在一篇相關報道中，将這樣的現象稱為"AI 正在污染中文互聯網 "。

簡單來説，AI 生成的内容并不是憑空而來的，而是需要一定的信息素材作為基礎。當 AI 因為各種原因生成了錯誤、虛假信息後，這些信息又可能成為另一個 AI 生成内容時的素材。

當互聯網空間充斥着 AI 制造的垃圾信息後，這種無限套娃式的 AI 信息傳遞，就會變成一個輸入和輸出都是垃圾信息的死循環，這是一個十分可怕的糟糕局面。

這不僅僅是文心一言，而是所有 AI 大模型都必須要重視的問題。

小結

其實無論文心一言還是其他的 AI 大模型，都需要回答一個核心的問題，為什麼用户需要你，你憑什麼能替代原有的工具平台。

比如 PConline 在文心一言中提問李白是誰，文心一言給出的只有兩段十分簡要的介紹。但在百度等傳統的主流搜索引擎中搜索這個問題後，用户可以得到十分豐富的内容展現，無論圖片、視頻、文章等多元化的呈現形式，還是從李白到杜甫，再到盛唐歷史等更有創造性地内容延伸，體驗感和需求滿足等維度，都是文心一言這樣的 AI 大模型所無法比拟的。

説到這裏 PConline 必須指出文心一言一個必須引起重視的隐患問題。文心一言在 App 中還提供了一個 " 發現 " 專區，裏面有着非常豐富的預設主題和場景，顯示為 " 靈感小工具 "，觀察來看是幫助用户更好地使用文心一言的功能，可以有效地提升用户的使用場景和需求頻次。