今天小編分享的互聯網經驗:文心一言向社會全面開放,到底是誰需要誰?,歡迎閱讀。
圖片來源 @視覺中國
文 | 太平洋科技
8 月 30 日晚間,百度旗下 AI 大模型文心一言宣布向全社會全面開放,所有用戶都可以體驗這款 AI 大模型了。
8 月 31 日的時候,百度方面又公開表示,開放下載 12 小時後,文心一言 App 登上了蘋果商店免費榜榜首,成為首個登頂的中文 AI 原生應用。
與此同時有多家媒體報道稱,國内将有 11 家大模型陸續通過審批備案,從 8 月 31 日起陸續向全社會公眾開放服務。顯然,文心一言是其中最早與用戶見面的那個。
相關的消息也受到了互聯網、科技圈的聚焦關注,各類觀點、分析、報道層出不窮。不過雖然互聯網、科技圈嗨了,但似乎普通用戶對文心一言乃至整個 AI 大模型的感知都并不高。
PConline 随機詢問了多位非互聯網、科技圈的用戶,普遍表示并不了解文心一言以及眾多 AI 大模型,即便對于此前爆火的 AI 大模型 ChatGPT,也僅僅只是聽過名字而已,對于具體的功能内容并不了解。
從數據來看也是如此,更多的人或許還并不了解和關注 AI 大模型。百度搜索指數顯示,文心一言、ChatGPT 的相關搜索熱度始終保持着較為平緩的曲線,并未出現太大的波動,而從熱度數值的對比來說,則是遠遠低于抖音這樣的主流 App 應用。
這其實與大模型尚處于發展早期,相關平台還需要經歷長期的迭代完善,缺乏現象級的應用與用戶產生連接等方面有關。即使是如今面向社會開放的文心一言,也還有許多不盡如人意的地方。
文心一言,總出錯?
按照百度方面的介紹,文心一言并非倉促上馬的項目,而是經歷了數年的發展積澱。文心一言的基礎模型文心大模型發布于 2019 年,近期更新的文心大模型 3.5 也持續在十餘個國内外權威測評中位居第一。
例如今年 7 月據多家媒體報道,人民數據研究院選取文心一言、訊飛星火、通義千問、ChatGPT 四個主流 AI 大模型進行評測,結果顯示文心一言排名第一。
從評測維度可以看到,在内容生态、數據認知、邏輯推理等方面,文心一言均有着一定的優勢能力。這其實不難理解,畢竟百度深耕 AI 領網域多年,有着很強的 AI 技術積累,作為頭部搜索平台,在大數據方面自然也是有着一定優勢的。
不過雖然文心一言在各類測評中取得了好成績,但在實際的使用體驗上仍然有不少被用戶吐槽的地方,其 AI 智能程度也似乎并未達到部分用戶的預期。
例如在文心一言榜單登頂的蘋果商店中,按照時間順序查看到的用戶評論幾乎都為負面,主要集中在答非所問、内容錯誤等方面。PConline 也發現,在華為應用商店、vivo 應用商店的文心一言評論區,同樣出現了不少類似的吐槽評論。
PConline 在實際體驗中也發現了一些事實錯誤的情況,同時也有一些表現得不夠智能,不夠出彩的地方。
例如 PConline 在百度搜索裡找到了一張羅納爾多的照片,拿來問文心一言時得到的回復卻是貝利。
同樣的,PConline 在百度搜索中獲取了一張姆巴佩的照片,文心一言通過一番推理,用一種不太确定的口吻回答說這人可能是姆巴佩。與此同時,法國隊并未獲得 2022 年世界杯冠軍,即便在 2018 年奪冠的那一屆,也不存在制勝一球的說法,法國隊 4 粒進球中也只有一球來自于姆巴佩,所以無論從哪個維度來說,文心一言給出的信息都算不上準确。
在文心一言宣傳中提到的寫文章功能上,PConline 在簡單的測試中發現結果似乎并不太智能。
PConline 用今年暑期曾備受關注的上海迪士尼門票争議的新聞話題,讓文心一言寫一篇文章,得到的内容只能說是一篇較為初級的分析文章,重點是全文完全沒有提到此前發生的一些新聞事件和輿論争議内容,而這些恰恰是百度搜索引擎中最容易獲取到的信息數據。
在體驗中 PConline 還遇到了一個有趣的小插曲,當你問類似" 百度遇到過什麼失敗 "等與百度公司相關的非正面話題時,文心一言要麼拒絕回答,要麼直接結束對話。但當同樣的問題,主體換成其他企業時,文心一言會正常給出回答内容。
當然,作為百度開發的一款 AI 大模型,維護百度的形象、避開百度的一些負面内容,這并沒有什麼問題,但如果能在這方面也保持客觀公正的态度,像回答阿裡失敗案例那樣坦然回答百度過往的一些不足的話,就可以視為 " 出彩 " 的表現了。
用戶來體驗,順便當個 " 工具人
回到文心一言被吐槽的内容錯誤問題上。"AI 大模型怎麼總會給出錯誤答案?"有意思的是,PConline 也将這個問題抛給了文心一言,得到了一個頗為誠實的回答。
文心一言将原因分為了這幾點。首先是數據訓練不足,AI 大模型的準确性與其所依賴的數據訓練密切相關,如果訓練數據不足或不夠多樣化,AI 大模型可能無法準确解析結果。
第二點是語義理解存在一定的挑戰。AI 模型往往是通過深度學習算法來學習和理解文字、影像等内容形式的,這個過程存在着非常多的困難和挑戰。比如當面對抽象畫或有着多重含義的内容時,AI 大模型可能無法進行準确的解析。
文心一言也表示,為了克服這些問題,研究人員可以通過增加訓練數據、改進模型架構和提高算法精度等方式來優化 AI 大模型。同時對于含有特定語義信息的影像,如抽象畫,可以通過額外的标注或特定的訓練來提高模型的解析能力。
簡單來說,AI 大模型想要變得越來越完善,越來越好用,就需要更強的大數據庫,更精準的訓練算法,更高強度的使用頻次。
那麼該如何更好地解決這些問題呢?AI 領網域有一個十分直白的法則," 人多力量大 "。不妨試想一下,面向大眾開放,讓海量的用戶參與到使用中來,是不是能滿足這幾大關鍵條件?
用一個故事可以很好地理解這一點。人工智能、計算機視覺科學家李飛飛曾在 2009 年就發表過一篇論文,講述了來自全球 167 個國家近 5 萬名工作者,以眾包的方式通過三年努力,人工标注出了 1500 萬影像。
正是這 5 萬人的努力,讓 AI 產業收獲了一個有标志性意義的數據集,這龐大規模的标注性數據,對 AI 領網域中的計算機視覺技術的發展,起到了極為重要的推動作用。
無獨有偶,在遊戲領網域,一款網絡遊戲在正式上線運行之前,必須要經歷内測和公測階段。顧名思義,公測就是公開測試的意思,主要就是為了邀請更多的用戶參與進來,側重于客戶端可能出現的問題,測試伺服器的性能和查找程式的 BUG 等等,是產品正式上線運營以及不斷迭代優化的必要環節。
所以簡單來說,大家可以把文心一言此次的 " 對全社會開放 " 理解為公測,只有越來越多的用戶參與進來,不斷使用文心一言,產生越來越多的使用體驗、反饋意見等數據,才能讓文心一言更好地完善功能、迭代發展。
實際上,從文心一言的功能設計也能看出用戶的真實體驗和反饋對其 AI 大模型發展的重要性。幾乎在每一次與用戶的互動後,文心一言都會出現一個比較醒目的按鈕圖示,方便用戶對回答内容和互動體驗的評價,用戶可以點擊贊或者踩,無論點擊哪一個按鈕,文心一言都會彈出新的視窗,希望用戶能更為詳細地記錄和反饋真實意見。
其實百度創始人李彥宏說的一段話也值得大家關注," 當文心一言向數以億計互聯網用戶大規模開放服務後,能夠獲得大量真實世界中的人工反饋,這将進一步改進基礎模型,并以更快速度迭代文心一言,創造更好的用戶體驗。"
這段話其實也意味着,所謂的百度文心一言向全社會全面開放,并不是百度單方面給予社會、用戶的一項利好,用戶的體驗和反饋,對于百度文心一言來說或許才有着更為重要的意義和價值。
但 PConline 需要指出一個十分重要的地方,文心一言在面向全社會開放的階段,是否更應該先完善好信息錯誤這個最核心的問題,而不是指望在後續的用戶使用中,讓用戶來幫忙完成。
不妨想想,如果這是一款新上市的汽車,廠家跟消費者說,我們的車子可能會偶爾失靈、失控、開到錯誤的路上,我們的車子還存在很多安全漏洞,不完善的地方,希望各位消費者在後續的使用體驗中多多反饋這些問題 ...... 那麼這家汽車廠商還有存在的必要嗎?
回看文心一言,用戶在使用過程中如果得到的信息和内容本身就存在錯漏,會引發的負面後果是難以估量的,尤其在文心一言對全社會開放,大量的用戶湧入後,這樣的風險和危害性或将成倍增長。
試想一下,如果每天有一定數量的虛假、錯誤内容經由 AI 大模型傳遞給了海量的用戶,會出現怎樣的後果?最直接的就是會出現無數個現代版的 " 三人成虎 " 案例,嚴重的話會導致整個互聯網空間充斥着謠言、虛假新聞、錯誤信息等不可信内容。
量子位就曾在一篇相關報道中,将這樣的現象稱為"AI 正在污染中文互聯網 "。
簡單來說,AI 生成的内容并不是憑空而來的,而是需要一定的信息素材作為基礎。當 AI 因為各種原因生成了錯誤、虛假信息後,這些信息又可能成為另一個 AI 生成内容時的素材。
當互聯網空間充斥着 AI 制造的垃圾信息後,這種無限套娃式的 AI 信息傳遞,就會變成一個輸入和輸出都是垃圾信息的死循環,這是一個十分可怕的糟糕局面。
這不僅僅是文心一言,而是所有 AI 大模型都必須要重視的問題。
小結
其實無論文心一言還是其他的 AI 大模型,都需要回答一個核心的問題,為什麼用戶需要你,你憑什麼能替代原有的工具平台。
比如 PConline 在文心一言中提問李白是誰,文心一言給出的只有兩段十分簡要的介紹。但在百度等傳統的主流搜索引擎中搜索這個問題後,用戶可以得到十分豐富的内容展現,無論圖片、視頻、文章等多元化的呈現形式,還是從李白到杜甫,再到盛唐歷史等更有創造性地内容延伸,體驗感和需求滿足等維度,都是文心一言這樣的 AI 大模型所無法比拟的。
說到這裡 PConline 必須指出文心一言一個必須引起重視的隐患問題。文心一言在 App 中還提供了一個 " 發現 " 專區,裡面有着非常豐富的預設主題和場景,顯示為 " 靈感小工具 ",觀察來看是幫助用戶更好地使用文心一言的功能,可以有效地提升用戶的使用場景和需求頻次。
但 PConline 也在其中發現了不少遊走于違規邊緣的所謂 AI 大模型使用場景。比如 AI 生成淘寶評論、外賣評論、小紅書種草文案、小紅書探店文案、知乎回答等,而這些恰恰是各大平台目前嚴打的虛假内容。
比如點開 " 知乎回答生成 " 這個所謂的靈感小工具,就會進入到一個預設好的對話框,文心一言會提供一些預設的問題讓用戶選擇,然後自動模仿知乎平台的回答内容生成文案,用戶也可以自由發揮,提出指定的問題讓文心一言生成 AI 答案。
可以毫不誇張地說,理論上 AI 大模型在工具屬性和用戶體驗上能為用戶帶來巨大的效率提升和想象空間,但也存在着被刻意利用,造成網絡空間信息污染,不法商業牟利等惡果的風險。
總而言之,要避免這個情況,還是得回到本文一再強調的問題上。用戶為什麼需要 AI 大模型?讓這個世界變得更好,AI 大模型能提供怎樣的可能性?如何鎖住 AI 大模型可能產生的 " 惡 "?
需要思考的問題還有很多很多,期待未來文心一言以及更多的 AI 大模型們,能交出一個盡可能完美的答卷。