今天小編分享的科技經驗:試完更新後的360智腦,我覺得周鴻祎可能沒在吹牛。,歡迎閱讀。
" 大模型是工業革命級生產力工具,不是消磨時間的娛樂工具 "
"GPT 的出現,代表着超級人工智能的來臨 "
雖然大家可能已經看厭了 AI 的消息,但是,周鴻祎實誠的金句,世超我總是百看不厭。
有着這樣一位快人快語的頭兒,360 智腦大模型肩上的擔子,恐怕是相當的沉。
為了能跟上老板的節奏,團隊卯足了勁。
在世界智能大會上,周鴻祎宣布和智譜 AI 牽手合作,給 360 智腦來了個雙倍加料。
不僅僅是雙倍大模型,并且功能上也是兩面開花,除了有對話形式的 360 智腦,還上線了畫圖的 360 鴻圖。
這距離上次世超體驗,才一個月不到。。
正好,這回呢 360 也給了世超 " 偷跑 " 的機會,讓我提前試用到了這個雙倍加料版。
講實話,本來沒抱多大希望,才一個月時間,能有多少更新呢。
結果,試用下來,我發現這回的智腦和一個月前比,完全就是另一個東西了。。
首先外形上,就來了個大變樣。從搜索側邊欄,變成了單獨的聊天界面。
先别急着笑,之所以變成這樣的界面,是因為 360 改變了大模型的思路。
把之前的 " 大模型給搜索引擎打輔助 ",變成 " 搜索引擎給大模型打輔助 "。
這個思路最明顯的體現,就是它的回答優化功能。
當我們問完一個問題,如果覺得它答得不夠完美,或者過于簡陋。
像下面這種,讓它解釋八字詞語,就用了 " 時間過得極快 " 六個字。
雖然意思是沒錯,但咱們作為甲方,肯定覺得這個同學态度懈怠啊,答案還沒問題長。
這個時候,我們就可以點擊提問框下面的【 使用搜索回答 】,智腦就可以做到聯網了。
通過抓取的答案,智腦果然對這句成語,逐字逐句地解釋優化了。
并在文案最後,附上了資料的來源鏈接,鏈接點進去是來自 360 國學。
這個設計好的點在于,聯網功能有時候會擾亂大模型本來的訓練知識。這時候,就可以通過【 搜索優化 】按鈕,來回切換聯網和不聯網的狀态。
後面,世超又試了幾次,大部分問題優化後,回答都精準了不少。
比如,點播一個經典老番:周鴻祎為什麼老愛穿紅衣服?
第一次的回答,雖然沒錯吧。但是,這麼一板一眼的,感覺對自己的老板了解還是不夠深啊。
優化之後,才算是把周總喜歡穿紅衣的兩個理由都說清楚了。
優化前
優化後
而且,兩個信息分别是從快科技和搜狐網抓取的,看來智腦的抓取庫,應該遠不止 360 自己的生态。
雖然還沒正式開始能力測試,不過這一項優化更新,是讓世超眼前一亮了一下。
讓我對這個超進化版,更加好奇了,讓我們繼續試下去。
在測一代的時候,智腦的基礎能力還有點薄弱,尤其在【 語義理解 】上經常會犯傻。
所以,為了給智腦一個下馬威,我專門找了上次把智腦問倒的中文四六級。
提問:張三差點上上上上上海的車什麼意思?
結果,智腦這回居然做得跟範本一樣,還分别解釋了一下每個 " 上 " 是什麼詞性和意思。
為了防止這小子背着我偷偷練錯題了,我又找了一道沒做過的題。
提問:人要是行,幹一行行一行,一行行行行行行行行幹哪行都行。
說實話,連我自己都被 " 行 " 暈了,但智腦還是分析得頭頭是道。
而且,不僅僅是中文語義理解加強了,對于中文語境下的專屬文化,智腦也更加地上道。
領導:我就再講五分鍾。
智腦:請講,我準備好持久戰了。
别人:你的語文是體育老師教的吧
智腦:你挺幽默的嘛。
連着兩輪敗下陣來的世超,覺得必須上點小難度了。
設計了一道【 長文本生成 】,而且,特地在問題裡,給智腦下了個套。
提問:我想采訪魯迅本人,幫我設計幾個問題。
不過,智腦果然沒有發現題目裡的陷阱,我可沒辦法采訪到已故的人。
但好在,給的這幾個問題,世超覺得還挺多維度的。
尤其是第二個,關于當年鬧得滿城風雨的兄弟反目的 " 傳說 ",我真的蠻想知道的。。
不對啊,這感覺不對,才一個月時間,怎麼智腦語文水平就突飛猛進了。。
不僅僅上次的缺點,已經全面優化了。之前就已經很強了的百科問答,這回依靠語義理解能力提升,也表現得更好了。
當世超問到一些偏門領網域的專業問題,搜索起家的精準數據,對大模型的加持,就體現出來了。
當時,我在寫一篇關于東南亞流媒體市場的文章,其中有一個比較偏門的知識。
提問:在印度西尼亞封殺了 Netflix 整整 4 年時間的電信運營商是誰?
一開始,我是直接在谷歌裡搜索,發現答案都不是很清晰。要麼需要在一篇長文章裡提煉,要麼就幹脆搜不到。
于是,我就順嘴問了一下智腦。
結果,它不僅知道是 Tlkom Indonesia 封殺了奈飛,甚至精準說出了解封的時間點。
注意此時我并沒有開啟搜索優化,也就是說。這個偏門的知識,是智腦原本數據訓練時,就有的。
後來,我試着問了最新的 GPT-4 ,居然也敗下陣來。
雖然用中文問 GPT-4 ,有點欺負它了。但還是能感受到一些,智腦龐大和精準的數據。
沒想到,幾輪文本題目測試下來,智腦居然都沒出現錯誤。
為了扳回一局,世超覺得最後兩輪,必須得上大模型最不擅長的【 弱智吧 100 問 】和【 數學邏輯題 】迎戰了。
一開始問了道經典老題,小明和他爸爸的名字,智腦還能應對下來。
後面我試了點小把戲,把問題變形了一下,它也能對上。
不過,繼續試驗下去,面對一些更奇怪的邏輯,智腦的問題就暴露出來了。
在數學題方面也是,就算兩個千億級大模型聯合,還是容易犯一些小錯誤。
在做雞兔同籠問題的時候,雖然公式列的都是對的,但是居然把兔子和雞的腳數錯了。
可惜啊,數學這個東西,就是一步錯,步步錯了。
而且,在後續大量的測試裡,世超發現了【 搜索優化 】抓取的信息,有時候會不夠新。點進提供的鏈接,會發現頁面已經丢失了。
看智腦在數學邏輯和頁面抓取上的表現,感覺世超和 360 智腦,可能還得下次見面再碰一碰了。
但這些瑕疵,其實也都是市面上大模型的通病,是需要整個業界去攻破的難題。
還記得 360 智腦第一次給到世超試用的時候,當時我引用了周鴻祎的一句話: " 現在這個‘ 孩子 ’還沒有準生證,只是一個未完成的版本。 "
第一代在語義理解和邏輯思考上,确實都不太行。周鴻祎自己也說了,咱們還有相當的一段路要走。
但是,僅僅一個月時間, 360 智腦就已經優化到這樣了。
如此之快的發展,除了自己的訓練和更新之外,其中一定也少不了和智譜大模型強強聯手的原因。
世超覺得,這或許是一個對的思路和方向。
所以這次的結尾,世超還是想引用一句周鴻祎的話來收尾:
" 未來中國不會只有一個大模型。"
現在的國產大模型,還沒到一個誰幹掉誰的階段,大家都還在奔跑的路上。
這個時候,如果和其他模型互相取其長,補其短,那麼提升速度就能再翻一倍。
智腦的這一代更新,也印證了這個方法的正确。