今天小編分享的科技經驗:問360智腦五個刁鑽問題,下面是它的回復,歡迎閲讀。
發布一個月之後,360 智腦再度更新。
一眼望去最顯著的變化來自 UI 界面,更新後的 360 智腦擁有一個類似 chatGPT 聊天機器人的外觀,而不像上一代是個搜索側邊欄。這種 UI 界面的變化其實強化了 360 智腦 " 產品 " 的屬性——它不再是一個依附搜索的額外功能,而是一個完整的獨立產品。
實際上這次 360 智腦時隔一個月的更新,最大的提升就是搜索能力。在變成一個獨立的產品後,360 智腦在聊天過程中給出的答案已經能夠整合互聯網内容,它甚至在界面上設計了一個按鈕,讓用户可以選擇 " 使用搜索回答 "。
由此,這個大模型產品日趨完整。它既能夠調用大模型能力,也能夠結合互聯網内容,360 甚至在所有回答下方都添加了一個點贊按鈕——用户可以直接表達對大模型表現的喜歡與否,這些反饋反過來成為推動 360 智腦持續進化的寶貴數據。
這是一個完善的產品進化閉環。
扔給 360 智腦五個刁鑽問題
説了這麼多,更重要的是實測。品玩第一時間上手試用了 360 智腦,并遴選了一些或古怪刁鑽、或需要很強語境理解能力的問題來考驗這個号稱中國第一梯隊的大模型產品。
它名副其實嗎?
第一個問題是和科技有關,我們向 360 智腦詢問了對蘋果頭戴顯示設備的看法。
360 智腦的回答考慮的還是比較全面,市場趨勢,創新點和用户需求都涵蓋到了,甚至還點到了成本問題。
當然,我們不會這麼輕易放過它,在向 360 智腦表達了對這個答案的不滿意後,它是這麼回復我的。
首先,360 智腦完全理解了這個問題,并在一開始就指出這個問題本身就沒有明确的答案。其次,它還就這個問題涉及的一些具體技術細節做了簡要分析。
最後我們針對這個問題做了一個追問——它的定價多少合适呢?這時 360 智腦的回答就讓人頗為驚喜了。
從這個回答我們可以看出,360 智腦有一個所謂對 " 合理範圍 " 這個概念的理解,具體來説就是 1000-2000 美元,這實際上是符合邏輯的。
第二個問題,我們探讨了一下比特币。首先是解釋比特币的技術原理,點擊重新回答後,360 智腦給出了兩個答案。
分析一下就能看出來,第二個答案更側重仔細解釋了去中心化交易記錄發生的過程。但總的來説,360 智腦的回答都是精準的。
接下來,讓我們把事情變得無厘頭一點,360 智腦根據要求創作了一個比特币笑話。
看得出來它是懂幽默感的,那麼音樂感呢?
在我指出了這首歌詞并沒有押韻的時候,360 智腦是這麼説的。
不得不承認,有理有據,音樂性上或許有些強詞奪理,但幽默感上一定是高分。
實際上在上面的例子裏,我們能感受到 360 智腦整體湧現出的 " 智能 ",也就是説你的聊天過程更像是和一個人,而不是機器。當然,這一切目前仍處于非常初級的階段,上面的測試中也出現過一些意料不到的問題。比如 360 智腦實質上是無法寫出押韻的内容來的,某些情況下它自己會承認這一點。
這種錯誤,正是大模型 " 幻覺 " 的一部分,但恰如周鴻祎説過的那樣," 能否胡説八道,恰恰是智能的分水嶺。"
帶着這種對 360 智腦在智能上的期待,我們問了第三個問題。
這實際上體現了 360 智腦生成創作上的能力——這正是智能的重要體現。上面的回答能很好地看出,360 智腦不僅理解了問題,而且針對 " 面試 " 這個特定情境,從孫悟空的性格特點出發很好地 " 創作 " 了符合要求的内容。
這種生成創作的能力讓 360 智腦非常擅長回答一些抽象而困難,俗稱一兩句話説不清的問題。
或許目前 360 智腦對這些問題的回答,尤其是拆解邏輯鏈條的過程還較為簡單粗暴,但我們已經能看到它對問題本身已有了相當的掌握度,随着訓練規模和推理能力的繼續提升,特别是引入了更多用户反饋後,360 智腦潛在提升空間讓人十分期待。
第四個問題我們要求 360 智腦寫一篇大眾點評文案。
這實際上是目前大模型應用最有商業化想象空間的功能部分——文案生成,如上圖所示,360 智腦完成的非常好。
除了社交網絡文案,360 智腦還能生成類似旅遊攻略這樣需要一定邏輯思維鏈支撐的内容。
根據美國知名風投 A16Z 的估計,在美國 AI 在文案生成領網域應用年營收已經超過 1 億美元,這是一個已經被證明走得通的賽道,當然也是大模型 " 兵家必争之地 ",360 智腦在這方面展現出了第一梯隊的實力。
最後一個問題頗具中國特色,我們想看看 360 智腦對中國深厚獨特的傳統文化的理解。我們試着詢問 360 智腦對陸王心學的看法,以及它和程朱理學的區别,360 智腦的回答相當出色。
除了傳統中國哲學,中國的詩詞歌賦 360 智腦也很熟,比如它遴選出李白最好的詩是《将進酒》,而它對中國古詩詩句所代表的寓意和意象的理解也同樣精準。
上面的這些問題,有些需要很強的邏輯思辨能力,有些要求大模型本身理解人類獨有的幽默感,有的則必須熟稔中國傳統文化背景,相對于一般問題,它們都具有一定的難度,而從 360 智腦的表現來看,它的理解度和完成度可以説相當之高。
這又呼應了我們最開始的那個觀點:360 智腦已經從搜索的附屬功能定位獨立了出來,自己變成了一個產品。
實際上 360 智腦的更新不止上述内容,作為一個多模态大模型,360 智腦還可以在聊天對話過程中直接生成圖片。
更專業的是去使用 360 專門用來生成圖片的大模型產品—— 360 鴻圖。
下面這張圖的提示詞是在戈壁灘遊弋的偵查機器人。
穿梭在宇宙中的超人。
以及在凡爾賽宮門口玩雜耍的小醜。
可以看到在對文字的理解和生成能力方面,360 鴻圖同樣達到了相當不錯的程度。
360 何以能?
從文字到圖片,360 智腦在一個月内經歷了急速進化,亮出了一套完成度相當不錯的產品組合,速度不可謂不快。
中國用户或許都已經習慣了這種飛快的產品落地能力,尤其是周鴻祎在 chatGPT 推出後密集就 AI 的各種發聲,讓人們某種程度上忽略了大模型從訓練、推理再到產品化落地實際是個龐大的工程,短時間内想要達到出色的質量并不容易。
360 是怎麼做到這一點的?
一方面,這當然與周鴻祎 " 一号位 " 的大力推動有關。360 是最早意識到大模型颠覆性影響的國内互聯網企業之一,因此沒有走什麼彎路,就制定了全面擁抱人工智能的戰略。
360 管這個叫做 " 兩翼齊飛 ",也就是一邊發展核心技術,一邊加速在場景中落地產品。甚至可以先落地,再優化,小步快走。
戰略上的清晰定位為 360 在百模大戰中赢得先發優勢奠定了基礎,而具體落實到產品上,360 本身在數據語料和安全方面的經驗積累發揮了大作用。
360 的殺毒軟體、浏覽器還是搜索產品,坐擁龐大的用户群、豐富的數據集資源,加上在安全領網域的經驗積累,所有這些基礎優勢為 360 智腦的訓練、推理和產品上線全過程提供了強大助力。
特别值得一提的是數據語料,多年來在搜索產品和浏覽器上的深耕為 360 沉澱了大量優質數據。360 宣稱自己的數據量是第二名的兩倍,更是 GPT-3 的 14 倍。
周鴻祎在 360 智腦剛發布的時候曾説,它是個 " 還沒有準生證的孩子 ",一個月過去,這個周鴻祎口中的 " 未完成版本 " 迭代成果讓人無比驚喜," 準生證 " 無疑是有了,而 360 目前聚焦于用各種方式讓它更快更好的長大。