今天小編分享的科技經驗:谷歌Bard整頓AI“亂説”,數學運算能力提升30%,支持表格導入,歡迎閲讀。
智東西(公眾号:zhidxcom)
編譯 | Glu
編輯 | 李水青
智東西 6 月 13 日消息,當地時間 6 月 7 日,科技巨頭谷歌公司對其 AI 聊天機器人 Bard 進行了更新,提升了機器人邏輯與推理能力,并增加了表格的導出形式。
Bard 是谷歌公司為了對抗 ChatGPT 和 BingChat,在今年 3 月 21 日正式推出的一款聊天機器人。此次更新是谷歌繼 5 月新增 Bard 圖片回復功能後的又一次功能迭代,主要針對 Bard 的數學計算能力,預計能将 Bard 解決數學問題的能力提高 30%。
一、結果的生成:不只靠預測,加入計算力
Bard 這次的具體更新内容包括兩個方面:
1、提升在數學計算、編碼問題和字元串操作方面的能力;
2、提供了一個 " 到谷歌表格 " 的新導出選項。有了這個新功能,用户可以将 Bard 在其回答中創建的表格直接導出到表格中。
在第一項更新中,Bard 使用了一種名為" 隐式代碼執行(implicit code execution)"的新技術,它可以讓 Bard 編寫和執行自己的代碼。最新版本的 Bard 識别能根據邏輯代碼的提示,在後台編寫代碼、對其進行測試,并使用結果來生成更準确的回答。
這大大提高了 Bard 的推理和數學能力,使其有能力解決高級推理和邏輯性較強的復雜問題。如:
15683615 的質因數是什麼?
計算某人儲蓄的增長率
倒寫單詞 "Lollipop"
▲ Bard 對倒寫單詞 "Lollipop" 的回復
Bard 之前所使用的 LLM(大語言模型)像是一個預測引擎。LLM 根據提示,來預測可能進一步出現的詞匯,進而生產回復,整個流程并不涉及精細的邏輯推理與計算。因此,他們有能力解決語言類、創造性任務,但卻無法準确回答推理、數學等領網域的問題。
二、結合大模型與傳統代碼,準确度提高 30%
這項技術的靈感來源是二分法,特别是丹尼爾 · 卡尼曼(Daniel Kahneman)的雙系統思維模型,他認為人的大腦存在兩個系統,并稱之為系統 1 和系統 2:
系統 1 是無意識思考,是快速的、直觀的、毫不費力的,如一個樂手在演出現場即興演奏,使用的就是系統 1 思維;
系統 2 則需要耗費精力、保持專注,是緩慢的、審慎的,如人們運用數學運算、學習專業樂器演奏時,使用的是系統 2 思維。
以此類比:
LLM 是在系統 1 思維下運作的——沒有經過深度思考,快速產生文本;
傳統代碼計算方法則與系統 2 類似——公式化、不靈活,但能產生正确的結果。
以做一道數學題為例,如果只使用系統 1,那根本不需要解題方法,直接把想到的答案寫出來就行了;但是加上系統 2 後,便可以運用加減乘除等數學方法去解題。
本次更新中,谷歌結合了 LLM(系統 1)和傳統代碼(系統 2)的能力,來幫助提高 Bard 反應的準确性。谷歌稱,在他們的内測數據集中,Bard 解決計算類問題的準确性提高了約 30%。
即使這樣,Bard 也無法保證回應的絕對準确。Bard 不會生成有助于提示響應的代碼,它生成的代碼可能是錯誤的,它也無法保證一定将執行的代碼包括在其響應中。
結語:各大廠商關注機器人邏輯性,AIGC 準确性将繼續提高
6 月 1 日,OpenAI 宣布 ChatGPT 數學解題能力将大幅提升,現在,谷歌也宣布了 Bard 的數學計算能力提高了 30%。
這向我們釋放了強烈的訊号,即 AIGC 聊天機器人行業陸續在關注着 AIGC 解決復雜問題的能力、生成内容的準确性,并不斷在以各種方式提升 AIGC 内容的結構化、邏輯性。未來,我們将享受到能力更強大、結果更準确的 AI 服務。
來源:Google 官網