今天小編分享的互聯網經驗:字節上線豆包App:學霸、聊天搭子和專科老師,和快手AI打擂台,歡迎閱讀。
作者 | 虞景霖
編輯 | 鄧詠儀
半年來悶不做聲的字節,終于發布自家大模型的最新進展了!
沒有一點點訊号,8 月 17 日,字節跳動宣布開始對外測試AI 對話產品 " 豆包 ",進入官網(https://www.doubao.com/ )直接注冊使用或通過官網提供的二維碼下載 App 即可使用。
來源:豆包 app
在 " 豆包 " 發布前,字節最新的 AI 進展,是 6 月被曝光的内部 AI 項目 "Grace"。
據 Tech 星球報道,Grace 在 7 月就開始小範圍内測,再到如今改名 " 豆包 ",正式與公眾見面。
不過,據 36 氪最新獲得的信息,字節 Grace 并不能算是豆包前身,Grace 在内部的定位更像是個 AI 應用貨架," 豆包 " 只是 Grace 團隊開發的第一款產品。
" 豆包 " 體驗感如何?
從名字 " 豆包 " 還有可愛的虛拟 3D 形象就可以看出,字節并不是希望做一個像 ChatGPT 那樣的 "學霸" 工具,而是一個更親民的產品。
進入默認頁,可以發現 " 豆包 " 将頁面分為兩部分,左邊是四類默認智能體,包括豆包、超愛聊天的小寧、英語學習助手和全能寫作助手。右邊是智能體對應的對話框。
四個智能體有什麼區别呢?
聽豆包自己介紹——
總結來說,它們四個各有所長——
豆包是班長,哪裡需要哪裡搬;
超愛聊天的小寧是中國好同桌,聊天逗趣好搭子;
英語學習助手是英語課代表,全方位提高你的英語成績;
全能寫作助手是語文課代表,文學素養全靠它。
但這并不代表用戶只能使用這四個默認智能體,就像在 ChatGPT 建立新對話框一樣,用戶可以通過創建新的對話框來 " 另起一個 ",還可以編輯新對話的名字或者删除該對話。
來源:豆包
如果你向豆包提問:豆包是誰?可以做什麼?
自 ChatGPT 橫空出世,同樣作為生成式人工智能,豆包和其他生成式人工智能大語言模型相比,有什麼優勢和劣勢?
下面再來看看 " 豆包 " 的 " 語言理解能力 "。
若提問四大名著," 豆包 " 回答準确,且在理解小說内容方面表現良好。
相比之下,豆包在 " 總結 " 劣勢方面表現得相當誠實——它的準确性确實有待提高。
當我們随機輸入一道數學題:
正确的答案應該是 [ 0,1),即使重新回答,也依然提供了錯誤答案 ......
如果不是數學學科又會如何?
回答正确!
另外,從測評來看," 豆包 " 僅支持回答 " 有科學依據 " 的問題。
除了中文," 豆包 " 還支持英文對話,點擊右上角即可切換語言。
有傳言稱國產大模型缺乏自己的數據庫,需要大量借助英語國家的數據進行訓練," 豆包 " 是否會這樣,切換語言測試一下:
從講笑話來看," 豆包 " 在中英文的表現半斤八兩。
無聊的時候可以找 " 超愛聊天的小寧 " 聊天,它是否是一個合格的聊天好搭子呢?讓我來測試一下!
小寧的 " 默認狀态 " 就好像水豚,相當穩定與嚴肅。但十分聽話,當你希望它切換風格的時候它能立即切換。
全能寫作助手不僅可以根據要求生成詩歌,還提供了閱讀鑑賞功能。
盡管這首《田間之歌》的詩句并不那麼優美,但這首詩可僅僅只用了 10s 不到。
當我們向 " 英語學習助手 " 提問時,它的回答表現又如何呢?
根據提問建議,我嘗試詢問它 "ban" 和 "interdict" 兩詞的區别,可以看到," 英語學習助手 " 的回答并不完全是英文。
如果覺得英文的回答中仍然不好理解,可以讓 " 英語學習助手 " 把它轉化為中文,雙語切換,十分絲滑 ~
總體而言," 豆包 " 目前能夠支持一些簡單問答,準确性有待提升。
并且,現在豆包是僅支持文字生成,暫時還沒有上圖片功能。
豆包也還沒有聯網。根據字節官方介紹," 豆包 " 的訓練數據截至 2023 年之前,因此無法回答 2023 年的相關問題。
埋頭苦幹半年,字節大模型 " 潛行 "
相較于國内其他互聯網企業,字節盡管早在 2 月就開始了大模型團隊組建,但到真正發布第一款產品 " 豆包 ",可謂是姗姗來遲。
字節在人工智能領網域布局已久。2016 年,字節就成立了人工智能實驗室 AI Lab,聚焦于自然語言處理、機器學習、數據挖掘等方面的研究。
不過,國内 " 大模型之戰 " 掀起後,字節一直沒有公布任何底層大模型的進展。
反倒是在 6 月,火山引擎先發布了大模型服務平台 " 火山方舟 ",給國内大模型公司提供算力和其他配套裝務。
來源:火山引擎
而到最近發布豆包,字節大模型團隊其實悄悄放出了不少進展。
7 月,一個名為 BuboGPT 的大模型正式上線 Github,背後同樣是字節跳動團隊。
BuboGPT 是一個多模态大模型—— BuboGPT 能夠将文本、影像和音頻等多模态輸入進行整合,在影像音頻數據處理方面表現出了出色的對話能力。
官網:https://bubo-gpt.github.io/
來源:BuboGPT
BuboGPT 最牛的地方在于聽音辨位。
以上圖為例,只需要上傳一段音頻一個影像,BuboGPT 就能快速識别音頻來自于影像的哪個地方,并且貼心地用邊界框幫你框出來!
從 BuboGPT 中,也可以看出字節大模型的方向——結合影像和文字,做多模态的應用嘗試。
可以想見,這和字節的業務密切相關——作為 APP 工廠,字節旗下有抖音等多個 C 端應用,在音視頻上的應用場景非常豐富,在這方面發力,也是合情合理。
快手 AI 來 " 踢館 "
不過,字節扔的豆包還熱乎着,字節的老對家——快手,顯然是按捺不住了。
8 月 18 日晚,快手突然宣布," 快手 AI 對話 " 安卓版本開放内測——此前,快手 AI 已經在 8 月初進行過一波小範圍測試了。
但字節豆包還是一個獨立 app,但顯然快手在應用上想搶先一步,快手 AI 對話直接就内置在快手中。
使用方法上,用戶只需要點擊快手搜索首頁右上角的 AI 圖示,直接輸入内容或者點擊引導問題,就可以開始對話。
另外,用戶也可以觸發「搜索智能問答」卡片,通過底部入口使用這項功能。
來源:快手
在大模型的支持下,用戶能夠更加高效的找到自己感興趣的主播或者視頻。
快手 AI 對話,也是首個基于大語言模型在短視頻直播行業落地的應用產品。
國内大模型混戰依舊火熱,各家廠商在辛勤耕耘底層的大語言模型時,在應用端的争奪也已經開始——
AI 大模型逐漸進入各種終端和國民級應用之中。比如最近,華為和小米都已經把大模型放到自家手機系統當中了。
如今," 抖快 " 均發布 AI 應用,無疑是國内大模型落地的又一個重要節點。
來源:公開網絡
參考資料:
https://arxiv.org/pdf/2307.08581.pdf