字節上線豆包App：學霸、聊天搭子和專科老師，和快手AI打擂台 - 大酷樂

今天小編分享的互聯網經驗：字節上線豆包App：學霸、聊天搭子和專科老師，和快手AI打擂台，歡迎閱讀。

作者 | 虞景霖

編輯 | 鄧詠儀

半年來悶不做聲的字節，終于發布自家大模型的最新進展了！

沒有一點點訊号，8 月 17 日，字節跳動宣布開始對外測試AI 對話產品 " 豆包 "，進入官網（https://www.doubao.com/ ）直接注冊使用或通過官網提供的二維碼下載 App 即可使用。

來源：豆包 app

在 " 豆包 " 發布前，字節最新的 AI 進展，是 6 月被曝光的内部 AI 項目 "Grace"。

據 Tech 星球報道，Grace 在 7 月就開始小範圍内測，再到如今改名 " 豆包 "，正式與公眾見面。

不過，據 36 氪最新獲得的信息，字節 Grace 并不能算是豆包前身，Grace 在内部的定位更像是個 AI 應用貨架，" 豆包 " 只是 Grace 團隊開發的第一款產品。

" 豆包 " 體驗感如何？

從名字 " 豆包 " 還有可愛的虛拟 3D 形象就可以看出，字節并不是希望做一個像 ChatGPT 那樣的 "學霸" 工具，而是一個更親民的產品。

進入默認頁，可以發現 " 豆包 " 将頁面分為兩部分，左邊是四類默認智能體，包括豆包、超愛聊天的小寧、英語學習助手和全能寫作助手。右邊是智能體對應的對話框。

四個智能體有什麼區别呢？

聽豆包自己介紹——

總結來說，它們四個各有所長——

豆包是班長，哪裡需要哪裡搬；

超愛聊天的小寧是中國好同桌，聊天逗趣好搭子；

英語學習助手是英語課代表，全方位提高你的英語成績；

全能寫作助手是語文課代表，文學素養全靠它。

但這并不代表用戶只能使用這四個默認智能體，就像在 ChatGPT 建立新對話框一樣，用戶可以通過創建新的對話框來 " 另起一個 "，還可以編輯新對話的名字或者删除該對話。

來源：豆包

如果你向豆包提問：豆包是誰？可以做什麼？

自 ChatGPT 橫空出世，同樣作為生成式人工智能，豆包和其他生成式人工智能大語言模型相比，有什麼優勢和劣勢？

下面再來看看 " 豆包 " 的 " 語言理解能力 "。

若提問四大名著，" 豆包 " 回答準确，且在理解小說内容方面表現良好。

相比之下，豆包在 " 總結 " 劣勢方面表現得相當誠實——它的準确性确實有待提高。

當我們随機輸入一道數學題：

正确的答案應該是 [ 0,1），即使重新回答，也依然提供了錯誤答案 ......

如果不是數學學科又會如何？

回答正确！

另外，從測評來看，" 豆包 " 僅支持回答 " 有科學依據 " 的問題。

除了中文，" 豆包 " 還支持英文對話，點擊右上角即可切換語言。

有傳言稱國產大模型缺乏自己的數據庫，需要大量借助英語國家的數據進行訓練，" 豆包 " 是否會這樣，切換語言測試一下：

從講笑話來看，" 豆包 " 在中英文的表現半斤八兩。

無聊的時候可以找 " 超愛聊天的小寧 " 聊天，它是否是一個合格的聊天好搭子呢？讓我來測試一下！

小寧的 " 默認狀态 " 就好像水豚，相當穩定與嚴肅。但十分聽話，當你希望它切換風格的時候它能立即切換。

全能寫作助手不僅可以根據要求生成詩歌，還提供了閱讀鑑賞功能。

盡管這首《田間之歌》的詩句并不那麼優美，但這首詩可僅僅只用了 10s 不到。

當我們向 " 英語學習助手 " 提問時，它的回答表現又如何呢？

根據提問建議，我嘗試詢問它 "ban" 和 "interdict" 兩詞的區别，可以看到，" 英語學習助手 " 的回答并不完全是英文。

如果覺得英文的回答中仍然不好理解，可以讓 " 英語學習助手 " 把它轉化為中文，雙語切換，十分絲滑 ~

總體而言，" 豆包 " 目前能夠支持一些簡單問答，準确性有待提升。

并且，現在豆包是僅支持文字生成，暫時還沒有上圖片功能。

豆包也還沒有聯網。根據字節官方介紹，" 豆包 " 的訓練數據截至 2023 年之前，因此無法回答 2023 年的相關問題。

埋頭苦幹半年，字節大模型 " 潛行 "

相較于國内其他互聯網企業，字節盡管早在 2 月就開始了大模型團隊組建，但到真正發布第一款產品 " 豆包 "，可謂是姗姗來遲。

字節在人工智能領網域布局已久。2016 年，字節就成立了人工智能實驗室 AI Lab，聚焦于自然語言處理、機器學習、數據挖掘等方面的研究。

不過，國内 " 大模型之戰 " 掀起後，字節一直沒有公布任何底層大模型的進展。

反倒是在 6 月，火山引擎先發布了大模型服務平台 " 火山方舟 "，給國内大模型公司提供算力和其他配套裝務。

來源：火山引擎

而到最近發布豆包，字節大模型團隊其實悄悄放出了不少進展。

7 月，一個名為 BuboGPT 的大模型正式上線 Github，背後同樣是字節跳動團隊。

BuboGPT 是一個多模态大模型—— BuboGPT 能夠将文本、影像和音頻等多模态輸入進行整合，在影像音頻數據處理方面表現出了出色的對話能力。

官網：https://bubo-gpt.github.io/

來源：BuboGPT

BuboGPT 最牛的地方在于聽音辨位。

以上圖為例，只需要上傳一段音頻一個影像，BuboGPT 就能快速識别音頻來自于影像的哪個地方，并且貼心地用邊界框幫你框出來！

從 BuboGPT 中，也可以看出字節大模型的方向——結合影像和文字，做多模态的應用嘗試。

可以想見，這和字節的業務密切相關——作為 APP 工廠，字節旗下有抖音等多個 C 端應用，在音視頻上的應用場景非常豐富，在這方面發力，也是合情合理。

快手 AI 來 " 踢館 "

不過，字節扔的豆包還熱乎着，字節的老對家——快手，顯然是按捺不住了。

8 月 18 日晚，快手突然宣布，" 快手 AI 對話 " 安卓版本開放内測——此前，快手 AI 已經在 8 月初進行過一波小範圍測試了。

但字節豆包還是一個獨立 app，但顯然快手在應用上想搶先一步，快手 AI 對話直接就内置在快手中。

使用方法上，用戶只需要點擊快手搜索首頁右上角的 AI 圖示，直接輸入内容或者點擊引導問題，就可以開始對話。

另外，用戶也可以觸發「搜索智能問答」卡片，通過底部入口使用這項功能。

來源：快手

在大模型的支持下，用戶能夠更加高效的找到自己感興趣的主播或者視頻。

快手 AI 對話，也是首個基于大語言模型在短視頻直播行業落地的應用產品。

國内大模型混戰依舊火熱，各家廠商在辛勤耕耘底層的大語言模型時，在應用端的争奪也已經開始——

AI 大模型逐漸進入各種終端和國民級應用之中。比如最近，華為和小米都已經把大模型放到自家手機系統當中了。

如今，" 抖快 " 均發布 AI 應用，無疑是國内大模型落地的又一個重要節點。

來源：公開網絡

參考資料：

https://arxiv.org/pdf/2307.08581.pdf