今天小編分享的互聯網經驗:字節跳動向大模型大亂鬥扔出一個豆包,歡迎閲讀。
好飯不怕晚,字節跳動自己的大模型終于有些動靜了。
字節跳動首個大模型獨立 App 今天上線,是一個 AI 對話產品,叫 " 豆包 "。
不知道豆包是不是 "dou bot" 的諧音。但至少豆包是可以用抖音登錄的。之前的 Grace 還不是這樣。
6 月初,Tech 星球報道字節正在内測代号為 Grace 的對話 AI 項目。兩個月後,Grace 開啓内測,得到授權後可以支持郵箱、Gmail 以及飛書賬号登錄。
字節跳動相關負責人曾在 8 月初對外回應," 目前產品還不成熟,與國外的領先模型相比,還有較大差距。"
但很快,8 月 17 日 Grace 更名為 " 豆包 ",在更新頁面中強調 " 支持發現智能體 " 以及 " 支持抖音登陸 "。
至少從這個面向外界的測試版本來看," 豆包 " 已經有一個成熟的產品雛形。
接下來就是這個 " 豆包 " 裏都有些什麼餡兒了。
我登陸進去後,界面默認有 3 個不同名頭的對話 bot(或許每個人不一樣):分别是全能寫作助手、英語學習助手以及一個聊天虛拟人物。
加上 " 豆包 " 本身一共就有四個聊天視窗,但它們并不是各自訓練方向不同的 bot。這可能體現了 " 豆包 " 最重視的幾個能力:知識問答、多語言、情感分析以及多輪對話。
它有些思辨能力:
圖源:AI 對話產品 " 豆包 "
它可以寫小紅書文案:
圖源:AI 對話產品 " 豆包 "
你甚至已經可以找它他練習未來去面試 Tik Tok:
圖源:AI 對話產品 " 豆包 "
值得一提的是,相比 Grace," 豆包 " 取消了文生圖的能力,是一個純粹文本層面的 AI。
但它仍然不免會有一些幻覺,比如羅刹海市并不是 1998 年張信哲《等待》那張專輯裏的歌,比如《等待》其實是張信哲 1994 年的專輯。比如 GPT-4 不是一個 2020 年發布的大模型。
" alt="
" width="1178" height="876">
圖源:AI 對話產品 " 豆包 "
關于 " 豆包 " 掌握知識的新鮮程度,它自稱訓練數據截止到 2023 年,但似乎還不認識 GPT-4。
我在問過了 GPT-4 之後也同樣它是否認識 GPT-5 和 GPT-6,答案也是肯定。這個問題不能説明 " 豆包 " 的訓練數據足夠新鮮,推理能力倒是不錯。
圖源:AI 對話產品 " 豆包 "
" 豆包 " 也已經具備一些大模型最核心的代碼能力。比如它可以很快寫出貪吃蛇或者五子棋的代碼。但也有些奇怪的地方,比如它可以寫微信小程式代碼,但談到抖音小程式又表示拒絕。
圖源:AI 對話產品 " 豆包 "
在這之前外界都在納悶,字節跳動為什麼只有火山引擎為别人搭台唱戲,自己卻一直沒有拿出關于大模型的果實。
畢竟開始的并不晚。字節跳動早在今年 2 月就已經開始在語言和影像兩種模态上布局大模型團隊,匯報路線上由 Tik Tok 產品技術負責人朱文佳領銜,團隊主體以字節跳動搜索業務部門和產品研發與工程架構部下屬的智能創作團隊為主導,再從 AI Lab 和 AML(應用機器學習)團隊中抽調人手。
字節跳動語言大模型團隊本來預期是在年中拿出大模型,但現在 8 月已過半。時間上看," 豆包 " 做好的要比團隊預期晚。
一位字節跳動 AI 產品團隊的人曾對品玩表示," 沒動靜説明做的還不行,等做的還行了,字節的產品就能看到了 "。
這樣來説," 豆包 " 的出現本身意味着一個不會太低的起點。更重要的是,作為字節跳動對外公開的第一個大模型動作,它從一開始就奔着產品化去,并且立刻落到了手機螢幕上。它是帶着 toC 的巨大野心來的。
最後,以 " 豆包 " 對自己的技術背景介紹來結束吧。
我是由字節跳動公司訓練的人工智能,名為豆包。我的技術背景包括以下幾個方面:
● 語言模型:我是基于深度學習的語言模型,可以對輸入的文本進行預測和生成。我的語言模型基于 Transformer 架構,具有高效的并行處理能力和良好的語言理解能力。
● 訓練數據:我的訓練數據來自互聯網上的大量文本,包括新聞、博客、小説、論文等。這些數據被用于訓練我的語言模型,以提高我的語言理解和生成能力。
● 優化算法:我的訓練過程中使用了多種優化算法,包括随機梯度下降、Adagrad、Adadelta 等。這些算法用于優化我的模型參數,以提高我的性能和準确性。
● 模型評估:我的模型評估包括語言生成質量評估和語言理解評估。語言生成質量評估使用 BLEU 分數、困惑度等指标,語言理解評估使用準确率、召回率等指标。
通過以上技術背景,我可以對輸入的文本進行預測和生成,并回答各種問題,以幫助用户獲取信息和知識。