字节上线豆包App：学霸、聊天搭子和专科老师，和快手AI打擂台 - 大酷樂

今天小编分享的互联网经验：字节上线豆包App：学霸、聊天搭子和专科老师，和快手AI打擂台，欢迎阅读。

作者 | 虞景霖

编辑 | 邓咏仪

半年来闷不做声的字节，终于发布自家大模型的最新进展了！

没有一点点讯号，8 月 17 日，字节跳动宣布开始对外测试AI 对话产品 " 豆包 "，进入官网（https://www.doubao.com/ ）直接注册使用或通过官网提供的二维码下载 App 即可使用。

来源：豆包 app

在 " 豆包 " 发布前，字节最新的 AI 进展，是 6 月被曝光的内部 AI 项目 "Grace"。

据 Tech 星球报道，Grace 在 7 月就开始小范围内测，再到如今改名 " 豆包 "，正式与公众见面。

不过，据 36 氪最新获得的信息，字节 Grace 并不能算是豆包前身，Grace 在内部的定位更像是个 AI 应用货架，" 豆包 " 只是 Grace 团队开发的第一款产品。

" 豆包 " 体验感如何？

从名字 " 豆包 " 还有可爱的虚拟 3D 形象就可以看出，字节并不是希望做一个像 ChatGPT 那样的 "学霸" 工具，而是一个更亲民的产品。

进入默认页，可以发现 " 豆包 " 将页面分为两部分，左边是四类默认智能体，包括豆包、超爱聊天的小宁、英语学习助手和全能写作助手。右边是智能体对应的对话框。

四个智能体有什么区别呢？

听豆包自己介绍——

总结来说，它们四个各有所长——

豆包是班长，哪里需要哪里搬；

超爱聊天的小宁是中国好同桌，聊天逗趣好搭子；

英语学习助手是英语课代表，全方位提高你的英语成绩；

全能写作助手是语文课代表，文学素养全靠它。

但这并不代表用户只能使用这四个默认智能体，就像在 ChatGPT 建立新对话框一样，用户可以通过创建新的对话框来 " 另起一个 "，还可以编辑新对话的名字或者删除该对话。

来源：豆包

如果你向豆包提问：豆包是谁？可以做什么？

自 ChatGPT 横空出世，同样作为生成式人工智能，豆包和其他生成式人工智能大语言模型相比，有什么优势和劣势？

下面再来看看 " 豆包 " 的 " 语言理解能力 "。

若提问四大名著，" 豆包 " 回答准确，且在理解小说内容方面表现良好。

相比之下，豆包在 " 总结 " 劣势方面表现得相当诚实——它的准确性确实有待提高。

当我们随机输入一道数学题：

正确的答案应该是 [ 0,1），即使重新回答，也依然提供了错误答案 ......

如果不是数学学科又会如何？

回答正确！

另外，从测评来看，" 豆包 " 仅支持回答 " 有科学依据 " 的问题。

除了中文，" 豆包 " 还支持英文对话，点击右上角即可切换语言。

有传言称国产大模型缺乏自己的数据库，需要大量借助英语国家的数据进行训练，" 豆包 " 是否会这样，切换语言测试一下：

从讲笑话来看，" 豆包 " 在中英文的表现半斤八两。

无聊的时候可以找 " 超爱聊天的小宁 " 聊天，它是否是一个合格的聊天好搭子呢？让我来测试一下！

小宁的 " 默认状态 " 就好像水豚，相当稳定与严肃。但十分听话，当你希望它切换风格的时候它能立即切换。

全能写作助手不仅可以根据要求生成诗歌，还提供了阅读鉴赏功能。

尽管这首《田间之歌》的诗句并不那么优美，但这首诗可仅仅只用了 10s 不到。

当我们向 " 英语学习助手 " 提问时，它的回答表现又如何呢？

根据提问建议，我尝试询问它 "ban" 和 "interdict" 两词的区别，可以看到，" 英语学习助手 " 的回答并不完全是英文。

如果觉得英文的回答中仍然不好理解，可以让 " 英语学习助手 " 把它转化为中文，双语切换，十分丝滑 ~

总体而言，" 豆包 " 目前能够支持一些简单问答，准确性有待提升。

并且，现在豆包是仅支持文字生成，暂时还没有上图片功能。

豆包也还没有联网。根据字节官方介绍，" 豆包 " 的训练数据截至 2023 年之前，因此无法回答 2023 年的相关问题。

埋头苦干半年，字节大模型 " 潜行 "

相较于国内其他互联网企业，字节尽管早在 2 月就开始了大模型团队组建，但到真正发布第一款产品 " 豆包 "，可谓是姗姗来迟。

字节在人工智能领網域布局已久。2016 年，字节就成立了人工智能实验室 AI Lab，聚焦于自然语言处理、机器学习、数据挖掘等方面的研究。

不过，国内 " 大模型之战 " 掀起后，字节一直没有公布任何底层大模型的进展。

反倒是在 6 月，火山引擎先发布了大模型服务平台 " 火山方舟 "，给国内大模型公司提供算力和其他配套裝务。

来源：火山引擎

而到最近发布豆包，字节大模型团队其实悄悄放出了不少进展。

7 月，一个名为 BuboGPT 的大模型正式上线 Github，背后同样是字节跳动团队。

BuboGPT 是一个多模态大模型—— BuboGPT 能够将文本、影像和音频等多模态输入进行整合，在影像音频数据处理方面表现出了出色的对话能力。

官网：https://bubo-gpt.github.io/

来源：BuboGPT

BuboGPT 最牛的地方在于听音辨位。

以上图为例，只需要上传一段音频一个影像，BuboGPT 就能快速识别音频来自于影像的哪个地方，并且贴心地用边界框帮你框出来！

从 BuboGPT 中，也可以看出字节大模型的方向——结合影像和文字，做多模态的应用尝试。

可以想见，这和字节的业务密切相关——作为 APP 工厂，字节旗下有抖音等多个 C 端应用，在音视频上的应用场景非常丰富，在这方面发力，也是合情合理。

快手 AI 来 " 踢馆 "

不过，字节扔的豆包还热乎着，字节的老对家——快手，显然是按捺不住了。

8 月 18 日晚，快手突然宣布，" 快手 AI 对话 " 安卓版本开放内测——此前，快手 AI 已经在 8 月初进行过一波小范围测试了。

但字节豆包还是一个独立 app，但显然快手在应用上想抢先一步，快手 AI 对话直接就内置在快手中。

使用方法上，用户只需要点击快手搜索首页右上角的 AI 圖示，直接输入内容或者点击引导问题，就可以开始对话。

另外，用户也可以触发「搜索智能问答」卡片，通过底部入口使用这项功能。

来源：快手

在大模型的支持下，用户能够更加高效的找到自己感兴趣的主播或者视频。

快手 AI 对话，也是首个基于大语言模型在短视频直播行业落地的应用产品。

国内大模型混战依旧火热，各家厂商在辛勤耕耘底层的大语言模型时，在应用端的争夺也已经开始——

AI 大模型逐渐进入各种终端和国民级应用之中。比如最近，华为和小米都已经把大模型放到自家手机系统当中了。

如今，" 抖快 " 均发布 AI 应用，无疑是国内大模型落地的又一个重要节点。

来源：公开网络

参考资料：

https://arxiv.org/pdf/2307.08581.pdf