今天小编分享的财经经验:开年抢跑AI赛道,Sora“截胡”字节,欢迎阅读。
图片来源 @视觉中国
文|锌刻度,作者|黎炫岐,编辑|黎文婕
最近,国内的大公司在 AI 赛道上被 Sora 抢占了风头。
在 2024 年 2 月初,此前在大模型领網域保持低调的字节跳动终于有了新动作,上线了 "Coze 扣子 "AI Bot 开发平台,据 Coze 官方介绍,Coze 可以让用户快速创建各种由 AI 提供支持的问答 Bot,且可以将 Bot 发布到各种应用程式,从而促进与这些应用程式上的用户的动态互動。
简单来说,Coze 的特点是,可以让用户创建个人定制版 Bot,实现 "0 代码 " 开发。
这倒也并非创新之举。早在 2023 年末,OpenAI 发布的 GPTs 也是旨在 " 每个人都可以定制自己的 ChatGPT,从而让 GPT 成为一个家族。" 但对于字节跳动而言,这多少算个大动作,毕竟此前它在大模型领網域沉寂已久。
不过,还未等 Coze 掀起太大的水花,OpenAI 发布的 Sora 直接 " 王炸 ",抢走风头,引发热议。
定制 Chatbot,从求职到小红书文案
"Coze 是一个一站式 AI 机器人开发平台。"
据 Coze 官网,为了促进和简化 AI 机器人的开发过程,Coze 目前集成了 60 多个插件,增强了 Bot 在信息检索、旅行协助、生产力、影像理解等领網域的功能," 你可以直接将这些插件添加到 Bot 中,丰富 Bot 能力。例如使用新闻插件,打造一个可以播报最新时事新闻的 AI 新闻播音员。" 用户也可以通过指定现有 API 的输入和输出来快速创建自定义插件。
此外,Coze 支持为 Bot 创建定时任务。Coze 官网介绍称,用户无需编写任何复杂的代码,只需一个简单的描述,Bot 就可以按需完成工作。例如,可以配置为:每天早上 9:00 向您发送个性化新闻。提醒您每天早上 7:00 查看今天的天气预报和日程。
锌刻度体验 Coze 时发现,目前 Coze 的 Bot 商店内已有各种场景的预置 Bot,其中包括女生头像生成器、小红书文案输出大师、求职助手等,而根据官网介绍,选择预生成 Bot 后,用户会被引导到该 Bot 的配置页面。在这里,你可以查看这个 Bot 的配置信息,与这个 Bot 进行互動,体验它提供的能力。
经体验,锌刻度留意到,目前的预置 Bot 多搭载云雀大模型。其中," 求职助手 " 可以提供求职建议、推荐工作机会。
Coze Bot 商店内的 " 求职助手 " 界面
而部分 Bot 或许还有一定完善和提升空间。比如,在体验 " 小红书文案输出大师 " 时,锌刻度分别提出 " 帮我列出送妈妈的礼物清单 " 和 " 帮我列出送奶奶的礼物清单 " 的需求,但得到的回答基本相同。这一问题在 " 春联大王 " 这一 Bot 也出现,据钛媒体,要求 bot 帮助写一个关于雪的春联,经过两次追加不一样的提示词(Prompt),最后生成的两副春联竟是一模一样的,并未如预期出现不同的回答。
值得一提的是,除了可以体验这些预置 Bot,用户也可复制一个预置的 Bot,并根据你的具体需求对其进行修改。
至于 Coze 背后的开发团队,据界面新闻报道,Coze 由 2023 年 11 月字节跳动成立的 AI 创新业务部门 Flow 研发而成的,该部门业务主要聚焦于 AI 应用层,由字节跳动技术副总裁洪定坤担任技术负责人,原今日头条 CEO 朱文佳担任字节大模型团队业务负责人。
不过,Coze 官网链接的企业为 " 北京春田知韵科技有限公司 ",天眼查显示,该公司成立于 2023 年 7 月,由北京抖音信息服务有限公司 100% 持股。
字节猛追进度
在发布 Coze 之前,字节跳动在 AI 赛道上一度 " 掉队 "。
在字节跳动 2024 年全员会上,字节跳动 CEO 梁汝波表示,字节跳动存在低效和迟钝现象,并直言," 字节对于大模型领網域的反应过于迟钝,直到 2023 年中才出现跟 GPT 相关的讨论,而 GPT-1 在 2018 年就发布了,且业内做得比较好的大模型创业公司也基本在 2018-2021 年间创立。"
回顾此前,直到去年 8 月,字节跳动基于云雀大模型开发的 AI 聊天机器人 " 豆包 " 才开始公测,面向 C 端市场发力 AI 应用。与此同时,还在国外发布了基于 CPT 模型训练的 Cici,后者目前已经在超过 30 个国家和地区上线。
字节跳动 " 豆包 "
与此同时,国内大公司纷纷在这个赛道发力:从 2023 年的 3 月到 9 月,从百度的大语言模型 " 文心一言 "、360 的智腦大模型,到阿里巴巴的 " 通义千问 " 大模型、科大讯飞的星火大模型,再到腾讯的混元大模型,国内传统的三大互联网巨头 "BAT" 悉数下场。
手机厂商也未缺席,华为、小米、OPPO、vivo、荣耀都先后在赛道亮相;五科研院所和初创企业不甘示弱,北京智源人工智能研究院发布了 " 悟道 " 大模型,上海人工智能实验室推出了 " 书生 " 大模型,鹏城实验室研发了 " 鹏城 · 腦海 " 大模型;京东、携程、好未来等也相继召开发布会;甚至连移动、联通、电信三大运营商,长虹等家电生产企业也欲分一杯羹……
更不用提诸多风云人物对此的讨论不断。其中,据财经网,华为创始人任正非 3 月中旬参加华为 " 难题揭榜火花奖 " 颁奖座谈会时称,华为会打底层算力平台:" 未来 AI 大模型会风起云涌,不只微软一家。ChatGPT 把计算、管道流量撑大,华为的产品就有了机会。" 同月月底,腾讯总裁刘炽平在财报电话会上说,生成式人工智能可成为腾讯已有业务,如社交、游戏的 " 倍增器 ",也可帮助开拓数字助手、搜索等新增长线。此外,《张朝阳的物理课》直播结束后会自动生成字幕:" ‘社互動动’‘算法推荐以及 AIGC ’‘自媒体’,是这些年来互联网的三个线索。"
数据则更为直观,据 " 趣解商业 ",2023 年 5 月的中关村论坛上,专家口中中国 "10 亿级参数规模以上 " 大模型的发布数量尚为 79 个;而《2023 中国新一代人工智能科技产业发展报告》显示,截至 2023 年 10 月,我国拥有 10 亿参数规模以上大模型的厂商及高校院所共计 254 家,分布于 20 多个省市 / 地区,国内大模型总数达 238 个;而据 GitHub 的统计数据,到 2023 年底国内已经发布的大语言模型接近 300 个。
所以,当 " 百模大战 " 如火如荼时,在 2024 年初发布 Coze 的字节跳动,与其说是抢跑,可能更精确的说法是 " 奋起直追 "。
OpenAI 抢占风头,字节又该如何应对?
字节跳动或许本想着在 2024 年初抢先崭露头角,却不料 OpenAI 再放 " 狠招 ",直接 " 王炸 ",抢占了风头。就在 Coze 上线后不久,Sora 横空出世。
2 月 16 日,OpenAI 推出了一款能根据文字指令即时生成短视频的模型,命名为 Sora。据介绍,Sora 能够从文本说明中生成长达 60 秒的视频,并能够提供具有多个角色,特定类型的动作和详细的背景细节的场景。Sora 还能在一个生成的视频中创建多个镜头,体现人物和视觉风格。此外,Sora 可以一次性生成整个视频,也可以扩展生成的视频,使其
Sora 技术报告
这意味着,OpenAI 已然在人工智能赛道上迈入下半场,国内外大模型的差距更明显了。当 OpenAI 官方公布长达 60 秒未经修改的 AI 视频,国内也有 AI 团队紧急上线相关 " 文字生成视频 " 大模型,但与国外主流 AI 视频模型能力相仿,均暂时无法超越 Sora 的水平。
不过,当 OpenAI 已经开始深耕文生视频的大模型,字节跳动却似乎如梦初醒,刚刚开始追赶对话问答大模型的进度。
日前虽有消息称,在 Sora 引爆文生视频赛道之前,国内的字节跳动也推出了一款颠覆性视频模型—— Boximator。与 Gen-2、Pink1.0 等模型不同的是,Boximator 可以通过文本精准控制生成视频中人物或物体的动作。但对此,字节跳动相关人士回应新浪科技称,Boximator 是视频生成领網域控制对象运动的技术方法研究项目,目前还无法作为完善的产品落地,距离国外领先的视频生成模型在画面质量、保真率、视频时长等方面还有很大差距。
事实上,字节跳动的 Coze 也多少有些亦步亦趋,早在 Coze 发布之前,其实在 2023 年 11 月的 OpenAI 首届开发者大会上,GPTs 就已经发布,而根据当时的介绍,GPTs 无需编程技巧,可以让用户用自己的自然语言来创建 " 个人版 ChatGPT",实现全程 "0 代码 " 开发。
用 OpenAI CEO 奥尔特曼的话说,每个人都可以定制自己的 ChatGPT,从而让 GPT 成为一个家族。那时候,外界讨论,GPTs 搭配 GPT Store,很可能会在 AI 应用生态中诞生下一个苹果。
彼时,华西证券研报曾评价,类比 App Store,GPT Store 将成为 OpenAI 生态重要一环。
按照研报的说法,对初创公司来说,GPTs 本身就是一个值得挖掘的 AI 应用项目;而对于现有的互联网应用来说,GPT Store 是一个优质的流量入口,GPTs 要实现复杂功能普遍需调用外部 API,若现有 App 能充分利用 GPTs 的高智能、高灵活性,并与自身应用进行结合,有望为现有互联网生态注入新鲜血液,"AI+ 一切 " 已近在咫尺。
显然,Coze 的设定与此相同。
只不过,当字节跳动这次试图紧跟 OpenAI 脚步时,还是稍有差距。可以预想的是,国内或许很快也将掀起文生视频大模型的新浪潮,而字节跳动又该如何应对呢?