今天小编分享的互联网经验:大模型清流Cohere是如何被打造出来的,欢迎阅读。
Cohere 的三位联合创始人:Ivan Zhang、Aidan Gomez、Nick Frosst
文 | 适道
本期内容摘要:
1. 20 岁的少年参与了开创生成式 AI 时代的重要论文
2. 喜欢玩技术的华人创业者与天才少年联合创立 Cohere
3. AI 会带来哪些风险,它未来最大的机会是什么?
基础大模型领網域的全球竞争仍在进行,融资百亿美元的 OpenAI 毫无疑问是领跑者之一,它的杀手级应用 ChatGPT 拥有数亿活跃用户,想要与它正面竞争无疑是困难的。
而一家估值 20 亿美元的 AI 独角兽在基础大模型的竞争中找到了一条差异化的路线,成为大模型创业混战中的一股清流。
这家独角兽就是 Cohere,它由《Attention is All You Need》这篇开创性论文最年轻的作者 Aidan Gomez 与他的两位多伦多大学校友 Ivan Zhang 和 Nick Frosst 联合创立。
Cohere 近期获得了 2.7 亿美元的 C 轮融资,累计融资额超过 4.3 亿美元,估值超过 21 亿美元。它的投资者名单中包括 Salesforce、NVIDIA、Oracle 这样的企业巨头,Tiger Global 和 Index Ventures 等顶级投资机构,以及 Geoffrey Hinton(深度学习三巨头,图灵奖得主)、李飞飞等知名 AI 大牛。它的合作者还包括 Amazon、麦肯锡等。
为何说 Cohere 是大模型创业混战中的一股清流?
在产品上,它专注于服务企业级客户,以强大的大模型 Command 为基础,提供企业级别的文字处理,知识问答等功能,并且模型可微调、可定制。此外,它还推出了企业级的知识助手 Coral。
在安全性上,为了打消企业客户的疑虑,它的产品可以多云和本地部署,并且拥有高度的数据隐私性。
在融资策略上,它更倾向于拿与自己产业链相关的大企业的钱,借助巨头的力量发展自己,但是却不与巨头绑定(参考 OpenAI 与微软的关系)。
作为知名 AI 独角兽,Cohere 的产品和企业竞争优势已经被研究透彻,我们尝试从创业者角度切入,以 Cohere 的两位创始人 Aidan Gomez 与 Ivan Zhang 的多个访谈为材料,整理出 Cohere 从 0 到 1 的发展历程,以及 Aidan 与 Ivan 两位创业者对企业与 AI 的诸多真知灼见。
注:本文材料来源于 Cohere 的投资人、Madrona 合伙人 Jon Turow,Weights&Bias 的创始人 Lukas Biewald,知名媒体人 Steven Marsh 与 Cohere 的两位联合创始人 Aidan Gomez 及 Ivan Zhang 的对谈。
20 岁的少年参与了开创生成式 AI 时代的重要论文
Aidan Gomez 是大语言模型领網域开创性论文《Attention is All You Need》最年轻的作者。当时他从多伦多大学去 Google Brain 实习,还是大约 19 或 20 岁的大學生,这是他在美国科技界的第一次经历。
Aidan Gomez 在多伦多大学
他在谷歌的实习导师是 Lukasz Kaiser,也是《Attention is All You Need》的主要作者之一。当时他们一起打造了一个训练大型神经网络的軟體平台 Tensor,同时他们也在训练一个 AI 模型。他们的想法是,训练一个能从数据集中学会做许多事情的巨大 AI 模型,训练它要用到多种模态的数据集,包括图片、文本、甚至视频。
当时 Aidan 和 Noam Shazeer(也是 Transformer 的论文作者)是 " 同桌 ",Noam 也在研究大语言模型,只是他研究的算法是 RNN(循环神经网络)。Noam 的目标是找到一种比 RNN 更简单、更精炼、更具可扩展性的新架构。
于是 Lukasz、Aidan 与 Noam 一拍即合,打算一起做这项研究,这时他们又发现 Google Brain 的 translate 组的 Niki Parmar, Jakob Uszkoreit, Ashish Vaswani 与自己有相近的想法,两个小组合并后,大家齐心协力地研究,最后那篇《Attention is All You Need》就诞生了。
论文的投稿是在一个凌晨,当时办公室只有 Aidan 和 Ashish 两个人。稿子投出去后,他们就沉浸在了兴奋中。Ashish 已经预见到这篇论文可能产生巨大的影响,而年轻的 Aidan 还是第一次投稿重要论文,还不知道这篇论文的重要性。就像他接受纽约客专栏作家 Steven Marsh 访谈时说的那样:" 我不认为任何人预见到了它在未来会变成什么样。 "
而他真正对 Transformer 模型的实际影响感到震撼,是在实习结束回到多伦多大学以后。
" 当时,我在多伦多大学进行夏季研究,然后收到了 Lukasz 的邮件,主题是《看看这个》。邮件内容是一个关于日本朋克摇滚乐队的故事,故事记载了他们怎么组队,怎么发专辑,然后又遗憾解散的过程。在邮件的最后,Lukasz 写道:‘我输入的唯一的词是 transformer,模型自动生成了故事。’
看了这篇机器生成的文本,我觉得这会掀起一场产品革命。因为这是第一次,一个非人类的系统以一种像我们人类一样引人入胜的方式使用语言。" Aidan 对 Steven Marsh 说。
大模型的进化树
当《Attention is All You Need》和 Transformer 诞生之后,这个创新的模型迅速被 AI 社区采纳,成为了新的技术标准。它在 AI 研究者中间掀起了热潮,不断有基于 Transformer 的强大模型出现,例如 BERT,例如 GPT。而在 2022 年底,ChatGPT 正式打开了生成式 AI 的热潮。
喜欢玩技术的华人创业者与天才少年联合创立 Cohere
Cohere 的联合创始人 Ivan Zhang 是一个非典型 AI 研究者,但却是一个典型的创业者。他与 Aidan 是多伦多大学的校友,后来辍学与 Aidan 一起创业。" 我是一个创造者,我不太喜欢坐在教室里单纯地吸收大量信息,我需要亲自动手,边‘玩技术’边学习,这是我最好的学习方式。" 他这么向 Cohere 的投资人 Jon Turow 介绍自己。
Cohere 的联合创始人 Ivan Zhang
从研究者到创业者,从 ToC 转型 ToB
2017 年,从多伦多大学辍学后,Ivan 在一家创业公司做后端工程师,他正是在这时认识了 Aidan Gomez。当时 Aidan 想做一个独立的 AI 研究小组,进行兴趣主导的 AI 研究,验证自己的创新想法,于是他们一起做了 FOR.ai 。现在这个组织仍在运行,叫做 Cohere For AI,由多位 AI 领網域的研究科学家组成,主要做 AI 的基础研究。
2019 年,Ivan 向 Aidan 提议:" 我们为什么不一起做一些新东西?",于是他们从 FOR.ai 独立出来,开始进行更正式的创业。在这个阶段,他们已经有了创业经验,懂得一个组织正确的运行方式,也认识了不少 AI 领網域的创始人。
在 Cohere 的创业初期,他们的第一个想法是打造一个 AI 基础平台,让开发者上传 AI 模型,然后平台会压缩模型的尺寸,使模型更高效。但是在那个时间点,生成式 AI 的热潮并没有到来,这个市场还太小。
作为论文作者的 Aidan 观察到 Transformer 模型在 AI 社区内的蓬勃发展,看到它解决了各种各样和文本处理相关的问题,看到了开发者们对这个架构的改进。正好那时 OpenAI 的 GPT-2 发布,Transformer 模型的参数突破 10 亿,这也让 Aidan 进一步意识到了模型规模的重要性,以及这个模型架构真正的潜力。
于是,几位创始人将 Cohere 的方向从一个模型压缩平台,往基础大模型及服务转型。
" 当体验了 GPT-2 后,我们发现它很酷,但是我们还不确定可以用 GPT 这类的 AI 基础模型搭建什么服务。我们先尝试做了 Cohere 的第一个项目,它是一个文本自动完成工具,形式是 Chrome 浏览器的扩展。用户只要在文本框中输入一段文字,它可以自动续写完成。我们最初打算利用广告来赚钱。(注:这是一个 ToC 的商业模式)。但是我们显然低估了打造消费者产品的难度,这个产品的体验并不好,也没有获得很多用户,我们明白自己在这个方向没有竞争优势。
于是我们决定拆除前端的界面,只提供后端的模型的能力,从 ToC 转向 ToB,做企业级的 API 服务。当时,99% 的 NLP 用例需要单词嵌入,也需要对模型进行微调,所以我们在几个月内,打造了一个带有 AI 生成能力,并可以对模型进行嵌入和微调的 API 平台。" Ivan 向 Jon Turow 分享 Cohere 转型背后的思考。
对于 Cohere 为什么转向 ToB,以及公司使命的内核,Aidan Gomez 进行了清晰的表述:" 我们就是想让 AI 大模型被更多人使用。当时,开发者和企业想要利用 AI 大模型的能力,无论是技术还是算力上都面临很多阻碍。我们存在的意义就是消除人们使用 AI 大模型的障碍,让不熟悉 AI 的开发者,以及普通的企业,都能方便地使用 AI 的能力。
因为生成式 AI 特有的对话式互动对于终端用户来说是最好的体验。以我自己为例,当我想开一个银行账户时,如果一家银行能有一个 24 小时与我对话互动、并且高效解决问题的移动 App,那会对我吸引力大增。
Cohere 就是要做到这一点,帮助所有类型的企业和组织用上生成式 AI 的力量,增强他们的竞争优势。
Cohere 允许企业客户用自己的数据微调模型
企业在采用 AI 能力时,还会对两个问题产生疑问,就是模型的托管和数据的隐私。我们是支持多云托管的,企业可以选择适合自己的云服务,也可以在本地的伺服器中部署。我们也十分重视数据隐私,当企业用自己的数据进行模型微调时,无论是部署在云中,还是部署在本地伺服器,我们都不会看到他们的数据,这是我们的一个核心特性。"
不拘一格的人才策略,塑造了 Cohere 的高创造力
Cohere 能够在早期迅速转向,找到自己正确的位置,离不开 Ivan 和 Aidan 从 FOR.ai 开始积累的人才观和创业哲学。Ivan 在与 Jon Turow 对谈时分享了他们的人才招聘哲学和创业文化:" 我们的招聘方式与众不同。在 FOR.ai 创业的时候,我们就确立了一个原则:我们寻找的是来自不同背景,但是对 AI 非常感兴趣并希望产生巨大影响的人。
你不需要具有在 Meta AI,DeepMind 或 Google 工作过的完美背景,但是一定要对自己专注的领網域有非常高的兴趣和热情。而且你不光会写论文,还要有实际动手的能力。我们把这种招聘方式带到了 Cohere,构建了非常强大的早期团队。
在公司文化上,我们喜欢在技术方面进行很多探索,‘玩技术’,然后获得突破。虽然我们都会写论文,但不是‘书呆子’,我们对自己应该要做什么非常清楚,而且会花很多的时间在工程实践而不仅是算法探索上,这让我们打造的产品能够真正为人们带来价值。"
现在 OpenAI 占据了生成式 AI 的 C 位,那么已经拥有数亿活跃用户的 ChatGPT,会不会帮助 OpenAI 进行垄断,其他的公司是否还有机会?Aidan Gomez 有自己的看法:" 我绝不认为大模型领網域会形成垄断。我认为每个公司都有自己的风格、方向和自己的优势,在市场上都会找到自己的位置。消费者和企业客户会选择他们认为最好的伙伴,最值得信任的公司,以及最能帮他们成功的平台。
对于 Cohere 这样的基础模型公司,我们面对的最终状态,很可能不是赢家通吃,而是一个多元化的市场格局。我们会有凭借自己的优势去赢得自己比赛的胜利。我们会用各种方法帮助客户,让他们用上最好的 AI 能力。我们的焦点是让 AI 模型通过提示,微调在内的各种方法,帮助特定客户,获得最大的价值。"
AI 会带来哪些风险,它未来最大的机会是什么?
生成式 AI 的爆发,在受到欢迎的同时,也引发了不少担忧。在公众层面,人们担忧 AI 是否会发展太快,能力太强,从而 " 抢夺 " 人类的工作机会;在现实的使用层面,则有不少人担忧 AI 模型的安全性和可控性。
对此话题,Aidan Gomez 和 Ivan Zhang 也发表了自己的看法。
AI 可能 " 污染 " 社交媒体
Aidan Gomez 的观点更偏向社会性,他表示,AI 生成的内容对社交媒体的 " 污染 " 值得担忧:" 与其担忧非人类智慧代替人类这类可能还有很多年才会发生的事,我们更应该关注当前的现实风险。
例如,非常有可能有 AI 生成数百万个机器人,无缝地进入我们的社交媒体和公共对话,然后推动某一个观点(无论这个观点是有益的,还是有害的)。这可能会在一些能对社会产生重大影响的公共议题上产生无法预料的影响。
所以我们必须权衡这个事情的风险,最好有具体的政策来减轻这种风险。例如,人们有权知道,我们正在阅读的媒体内容或者营销内容,到底是人类创作的还是机器合成的。"
而 Ivan Zhang 的观点则相对现实,他认为 AI 面临两大挑战:" 对于 AI 面临的挑战,我们从客户中获取的信息首先是怎么评估生成式 AI 模型的能力。要准确地比较两个 AI 模型的能力并不容易,而且在文本生成方面,这种比较很可能是主观的。这对生成式 AI 在商业方面的采用会产生一定的阻碍。
另一个挑战就是数据隐私问题,在使用开源或闭源的大模型进行商用时,你有时候会使用一些敏感的数据,这又会产生合规的问题。比如用 AI 辅助你写作一封敏感的电子邮件时,你是不是会担心自己输进模型的敏感数据被滥用?当然,这种担心成为了我们的机会,我们正在与 Oracle 合作解决这个问题。"
具身智能未来是 AI 的大机会
Aidan Gomez 和 Ivan Zhang 既是 AI 专家,也是企业家,对于 AI 在未来有哪些新的方向和机会,他们的观点也值得关注。
首先,他们在不同的场合都提到了同一个技术,那就是具身智能,也就是将生成式 AI 的能力注入到有形的机器中。
Aidan 这么对 Lukas Biewald 表述:" 我认为将生成式 AI 用到机器人技术和实体化方面真的太酷了,而且这个方向有非常强烈的需求。我们都想象过机器人具有高智能和灵活的身体会怎么样——它一定会产生巨大的变革。但是这个方向确实还有很长的路要走,我也希望自己在这个方向产生影响,并试着去做一些相关的事情。"
Ivan 也认为具身智能绝对是 AI 下一阶段的大机会:" 我认为最大的机会是能影响实体的‘行动模型’,将 AI 与工程及实体的产品结合起来,将会非常令人兴奋,也一定会有不少企业对它们感兴趣。但是,这项技术要走向实体化,模型的准确性还需要进一步的提高。"
此外,Aidan 也对 AI 的智能发展和未来应用做了更长远的想象:" 现在 AI 模型的构建依赖于人类,为了让 AI 更加智能,我们会用人类的各种高阶知识来训练它。打个比方,就像让一个非常聪明的人,去教一个还不那么聪明的 AI。那么未来如果 AI 模型变得非常聪明,人类的知识已经被他全部学会了,就会面临一个临界点——人类已经没什么能教给 AI 了。
我最感兴趣的是,如果 AI 突破了这个临界点,会发生什么?如果一群已经学完了人类已有知识的 AI 在一起交谈、探索、学习,会不会产生新的知识?
也许当这个时候来临,我们人类会向 AI 学习新知识,AI 会带着人类一起在新的知识海洋里遨游。"