今天小编分享的科学经验:00后华人大模型创业,组队7人挑战langchain,硅谷顶级创始人给了天使投资,欢迎阅读。
2 个华人牵头拉起一支 7 人队伍,创业大模型???
没错,Cortex就是这样一个项目,被曝还拿下了还拿下了 Zoom 系,Getty 家族和快手系的天使投资。
这是一个集成诸多大模型 API 后,让大模型更懂你的中间件。
主打特色有二:
一是外接私有数据,包括 Notion、Slack、Google Drive 等,做特定领網域的私有版 GPT;
另一件事是在每个企业内部,打造千人千面的 Copilot。
这个工具在国外已经小小火了一把,目前拥有 10 多家付费用户和上千个人用户。
还有家网红 SaaS 公司用上了 Cortex,让网红们以特定的人设,和粉丝们激情热聊。
所谓大模型中间件,是在底层大模型和上层应用之间的基础軟體,主要解决大模型落地过程中,集成数据、应用、知识库,以及大模型融合级功能协同这些问题。
比较适合那种正面临两难境地,又想在大模型领網域试水的旁友们:
自己造一个通用大模型,又贵又麻烦;那单纯训更垂直的行业大模型,或者调用别人家的大模型的 API 呢?好像又有些不够用。
这个时候,中间件带着解决方案闪亮登场了。
随着大模型领網域的愈发深入,大模型中间件的创业项目也先后冒了出来。能入硅谷顶级创始人青眼,Cortex 凭借的是什么?
Cortex 能够做什么?
Cortex,可以将 GPT-4 等多个不同的大模型组合使用,实现语言模型之间的协同应用。
也就是说,它是个大模型应用层的编排器。
主要目的是提高技术人员开发的 " 可拓展性、可访问性和效率 "。
之所以叫 Cortex,是取这个英文单词 " 大腦皮层 " 的意思。
大腦是神经中枢,可以看做大模型,而皮层就是大腦上面的结构。
它能做的事情,就是按需调用不同的大模型,并用固定的格式来限制输出的自由度,从而帮助用户做些单一大模型解决不了,或自己调用多个大模型 API 会比较麻烦的事情。
具体而言,它的功能主要是以下两方面:
第一,作为集成许多 API 的工具,外接私有数据库," 指哪儿打哪儿 " 地变成一个专一领網域大模型。
从这个角度来看,Cortex走的是既 " 广 " 又 " 深 " 的路子。
广,是说 Cortex 不与个别行业服务竞争,而是可以每个领網域都用它练出大模型应用。
深,是说在大模型通用知识基础上,可以接入私有数据库,加深对领網域或用户企业本身的理解。
为了让这个专一领網域大模型更实用,Cortex 会采取调用向量数据、实时联网搜索、调用指定 API 等方式。
Cortex 的第二个功能,是能帮助每个人打造一个私人 copilot。
基础层面的工作,如撰写草稿、制作 PPT、编写电邮、总结会议、查询网购退货方式,Cortex 都能搞定。
进一步的,在同一公司内部,喂给它一份原始的信息,Cortex 也能获取每个人岗位所需要的关键点,并以特定格式输出,即根据业务部门的不同而 " 千人千面 "。
据了解,Cortex 的费用根据实际使用量计算。
就计费方式和服务模式而言,Cortex 似乎可以类比为链接数据库和大模型的 " 云厂商 ",聚集多种多样的 API 资源后,保证所有的功能都能一直运作,提供相关服务。
也因为如此,Cortex 还蛮受开发人员的欢迎—— Cortex主要面向的就是有一定技术基础的开发者和 IT 从业人员,他们可以很快上手,大大减少从调试开始的工作量,节省时间去做更有创造性的事情。
对不擅长写 prompt 的程式员格外友好
为什么会选择做这样一个功能的大模型中间件?为了弄清楚答案,量子位联系了 Cortex 背后的团队。
他们给出的答案是,因为相信未来一定是一个多模态、多模型的世界。如果只有一个模型,哪怕强大如 GPT-4,也无法搞定所有问题。
他们认为,必须 " 把多个模型联系在一起,才能组织一个真正的 AI 应用 "。
而这样的功能实现,在团队核心成员初期想用 Langchain 去做的时候," 越做越发现非常困难 ",AI 领網域目前缺少一个帮助模型层和应用层磨合的中间件来完成它的建设。
Cortex 背后团队的创始成员(也是背后公司的 CEO)Nemo Yang 对量子位表示:
不管已有的平台还是工具能够提供的能力,都无法很好地满足这样的 idea。
团队最初也走过其他路子,但随着对领網域的了解,听到越来越多的用户反馈称,大模型挺好用的,但是出一个厉害的大模型就要接入一个 API 太过麻烦,对大模型调控性的掌握也比较困难。
受到这样的启发,Cortex 才逐步打磨成了今天的样子。
Cortex 的成形大概离不开用户对市场现状的一个反馈,在与量子位的交流中,Nemo 反复多次提到 " 用户说 "" 市场反馈 " 这样的字样,然后解释 Cortex 是如何根据这些信息来捏出产品的特点的。
比如随着大模型大火而愈发走到众人面前的向量数据库,就有市场反馈如果对上下文关联很强的文章进行向量分割,检索匹配后返回的答案,可能因为痛失对上下文的理解而 " 不知所谓 "。
根据这一点,Cortex 调用的向量数据库是完全自研的,可以根据需要全局检索,也可以选择一段一段地部分返回。
再比如,身为团队里 " 语文底蕴最好 " 的人,Nemo 实操下来还是觉得,对程式员来说,prompt engineering 看上去简单,其实要出色完成并不容易。
所以 Cortex 有个设计对不擅长撰写 prompt 的开发者极其友好:
能够让擅长写 prompt 的同事啥的(也就是俗称的语文好,能够对需求进行精准描述),加入工作流程,让 Cortex 更清晰地了解你需要什么。
之后还会有什么功能上新呢?
Nemo 介绍,接下来大概率会接入 Slack confluence、 Microsoft 全家桶、 Google 全家桶等。
一切为了一个最终目的,那就是 Developer first,尽可能减少开发者的开发周期。
团队介绍
Cortex 背后的公司叫做Kinesys AI,目前团队 7 人全职,2 名创始人均为华人,多人从斯坦福本硕毕业。
创始人兼 CEO,Nemo Yang,00 后,花了 2 年时间,拿下佐治亚理工学院本硕学位,ML 出身,之前在字节飞书和微软工作过。
14 岁的时候,Nemo 就因为喜欢计算机,只身前往硅谷留学。高中起,他开始写网站和 App,参与过 startup 的开发工作。
联合创始人兼 CTO,Jian Cai,毕业于北京大学计算机系,曾在 Google 工作 8 年。
他的上一份创业项目是在线协作办公文档 " 一起写 ",后来被快手收购。
Cortex 直达:
https://trycortex.ai
— 联系作者 —
>