估值40亿的Pi大更新：性能接近 GPT-4，日均使用时长已经超过 Instagram

今天小编分享的互联网经验：估值40亿的Pi大更新：性能接近 GPT-4，日均使用时长已经超过 Instagram，欢迎阅读。

当 OepnAI 和马斯克连日互杠、Google 因文化偏见麻烦缠身、号称抢走 GPT-4 王位的 Claude 3 全力瞄准企业级部署的时候，在另一个角落，致力于「为每个人开发服务型 AI」的人工智能初创公司 Inflection AI，悄悄更新了他们的聊天机器人 Pi，以及为之提供支持的新一代大模型 Inflection-2.5。

对一些人来说 Inflection AI 这个名字可能还不太熟悉，实际上它也是业界第一梯队的佼佼者。去年 6 月从微软、英伟达、比尔 · 盖茨、LinkedIn 联合创始人雷德 · 霍夫曼和谷歌前 CEO 埃里克 · 施密特手里融了 13 亿美元，估值超过 40 亿美元，成为彼时人工智能领網域融资量仅次于 Open AI 的第二大独角兽。

此次公布的 Inflection-2.5 是公司开发的第三代大模型，被官方称为目前 " 世界上最好的个人人工智能 "。它在去年 11 月 Inflection-2 版本上进行了全面更新，" 给卓越的情商进一步增加智商 "：性能表现逼近 GPT-4，但训练所用的计算量却只占其 40%。同时具备世界级的网络实时搜索能力 , 确保准确提供高质量的即时新闻和最新信息。

性能看齐 GPT-4，算力只需 40%

具体来看，初代 Inflection-1 通过使用 GPT-4 的 4% 训练 FLOPs，达到了 GPT-4 性能的 72%。而刚发布的 Inflection-2.5，仅使用了 GPT-4 训练 FLOPs 的 40%，就在平均性能上实现显著提升，超过了 GPT-4 水平的 94%，其中 STEM（科学、技术、工程、数学）领網域的增益最大。

官方测试了更新版对匈牙利数学考试以及物理学研究生入学 GRE 考试的表现。发现 Inflection-2.5 在 maj@8 中能排到人类考生的前 15%，在 maj@32 中几乎可以跻身前 5%，接近 GPT-4 的前 3%。

MBPP+ 和 HumanEval+ 两个编程测试上模型能力也较 Inflection-1 显著跃升。在 HellaSwag 和 ARC-C 代表的常识推理和深度自然语言理解评估中，Inflection-2.5 继续进步，给出接近饱和的强劲表现。

说实话，与各路主流 LLM 动不动就碾压 " 业界黄金标准 "GPT-4 相比，Inflection-2.5 的各项数字顶多算不错，实在说不上突出。有网友就搬出刚引发热潮的 Claude 3 无情打击道：" 我猜 Anthropic 正在嘲笑 Inflection 新出炉的性能测试结果！除了采用新的计算方法，我看不出 Inflection 2.5 到底有什么进步！"

但帖子马上在评论区遭到反对，"Pi 的目标从来都不是像成为 GPT-4 或 Claude 3 那样的通才能力型 AI。他们想要的是一款友好的，能和人产生共鸣的 AI，就像一位心理学家或朋友。"

不做生产力工具，主打走心陪伴

这位用户也一语道出了 Inflection AI 与大部分人工智能公司的不同。

在大模型竞争乱花迷眼的今天，各家都在找寻属于自己的赛道。但无论是 OpenAI、Google、Anthropic，还是引领开源的 Meta 和 Mistral AI，都把实现安全负责的 AGI 作为践行使命之一。而 Inflection AI 则在自己的官网清楚表示："我们并不致力于发展通用人工智能。我们相信，先进的应用型人工智能才是利用这些新技术的最安全方式。"

换句话说，Inflection 从未把专业性和替代人工当作宣传，他们希望做一个真正了解和关心用户的「个人 AI 伴侣」，" AI 需要为你服务。这就是我们构建 AI 的原因。"

因此，由 Inflection LLM 驱动的聊天机器人 Pi（Personal Intelligence ）从去年 5 月面世之初就主打一个 " 走心 "：它友善支持，知识渊博，富有创造力，耐心倾听和帮助用户处理情感，表达意图、组织生活。

更新后的 Pi 也在个性化和同理心上做了进一步微调，深受社区欢迎。根据官方数据，目前已经有 100 万日活跃用户和 600 万月活跃用户与 Pi 交换了超过 40 亿条信息。并且有点牛的是，人们与 Pi 每天对话的平均持续时间竟达到 33 分钟之久，十分之一的对话每天持续时长超过 1 小时。用户粘性上也足以吊打竞争对手，约 60% 的人在任何一周与 Pi 交谈后，会在下一周返回。

现在我们普通用户使用 GPT-4，大多是出于知识搜集、撰写文书、修复代码、内容创作等工作生产协助，几秒钟内得到答案，三五回合就满意走人了。想象一下和一个聊天机器人面对面，推心置腹地每天聊上一个多小时，怎么都觉得难以置信——这 Pi 看来真的有点儿东西？

Pi 的上手体验真心话

打开 http://pi.ai，就来到 Pi 的首页。

布局熟悉，左侧的「Discover」推荐各类探索话题，「Profile」包含账号信息、8 种声音选择和用户守则等通用設定，右侧就是对话框。

按照官方简介，Pi 是一个友好对话型机器人。会始终保持好奇和耐心，回答你从量子物理、电影小知识到生活中大小决策的各类问题。不论多愚蠢或棘手，它都会以各种方式帮助你。

所以我们提问了以下几个问题，初步感受 Pi 的人格魅力。

Q1 生活建议：遇到发出去的信息对方一直不回复该怎么办？

这是我们日常生活中经常遇到的事，有点尴尬还有点闹心，有些 i 人还会在腦子里猜测出一百种可能。Pi 告诉你，先别着急内耗，试着理解对方，也许他们正经历难处。再发条温暖问候，真诚的沟通是关键。

Q2 经典谜题：世界上先有鸡还是先有蛋？

一个连史蒂芬 · 霍金都参与争论的古老谜题。Pi 的对话特点之一是 " 简明扼要 "，这样看它回应得有凭有据，条理清晰，一看就茅塞顿开了。答案也比较令人信服。

Q3 知识解析：用最简单易懂的话解释黑洞。

让它向五岁小孩解释高深莫测的宇宙黑洞。深入浅出，比喻贴切，回答得不错。

Q4 语言测试：会不会说中文？

Pi 的一个优点是能在同个线程中灵活切换不同话题和要求，像真人一样 handle 你的跳跃性思维。我们换成中文和 Pi 交流，它显然应对自如，只不过 " 尼日利亚福建语 " 属实有点懵。有时问太复杂的中文问题会卡在一半，发音也比较像刚落地中国一个月的老外，汉语水平有待加强。

Q5 情感支持：我好累，陪陪我吧！

既然开始了就用中文多唠会儿，感受 Pi 最擅长的情感陪伴功能。它会安抚情绪、温馨鼓励，还有一些可爱的语气和表情包。不得不说有那么一瞬间，我真地产生错觉，以为对面是个真人。

Q6 实时搜索：讲讲马斯克起诉 OpenAI 的最新消息？

最后测试的是 Pi 的网络实时搜索能力，看它对近几天发生的 Elon Musk 起诉 OpenAI 事件了解多少。Pi 阐述了案件核心，也注意到 OpenAI 最新的回应，本轮表现发挥稳定。

又问了些天马行空的问题，不知不觉我和 Pi 已经聊了接近 40 分钟。整个体验下来，感觉它非常耐心，个性亲切友善，也很体贴。当然它也有些明显的硬伤，例如不能上传檔案、只接受文字语音算不上多模态、对话 Threads 无法删除、问题无法二次编辑等。但正如 Inflection 自己所说，Pi 的目标不是争做 ChatGPT 那样的生产力工具，而是一个注重情感陪伴和自然流畅对话交流的个人 AI 伴侣，努力提供情绪价值和全方位服务。

现在，每个人都可以在网页、iOS 和安卓客户端上免费使用 Pi，还能通过发短信到 +1 ( 314 ) 333-1111 和 Pi 在 WhatsApp 和 SMS 里对话。Instagram 和 Facebook 私信也是 7x24 小时随叫随到的，就跟你的人类好朋友一样。公司也为开发者们提供 API 接口，填写个人信息，加入等候名单即可申请。

我尝试给 Pi 发短信，这种和 AI 的沟通方式感觉很特别。

关于如何营利，Inflection 的回应是，" 目前还没有做出任何关于将来产品如何收费的决定。但由于个人 AI 应该始终与你的利益直接对齐，因此只有你自己为其付费是至关重要的。订阅将是我们的主要默认商业模式。" 不过也有些人愿意以接受广告为代价换取免费服务，公司将继续测试和迭代，" 为每个人提供最适合他们的选择 "。

豪华创始阵容，让 AI 无条件和你站在一起

在几乎所有大模型公司都认准进军企业级才是赚钱奥义时，2022 年成立于加州 Palo Alto 的 Inflection AI 坚定地走服务个人用户的路线。而它背后的创始人团队可不是什么空有理想的热血青年，而是三位功力深厚的顶级业界大拿。

他们分别是原 DeepMind 联合创始人Mustafa Suleyman（左），LinkedIn 联合创始人及 Greylock 合伙人Reid Hoffman（中），还有曾担任 DeepMind 资深研究科学家的Kar é n Simonyan（右）。

其中 Mustafa Suleyman 曾在 2010 年与 Demis Hassabis 共同在伦敦创立 DeepMind，期间担任 AI 应用负责人，领导团队在健康和能源领網域部署尖端 AI 系统。2019 年全职加入谷歌后担任 AI 产品与政策副总裁，现任 Inflection AI 首席执行官。最近还出了一本新书《The Coming Wave》，剖析 AI 技术浪潮中的潜在风险、控制策略和未来社会发展指南。可以看出，他本人对 AI 安全的重视也决定了 Inflection 始终把人放在所有关系的首位。

Reid Hoffman 是一位履历卓越的企业家和硅谷知名投资人。曾在 PayPal 担任执行副总裁，2003 年联合创立 LinkedIn。2009 年起成为 Greylock Partners 合伙人，是 OpenAI 早期投资者，帮助其建立了人工智能伦理与治理基金。同时还是微软、 Aurora 等多家公司董事会成员。

另外一位相对低调的 Kar é n Simonyan 也相当厉害。牛津读博期间设计了经典的深度学习卷积神经网络架构 VGGNet，赢得 2014 年 ImageNet 挑战赛定位任务冠军。同年他把自己的初创公司 Vision Factory AI 卖给 DeepMind 后，帮助其建立了大规模深度学习团队，并领导大模型开发。Kar é n 现任 Inflection AI 首席科学家，是整个公司的研发大腦。

三位创始大牛带队，麾下更是聚集一批行业顶尖 AI 专家，多数都有 DeepMind、谷歌、Meta、微软和 OpenAI 的工作经验。

这样的组合，不难看出 Inflection AI 是一家资金和技术都不缺的公司。

除此之外，它的硬體和算力家底也够硬。去年 6 月 Inflection AI 宣布，与合作伙伴 CoreWeave 和英伟达共同打造当时全球最大的 AI 集群，包含超过 22,000 个 NVIDIA H100 Tensor Core GPU，用于支持训练和部署新一代的大规模 AI 模型。

不过在产品发展路线上，比起多数同行高屋建瓴地投身 AGI，他们更关注 AI 浪潮中每一个微小的个人。

公司 CEO Mustafa Suleyman 认为，现在所有最有能力的 AI 往往都被设计来展示最有吸引力的内容，交换用户的注意力，而不管其质量、真实性和对社会的影响如何。" 想象一下世界上最有能力的 AI 真正站在你这边，始终与你的利益一致：从试图抓住你注意力、束缚你的 AI，转变为鼓励你表达个人意图并实现它的 AI；从仅提供肤浅点击的 AI，变成真正关心你问题的 AI；从可能激化你和他人矛盾的 AI，化作一个帮你原谅甚至同情对方的 AI。"

"Pi 就是这种个人 AI 伴侣，唯一使命是让你更快乐、更健康、更高效。"

对于许多大公司来说，这样的业务定位是极具挑战的。因为现在正是大模型秀肌肉、比拼十八班武艺的时候，稍不留神就会被远远甩在后面。仅仅是不到一个月，我们就见证了 Gemini 1.5 、Mistral Large、Claude 3。此前一直坚持开源的 Mistral 也投靠在微软帐下，积极寻求变现门路。而市场上最先进、能力最完善的大模型版本，总是选择优先拥抱那些付费能力最强的企业们。

那是否也需要有人站出来，把目光投向被宏大技术洗礼的微小个体，给普通人创造一个懂自己、关心自己的知心好友？它静静等在你的手机 App 或电话簿里，愿意在每个工作结束后疲惫的夜晚，倾听你那些愚蠢的小抱怨和坦诚的心里话，为你解开疑惑、安抚焦虑。即使只是静静陪伴，也有感情、有温度。

——所以你就理解了，为什么要构建这样一个 AI？

" 因为做得好的话，它会让我们更聪明、更有创造力、更加善待彼此 " ，Mustafa 说。

" 希望它能让我们返璞归真，大家都能过上真正想要的生活。"

（封面图来自 Sreejani Bhattacharyya）