今天小编分享的互联网经验:AI toC应用“试错合集”,国内首个爆款从哪条赛道跑出?,欢迎阅读。
文 | 适道,作者 | 适道 AI 组,编辑 | 白石
国内 " 杀手级 "AI toC 应用何时出现?大佬们的共识是,跑在 toB 后面。
金沙江创投主管合伙人朱啸虎的观点是:1、to C 要见到 iPhone 3 时刻。就像当年移动互联网 to C 应用爆发是 Multi-Touch(多点触控)。2、(现在)刚刚 iPhone1、iPhone2 吧。3、什么时候每个手机上都有大模型,to C 应用可能会爆发。(来源:腾讯新闻《潜望》)
创新工场联合创始人汪华的观点是:1、现在 GPT-4 做社交娱乐、衣食住行消磨时间,性能是足够用的,但大家宁愿去做生产力或者 toB 因为推理成本实在太贵。现在的 AI 应用被卡在中间,两边都有点不沾。只要模型性能成本降下来,事情就会不一样。(来源:Founder Park)
智源研究院院长王仲远的观点是:B 端应用目前相对明确,许多大模型已在多个场景中广泛应用,几乎覆盖所有行业。对于 C 端爆款应用,我们还需保持一定的耐心。(来源:光锥智能)
有句话说 " 美国的主战场在大模型,中国的主战场在应用层 "。然而,即便在 " 四大模型 " 具备碾压优势,应用层 " 较薄 " 的美国,也将投资金额慢慢转向了应用层。根据创新工场分享数据,全球从今年 Q2 开始,投在应用上的金额比去年有所翻倍。到去年为止,大部分的应用专注 to B。但今年开始,大量 C 端应用爆发,不仅是生产力和效率类的应用,偏娱乐社交的应用也开始批量涌现,从 to B 延伸到 to C,从生产力和效率延伸到综合的社交娱乐和其他的多模态等各个领網域。
再来看国内,应用层创新是无可争议的主战场。
一方面是基础硬體限制——追不起大模型;另一方面是 " 軟體 " 优越——数据和应用场景丰富。另有一个不能算优势的优势——国内大模型能力有限,反而放众多创业公司一条生路,大家可以凭借对垂直行业的数据积累和深刻认知杀出一条血路。
在此前的文章中,适道介绍了 AI to B 应用的切入点,以及定价策略。在这篇文章中,适道将对 a16z 此前发布的 Top 100 GenAI Consumer Apps,以及近期发布的榜单解读进行梳理,看看未来爆发的 AI to C 可能长啥样。
语音界的 "AI 换脸 "
在 2023 年 6 月,ChatGPT 等 LLM 占据了大部分的网络流量。而在最新分析中,两个新的类别加入列表:音乐和生产力(包括研究、编码辅助和文档摘要等任务)。
目前为止,Suno 是唯一上榜的音乐公司。它可以根据文本提示在浏览器中生成原创歌曲,包括歌词,并提供各种风格选择。Suno 最初仅限于 Discord,类似于 Midjourney,但在 2023 年 12 月推出了独立站点和 Copilot 扩展。
截至 2024 年 1 月,在 Discord 平台上的 AI 产品中,Midjourney 排名第一。题外话,朱啸虎不看好 Midjourney。原因是和移动互联网一样,To C 应用必须刚需、高频,长远才有机会守得住,而 Midjourney 的 To C 应用太低频。
在美国,Midjourney 这样的公司最终结局可能是被收购,但在国内,其实就是大厂想不想占,以及什么时候占的问题。
榜单中,另一个值得关注的新类别是生产力。AI 原生平台可以提升用户与軟體互动,允许他们委派日常琐事,减少在行政工作上的时间。生产力类别包括 7 家公司:Liner、Eightify、Phind、MaxAI、Blackbox AI、Otter.ai 和 ChatPDF。
这些应用可以帮助员工、自由职业者和中小型企业主更高效地完成任务,特点包括在工作流程中进行编辑、写摘要。例如,Eightify 提供 YouTube 视频的摘要,Otter.ai 实时记录会议笔记并转录。
这这 7 个生产力应用中,有 6 个提供或完全通过 Google Chrome 扩展程式运行。a16z 预计更多 AI 生产力工具将 " 融入工作流 ",与用户的工作紧密结合。大家不用在工作时再和 ChatGPT" 一问一答 ",复制粘贴提示和输出。另外,AI 生产力应用会开发——围绕通用 AI 的独特功能构建的全新端到端工作流程。AI 工作流产品可以帮助用户识别可以改进的内容,然后自动优化。
而在近期 6 月份的解读中,a16z 对 Eleven Labs、Gamma 大为惊叹,认为它们将代表未来趋势。
Eleven Labs 是一款基于浏览器的语音生成应用,能够创建逼真的语音,可调整语调、情感、节奏等关键声音特征。目前,语音生成(包含语言克隆和 TTS)成为了公司的核心业务。应用场景包括,影视配音,游戏配音,有声书,新闻,播客,会议转录等。
Gamma 是一款 PPT 生成工具,由 Google 推出。用户只需给出主题,就能自动生成 PPT,还可以根据提供的大纲或详细内容定制 PPT。a16z 的推荐理由是:这将是另一个在 c 端走红并被纳入工作空间的产品案例。随着这些产品的成熟,AI 生产力工具会作为一个整体,在网页端成为一个新的大类。
适道试图 " 碰瓷 " 一下 Eleven Labs,毕竟 ChatGPT-4o 的 " 睡前故事 " 也挺逼真,为什么消费者愿意多交一份钱呢?目前 Eleven Labs 的免费服务有百万用户注册,专业用户每个月需要根据需求阶梯式付费(1-5 美元、11-22 美元、99 美元)
a16z 似乎非常看好音频类应用,他们的理由是,ChatGPT 确实可以做到一部分,但未来将有更多类似的定制化和垂直的产品出现。
但对于国内创业者而言,完全可能抓住視窗期,复刻国内版 Eleven Labs。你甚至可以扩大网络效应——一部分用户创建自己的专业 AI 语音,并在验证后通过语音库分享;其他用户使用这些经过验证的声音生成自己想听的音频,然后打赏原创作者,或向他们直接付费。想象一下,这将成为多少二次元爱好者,以及游戏玩家(尤其是乙女游戏)的快乐老家。
AI" 搭子 " 深受欢迎
适道看过一道测试题:你想拥有一个有缺点但真实的人类伴侣,还是更想拥有一个完美无缺的 AI 伴侣?记得超过半数的人都选择了完美的 AI 伴侣。
据 a16z 榜单,AI 伴侣已成为 GenAI 的主要用例之一。已有数百万人与聊天机器人建立了关系。对于移动端的 AI 伴侣 App,用户参与度异常之高。最成功的产品甚至已经是用户日常生活的重心,就像给朋友发短信一样普遍。
根据 SensorTower 数据,每个用户平均每月与 Character.AI 互动 298 次,相当于每天 10 次会话,这点很像 iMessage、Snapchat、Instagram 的用户使用情况;与 Poly.AI 的互动平均也高达 74 次。此处再次感叹一下 "Pi 之殇 "。
因此,a16z 认为此类 App 具有广泛的适用性,尽管它还未成为真正的主流产品,但其正在努力。因为用户的产品使用数据是真实的,且从中找到了深层次的价值。
此外,a16z 发现了更为广泛的早期迹象——此类 App 不局限于 AI 男友和 AI 女友,还包括朋友、指导、娱乐,甚至是医疗保健。最近一项 Nature 的研究表明,Replika 聊天机器人减少了 3% 用户的自杀念头。
在近期解读中,a16z 加深了这一观点:想让 AI 陪伴 App 成为主流,就不应局限于开放式对话,而是以游戏、教练、治疗师或其他形式呈现,迎合不同用户群体的需求。
虽然目前为止," 专门用途 " 的 AI 陪伴 App 没有一家上榜。不过,a16z 与许多公司交流发现,它们的流量确实有大幅增长,甚至出现了每月从 0 到 2000 万的访问量。在这点上,上述 " 通用 " 陪伴类应用却做不到。
我们留一个问题,你想要一个什么都能聊一两句但不精通的 AI 伴侣,还是想要功能各不相同的 AI" 学习搭子 "" 旅游搭子 "" 工作搭子 "" 王者搭子 "?如果是后者,你更想在手机上下载不同的 "AI 搭子 "App,还是希望它们分别出现在相对应的已有 App 上?
AI 应用全球开花
尽管硅谷是 AI 中心,但全球各地都涌现出非常受欢迎的产品,尤其是移动端。
a16z 的榜单中超过 30% 的 GenAI 网页端产品来自湾区,但该地区仅有 12% 的移动 App 开发者。同样地,超过一半的顶级 GenAI 网页端产品是在美国开发的,但仅有不到 1/3 的移动 App 来自美国。
移动 App 开发者收获了不少成功。例如,总部位于伊斯坦布尔的 Codeway 开发了一系列 GenAI 移动 App,包括 AI 照片动画 Face Dance、聊天机器人 Chat & Ask AI 以及 AI 艺术生成器 Wonder,这些应用都在移动 App 排行榜上名列前茅。另一家总部也位于土耳其的公司 HubX 开发了 Nova 聊天机器人、達文西艺术生成器和 PhotoApp 增强器。
这些 App 工作室深谙:如何推出吸引流量的盈利 App。一些公司专注快速产生收入,另一些则追求风投青睐。例如,一家意大利公司 Bending Spoons 开发了视频编辑器 Splice 和照片增强器 Remini(没错,就是那个谁用谁丑的黏土滤镜),名列 App 榜单前五,他们最近宣布了一笔 1.55 亿美元的股权融资。
a16z 认为,这让人非常兴奋,因为无论是通过 API 还是开源,任何地方的独立开发者不需要在硅谷筹 5000 万美元,就可以构建出色的 AI 产品。随着 AI 技术日臻成熟,众多人才正从世界各地的实验室和大学脱颖而出,他们遍布全球,建立起各式各样的创业者社区。
下一个爆款:音频类应用
在最新解读中,a16z 希望看到移动 App 中出现更多的 AI 音频产品的创新。
例如,E 人 " 忠实听众 "。虽然 AI 可以生成影像、视频、歌曲。但人类的话语中很多有价值的内容没有被捕捉到,因为没有东西在听你说话、没有转录和格式化你的话。想象一下,如果讯飞不仅能记录开会内容,散会时还能顺便帮你总结一份重点摘要;当你深夜迸发灵感时,点开手机,App 就能记下你的真知灼见,顺便整理凌乱的思路。这确实挺让人期待。
例如,老人 " 小棉袄 "。老年人经常很孤独,AI 语音 App 可以和他们对话,讲故事、提问题,无论听多少次 " 过去的故事 " 都能快乐对话。
例如,学生 " 口语教练 "。很多人将 ChatGPT 视为自己的 " 美国朋友 ",练习英语。a16z 认为会有专门公司将这个功能做得更好。
结语
根据 OpenAI" 第一投资人 "Vinod Khosla 的观点:一年后,计算成本将是今天成本的 1/5 — 1/10。因此,创始人现在的目标不应该是想着赚很多钱,而是让模型被大量使用,从中获取大量数据,利用飞轮效应进化为更好的模型。
在这方面,C 端无疑有着最广泛的市场。目前来看,国内的应用大多建立在开源模型,门槛其实没有那么高,甚至出现了一人创业公司。其次,做应用不是做模型,重点不是攻克技术,有时甚至会走向营销。
但如果真到了 " 营销 " 范畴," 中国特色场景 " 就变得格外重要。比如这两天涌现的各类 "AI 填报志愿大模型 "。即便蹭热度,捞会员费是绝大多数,又何尝不是精准切入 " 中国特色 " 场景。
众所周知,AI to C 之路不好走,大厂要数据有数据,要场景有场景。但另一方面,移动互联时代不也跳出了专长算法推荐的字节嘛。或许,在大厂都在卷大模型之时,在上述领網域,无人知晓的角落里,一家 AI 时代的字节正破土而出。