今天小编分享的科学经验:读懂NotebookLM,或许能治愈AI应用缺失症,欢迎阅读。
中国的 AI 圈,有一种根深蒂固的顽疾,我们可以称之为:AI 商业化恐惧与 AI 应用缺失综合症。
具体表现为,一种 AI 技术爆火之后大家先是惊叹,什么 " 人人都被 AI 创飞了 " 之类的。紧接着,在这条赛道真正热起来之后就会转变为质疑:你做的 AI 能商业化吗?为什么 AI 还是没有超级应用?为什么我还是没有用到 AI 应用?
似乎 AI 总是在对技术的巨大期待,以及对应用的不断失望间轮回。大模型是真的雷声大雨点小,很难带来高增长、有商业化能力的应用吗?
最近外网一款应用的火爆,让我们有了些新的想法。不久之前,NotebookLM 的核心团队离职引发热议,团队负责人 Raiza Martin 宣布将和核心设计师、工程师一起离职,准备打造新的大模型应用。这一消息引发讨论的原因在于,NotebookLM 是今年欧美最出圈的大模型应用之一,甚至它出圈的原因根本不是作为 AI 笔记本的基础功能,而是一个尝鲜类的附加功能—— AI 播客生成。
透过 NotebookLM 的爆火,我们可以由此聊聊 AI+ 声音方向的商业化可能性,以及究竟应该如何打造具有高增长潜力的 AI 应用。
或许可以说,越来越多的热门应用正在证明,AI 应用缺失症是能够被治愈的。
NotebookLM 原本是谷歌一个小组打造的 AIGC 写作工具,在全球有非常多的竞品,并且已经推出了几年时间都没有什么水花。但最近让这个看似比较平庸的应用突然爆火的,是它添加了一项功能:播客生成。
更新后的这一功能,允许用户上传文档、文本、网页以及 YouTube 视频来生成由 AI 制作的音频播客。与其他音频功能不同的是,NotebookLM 生成的不是那种照着文本念出来的简单播客,而是有两个主持人的对谈型播客。
AI 生成的两位主播,会根据素材提供的内容进行分析、讨论,甚至会相互调侃,还能进行大笑。比如说,如果你输入一本历史类书籍,NotebookLM 就能生成多集的历史解密类对谈播客。如果输入自己的资料,它也能生成两位 AI 主播对你吹彩虹屁的聊天内容,他们有理有据,一本正经地分析讨论你有多么了不起。
这种新颖的内容生成模式给了网友极大的创造和收听动力,玩出的花样也越来越多。甚至有人认为,这可能是第一款不是由于模型能力,而是通过应用体验获得认可的 AI。
而在 NotebookLM 背后作为支持的,是谷歌的 Gemini 1.5 Pro 大语言模型。它能够一次处理多达 1500 页的内容,并且支持超长上下文的多轮对话。NotebookLM 的音频功能则是基于谷歌的语音模型来实现。
到这里我们会发现,NotebookLM 是一个标准到不能更标准的 AI 原生应用。它基于多个大模型来实现;利用了 AIGC 和多模态这些非常具有代表性的 AI 机制;创造了传统移动应用完全无法实现的服务体验。
由此可见,只要做对能力,找准市场,AI 应用是完全有可能撑起流量和商业化场面的。
当然,NotebookLM 取巧的一点在于它的市场切入点非常精准。播客在美国的市场需求量非常庞大,甚至大有超越短视频的态势。美国用户,尤其是年轻用户大多有收听播客的习惯,而明星、运动员、脱口秀演员也普遍将录制播客作为表达方式。
在这个关注度高、需求量大的市场上,AI 带来了两人对谈播客这种前所未见的应用体验,这才让 NotebookLM 在几个月内爆火出圈。
如果仅仅关注 AI 播客生成这件事,那么 NotebookLM 所代表的意义或许会被裁剪掉很多,首先播客市场在国内还远不如欧美火爆,其次 AI 播客生成的商业化潜力本就有限。
想要深度利用 NotebookLM 的意义,首先应该看到其所代表的 AI 音频赛道本就有着更为宽阔的商业化空间。对于 AI 行业普遍存在的商业焦虑,AI+ 音频至少是一种纾解。在生活中大量太长不看的内容,都可以通过转换为音频的方式来提升触达效率。比如在谷歌内部,谷歌广告团队就在研究基于 NotebookLM 的生成能力来打造销售问答,从而对新人进行培训。这样原本厚重的资料,就可以被模拟成销售人员与顾客之间的对话,新入职的销售可以直接学习与顾客进行交流,每个问题应该如何对应、解释等。
类似的例子还有很多,比如产品说明书的音频版、在线教育的问答机制。我们在很多时候都会面临资料太多,过长不看的窘境。这时我们往往会想要跟懂行的人问上两句,而现在问 AI 或许就可以了。
推而广之,NotebookLM 还可以跟机器视觉进行结合。比如去健身房,私教的工作其实就是看着你训练,然后指出动作的正误,回答健身者的问题。如果让 NotebookLM 附带上视觉能力,或许 AI 播客可以变成 AI 私教。
这些探索证明,一个出圈的 AI 应用往往具备连锁反应。它不仅能够在本圈层得到用户的追捧,同时还具有持续扩散商业影响力的可行性。
即使你不听 AI 播客,也对 AI 音频赛道毫无兴趣。NotebookLM 也依旧展示了优秀 AI 应用最底层的东西:输入简单,生产惊喜,贴近用户。
如今,大模型已经能做到很多前所未见的事,但总是无法出现那种能够引发讨论和传播的爆火应用。NotebookLM 的火爆告诉我们,其中很大原因出自产品设计的缺失。
与其他 AI 应用相比,NotebookLM 在产品层面有一个鲜明的特点,就是整体 UI 设计尽量倾向简单。AI 播客生成本身只是 NotebookLM 功能的一部分,用户打开门槛天然较高。在这种情况下,项目团队对其整体 UI 都进行了尽量简化。比如上传文档是很多 AIGC 应用都有的步骤,但上传檔案的步骤琐碎、容错度低,往往会给用户带来不悦的产品体验。NotebookLM 则支持一键上传源文档,并且可以覆盖文档、视频等多种檔案源与檔案格式。这种非常友好的用户界面设计,让这种创新型的 AI 应用拥有了极低的门槛。用户不会在 UI 层面就被琐碎的操作、复杂的檔案要求给劝退。
而与输入端尽量简单构成正比的是 NotebookLM 在输出端给出了非常完整且复杂的内容。用 AI 生成播客在今天已经不太新鲜,但 NotebookLM 能够生成两人对谈播客,并且对谈内容是有语气、有节奏,甚至是富有幽默感的。这种惊喜感和意想不到,与极简的内容输入构成了对比,进而变成了能够出圈的产品动力。
除此之外,NotebookLM 的成功还有一个关键因素,就是它找到了播客这个在欧美颇具市场号召力的领網域。正是因为播客本身有市场需求,受关注程度高,NotebookLM 带来的 AI 惊喜感才能顺理成章激活用户认同。而且 NotebookLM 又一次证明了,寻找更能接受 AI 的年轻人认可,贴近年轻市场的生活、娱乐、消费模式,是 AI 应用能够成功的关键。
总结 NotebookLM 的故事,可以发现一款成功的 AI 应用需要具备三要素:
1. 极简的用户界面与生成规则。
2. 具有惊喜感与震撼力的 AIGC 效果。
3. 贴近用户注意力,尤其是年轻人注意力的市场落点。
从大模型的能力出发,寻找到这三个条件,应该就能勾勒出差不多的 AI 应用了。
所谓 AI 应用缺失症,从正面看是一个巨大的问题,反面看则是很多个具体的机会。