今天小编分享的科学经验:一览科技CTO陈锡言:大模型阴影下的技术创业机会——链接大模型与用户,欢迎阅读。
过去三个月,AIGC 和其背后的大模型浪潮席卷中文互联网,所有人都能享受到人工智能技术更新带来的便利。
在公司层面,拥有大模型技术和资源的头部企业获得了最多的关注,而大模型应用层的创业公司虽活跃,但存在感却并不高。
甚至随着 ChatGPT 相关功能插件的释放,没有直接参与大模型竞争的应用层企业都有可能被类似于 OpenAI 的企业的一个插件所 " 覆灭 "。
毫无疑问,通用人工智能的发展还会持续影响应用层企业的生存空间。
那么,作为应用层的创业公司将如何在这种压力下,寻找到属于自己的创新空间、打造独特的业务模式呢?他们的创业价值又将如何得到社会和市场的认可?
围绕应用层创业公司如何通过链接大模型与客户发挥价值,一览科技联合创始人兼 CTO陈锡言在「量子位 · 视点」直播中分享了他的从业经验和观点。
以下根据分享内容进行整理:
大模型的出现拉齐了很多公司的 AI 水平,革了很多 AI 服务商的命,同时它又以极快的速度普及,可以称为史上增长最快的月活破亿的应用,颠覆了很多技术、业务和服务。
ChatGPT 开始免费之后,基于 OpenAI 生态的一些创业公司其实都是一脸懵。虽然 OpenAI 的 CEO 表示说 " 不会和客户产生竞争 ", Jesper CEO 也说 " 更多大模型的出现,让公司已经摆脱了对 OpenAI 的单一依赖。" 但这些解释的逻辑其实很无力。
ChatGPT 的出众之处,在于除了大模型本身以外,还有自然语言的互動模式,这是自命令行、影像化 UI 之后的最先进人机互動模式。GPT4 提供了通用人工智能的可能性,对话的人机互動形式配上 AGI 之后似乎变得无所不能。文心一言、通义千问等国产大模型也都是如此。
这半年来,团队经常会讨论到一个问题,大家都用大模型了,我们的价值究竟是什么?
大模型阴影下,创业公司有什么机会?
在文心一言发布会上,李彦宏曾提出了一个四层模型:芯片、框架、模型、应用。但是他只说了这四层模型,但是没有说这四层模型的关系究竟是金字塔形的,还是倒金字塔形、橄榄形、菱形或别的结构。
芯片,肯定是卡脖子的核心竞争力。框架,是大公司的游戏。模型的话,现在看起来 10 亿起步,而百度还说文心同时做了 10 个行业大模型。
应用层,现在看起来 ChatGPT、文心一言以及其他大模型的这种互動类应用都是 ToC 的,而且免费。大家都说要做 AI 大基座,要形成自己的应用生态。
如果 AI 大基座在模型关系里是底层(在地上),那么它对于应用层的创业者来说是一个平台。但如果 AI 大基座是顶部(在天上),留给应用层创业者的就会是阴影。
目前看起来,现在做大模型的 AI 大基座们都表现出了一个 " 我全要 " 的状态:说是大基座,实际上包含了全部的四层模型。
小孩子才做选择,做大模型花了那么多钱,当然是全都要。
阴影 1:通用人工智能让很多 SaaS 一夜之间失去壁垒
通用人工智能好像什么都可以做,让很多 SaaS 軟體很懵,多年的积累在大模型面前可能变得一文不值。所有軟體公司都面临一种情况:被迫拥抱 AI。
当 " 所有应用都值得用 AI 重做一遍 " 被提出来之后,大模型先把自己母公司各系产品都加上 Copilot,比如浏览器、搜索引擎、即时通讯、办公軟體等等。这真的让人很怀疑,我们还做其他軟體的价值究竟是什么。
阴影 2:不仅取缔机器和軟體,还会更快取缔人类的工作
我认为能够被简单且精准描述 input、process 和 output 的工作更容易被取缔。
例如把影像中所有蓝色改成红色、仅仅做排版的文字编辑、按标准文档回复的客服服务,甚至说当制作一杯咖啡,加多少豆、怎么研磨、加多少水多少奶都非常标准的情况下,口感与手工咖啡的可能差别并不大。
阴影 3:风头全是大模型公司的,没钱根本上不了船
现在几乎所有的风头热度都在制作大模型的这些公司,包括创业明星系的、BAT 系的、名校系的。有一件事情可以肯定,创业公司根本就参与不了大模型的开发工作。
A100 虽然不好买,但其实购买方法也很多,京东上就有——只不过上次查的时候是 10 万元一张,今天已经变成了 119,999 元。买不买得到并不是问题,买不买得起才是问题。
即使创业公司有 5,000 万,买完 500 张后连网线都买不起,电费也只能用花呗。所以创业公司入局大模型如果没有 10 个亿,根本上不了牌桌。
AIGC 并没有创造新的需求。我要一幅 AIGC 的画,可能等于我要一幅更便宜的画,这是供需市场决定的。AIGC 只是一个工具,而需求侧永远想要更便宜的产品。
AIGC 重复了很多业务流程以及供求关系,几乎所有的企业其实都希望 AIGC 来提升生产力,但实际上其实困难重重。
AIGC 对生产力提升中的真正困难
一、工作流程固化很难改变。
AIGC 工具强调个体,个体是打工人,打工人卖的是时间,凑够时间可能就拿到工资了。而 AI 工具作为新事物,还有很多的不确定性,很难说服打工人为了一个不确定的工具去增加学习成本。
二、商务比系统更重要得多。
很多 ToB 业务一旦成熟之后,商务关系往往比业务本身更重要。系统被弱化了,甚至有些老板对技术部的要求就是,只要不宕机,做成什么样都不影响公司赚钱。我听到最无力反驳的一句话,客户的工作方式不变,自己公司单独变化有什么用。
三、很多打工人更愿意偷偷的使用。
我们不得不承认,很多场景尤其是创意类工作场景,使用 AI 并不是一个很体面的事情。如果借助 AI 制作了东西,或是使用 AIGC 节省出了更多时间来休息摸鱼,打工人自然不想承认,也永远不能承认。
四、担心信息泄露。
安全的确是一个问题,但更多时候可能是一个借口,没有前面三点重要。
AIGC 工具现在更多的是个体的赋能,而不是对企业的赋能。希望大家记住这句话,这是我们创业的一个机会。
什么样的岗位不容易被 AI 取缔?一、要求结果稳定精准
GPT4 到底会不会解数学题是一个很有争议的问题。
比如:一个计算机只能执行「+1」和「X2」两个运算,如果输入「1」,问最少几个步骤可以得到 63。GPT4 肯定是倒推法,方法是正确的,但每次都会算错,比较好笑的是它知道算错了,还能拼命扯回来。比如在某一步骤中「X2」,然后得到 70,突然发现超了,这时他告诉你最后再减 7,也能得到 63。
我不觉得稳定和精准是一个大模型应该有的必要属性,我也不相信语言模型能解决数学问题。这是我的一个比较偏执的世界观,有可能是错的。
二、强 IP 属性业务
大家有没有注意到,书法作为我们国家很重要的一种艺术形式,到现在为止却没有一个书法的 AI 模型出现。这可能是价值问题导致的,书法 AI 模型它可能就没有价值。
比如说这个字是启功写的,这字是苏轼写的,如果第三种字是 AIGC 写的,很有可能会被扔掉。因为书法很强调个人风格、审美和个人 IP。
三、对安全要求很高
想象一个职业,AI 理发师。
理发师这样的职业是需要极其信任和安全的,如果一个黑化的理发师拿着刀在我面前,我可以说大哥别伤害我,打感情牌可能还有一线生机。但如果对面是一个机器人,它仅仅是一个杀戮机器,我毫无办法。
另外理发师这个行业也具有强 IP 属性,任何一个理发师在社区都是强 IP。
四、数据集缺少或者不容易被标注
大模型本身的泛化能力仍然受限于数据集。如果说某个行业会被取缔的话,那最简单的一个判定标准就是该行业能否组织足够多、足够好的标注数据;如果数据质量非常多非常好,大概率机器会代替人完成。
但如果是那种不容易被标注的,比如说一个艺术作品,它不仅包含了创作者的情绪和感情,还包含了观看者当下的情绪,大概率不会被替代。就像我们常说的 "1000 个人心中有 1000 个哈姆雷特 ",这个复杂度很难得到有效标注,标注的意义也不大。
五、需要动手实验的
有一个很经典的问题:如果 ChatGPT 早发明 500 年,人类还会不会知道地球是圆的?
我认为在科学面前,AIGC 和圣经是一样的,不是因为他们权威,而是因为在科学面前,他们都需要被摒弃。
AI 虽然可以处理和模拟一些既定的任务,但它们缺乏人类的直觉、情感以及对抽象概念的理解,这是无法模拟的。
大模型背景下的技术创业机会一、懂业务懂技术:链接大模型与用户
我们有个客户是影视行业的上市公司,老板最开始要求全公司都要用 AI,100 多号人响应号召使用一堆五花八门的工具,后来缩减到只剩 ChatGPT 和 Midjourney,到最后就什么都不用了。直到后来找到我们来提供企业级的 AI 工具,和现有的工作流做无缝打通。
所以其实企业永远需要信息系统,如果又懂业务又懂技术的话,做大模型和企业之间的链接者是一个不错的选择。
二、有钱有能力:加入大模型创业
这里面还是有很多值得做的事情,比如多模态、潜信息、腦机互動等等,但需要有钱有能力。
三、有趣的灵魂:利用 AI 制作有趣的内容
AIGC 对于内容创作者,其实是一个特别好的时代。以前很庞大的创作组织,现在可能只需要几个人。
另外,ChatGPT 一本正经的胡说八道,或是天马行空的奇思妙想,这种能力特别适合做内容创作。
四、直男程式员:微调 / 定制模型
有一种纯技术方向:为企业提供微调大模型,或者提供行业定制模型。
当我第一次看到 MaaS,也就是 Model as a Service 的时候,我是绝望的,要被大公司逼近绝路的感觉。但是最近我又看到一个词 Fine Tuning as a Service,我觉得特别有趣,一看就是程式员想到的。这个词让我感受到了程式员乐观、积极向上的情绪。
AIGC 大背景下有哪些岗位会炙手可热?
其实淘金热中最赚钱的是卖牛仔裤的。在整个 AIGC 大背景下,除了刚才那些直接创业的机会,我认为还会有一些炙手可热的工作岗位或是可以形成衣务的。
一、AI 对齐工程师
随着 AI 工具的不断发展, AI 如何与人类的价值观保持一致,以及 AI 系统如何保证自己的可解释性等等将会成为重点。AI 对齐工程师,是要保证 AI 系统在任何时候都能和人类的价值观保持一致,保证人类的利益,以及保证人类对 AI 的控制权,甚至必要的时候拔网线、断电等等。
二、模型训练工程师
刚才说到每个企业都值得拥有自己的模型,那么在大模型基础上,通过微调或者蒸馏等方式,得到一个企业专有的模型,也是一个很重要的事情。
三、数据治理工程师
虽然企业都值得拥有属于自己的模型,但是模型依赖数据。
数据治理指的是在一个组织内部对数据质量、数据整合、数据隐私、业务流程等做合理的管理体,保证数据的准确性、一致性以及可用性。首先要数据可用,才有机会训练模型。
大多数企业的数据化程度是不足的。其实越是在线化业务的公司,或者做数据服务的公司,数据化程度越偏低,很多互联网企业的数据化程度甚至远不如一些工厂。
四、数据标注师
高质量的标注数据会成为 AI 系统的核心竞争力。前几天我看新闻,北京还提出了一个概念,要做统一的数据标注服务,大家也都看到了数据标注是一个非常重要的业务。
babyAGI 和 autoGPT 有哪些启示?
前段时间 babyAGI 和 autoGPT 比较火,火得快,凉的也快,但是留下了几个词很有价值,比如「思维链」和「任务队列」,有的地方解释成「工作流」。
左图是 babyAGI 第二版的工作流程图,核心就是把第一个问题形成一个问题列表,然后放到队列里面,对每一个问题做相应地执行,然后通过 ChatGPT 解读相应的答案,再对答案生成若干个问题,类似于金字塔的结构,通过逻辑树的方式逐渐地去找解决方案的本质。
右图指的是 autoGPT 第一版里面最重要的几步,也是把一个问题拆解成多步,然后列出相应的计划,但是它比 babyAGI 多了一步,就是检查这个东西对不对的概念,然后批评、反省。这个步骤对一个智能型的 AI 系统而言,是非常重要的。
从这两个开源项目里面,我们能学到很多做大模型还没有触及到的,或是比较有特色的 AI 系统的地方。我的想法是对它们做改进之后,使用专家系统来設定自己的业务工作流,提前录入到系统里面。
做应用层 AI 产品的底气和优势
一览科技凭什么在应用层做 AI 视频工具,或者说在应用层 AI 这个产品上,我们具有什么样的优势?
第一个优势,数据积累。一览已经做了很多年的商用视频,服务了数千家企业用户,全球范围签约了数十万的视频创作者,积累了很多的商业视频数据,这些数据是独有的,且在创作以及视频交易的过程中,还会不断产生新的数据,具有成长性。
第二个优势,场景明确。我们一直垂直于视频的创作。
第三个优势,业务相对成熟,成立五年,我们已经积累了海量创作者和内容消费者。
第四个优势,创作的安全性。通用人工智能 AGI 有很多的风险及不确定性,但在内容创作上的包容度以及 AI 对齐和内容安全措施已经相对完善,涉政、涉恐、涉黄、涉暴的预警措施相对完善。
我们选择了一个适合自己的垂直的领網域,并且在这个领網域上具有一定的优势,这是一览 AI 视频工具在应用层的特色。
说了这么多,实际介绍下一览 AIGC 工作流中「AI 编剧」这个产品。
我们提前把工作流注入到 AI 系统里,然后由 AI 一步步执行。在我看来,"Step by Step" 这个过程并不应该由通用人工智能来执行,应该由人类专家来输入。
第一步,通过一句话生成若干个创意。生成创意的过程,等于头腦风暴,这特别适合 AIGC。我们可以输入几个关键词,比如宫廷、狗血、爱情、伦理、逆袭、反转,它就能够瞬间输出很多个创意。
第二步,在工作流程之中开始角色设计。角色设计需要哪些东西,比如人物的性格特征,行为习惯,体貌特征,对话风格,包括性别、年龄等。
现在有了角色和创意,把这些内容输入给 AI 来生成剧情,剧情里面一定要有冲突和反转,这也是我们要提前录入进去的設定,然后就可以快速生成若干个剧情,同时批量生成几百字甚至几千字的脚本。我们可以选择 1 个最有挑战的剧情,接下来根据剧情,我们还可以生成一系列概念图。
另外,大家也知道 Token 的限制,其实对于剧情,我们也可以把一个剧情分解成若干个段落,每个段落再进行扩展,这也是一个能让剧本逐渐丰满的过程。
一览「AI 编剧」工作流的四个核心:上下文存储、海量的创意,视觉化创作、评估反馈。
评估反馈,大家可以理解为剧本评分,相当于 autoGPT 里面的批评环节。这个过程中,我们可以产生更多的信息、更多的数据。
经过剧本评估之后,这些情节段落进行不停的调整和优化,然后进入下一步,再次生成视觉化的创作,不断打磨作品质量。
AIGC 加速了平庸时代的到来
AIGC 可以提高所有生产工作或者创作的平均水平,但是它只能让未来比过去更好。但如果以前都变得一样好时,原来的更好就变成了现在的平庸。当 AI 工具全面普及,平庸的创作会无比廉价,人类的未来属于真正的工匠。
毋庸置疑,AI 工具普及和 AIGC 内容爆炸都是历史浪潮的一部分,不可倒退,无法避免。从媒体到时尚到建筑,再到其他一切,都会充满了不可避免的、普遍的平庸。但乐观的人总能找到自己的方式翻出不一样的浪花。最后用马斯克最近发的一个推特献给大家。
坚守自己的工匠精神,哪怕是不得不孤身前行。
Stay on the right path,even if you have to walk alone.
关于「量子位 · 视点」
量子位发起的 CEO/CTO 系列分享活动,不定期邀请前沿科技领網域创业公司 CEO/CTO,分享企业最新战略、最新技术、最新产品,与广大从业者、爱好者探讨前沿技术理论与产业实践。欢迎大家多多关注 ~
>