今天小编分享的互联网经验:他从阿里离职,要做中国第一个打破数据垄断的创业者,欢迎阅读。
图片来源 @视觉中国
有着余杭 " 曼哈顿 " 之称的杭州欧美金融城,聚集了一众从阿里辞职的创业者。吴翰清的新公司就位于这里,他最近正在频繁约见投资人。
2023 年 5 月,网传阿里 P10 级人物吴翰清,宣布创业。直到近段时间,他的 AI 项目才浮出水面。
简单点来说,这位 15 岁进入西安交大少年班的天才,有了一个天才想法:在阿里浸润了 15 年,他宣布用 " 魔法打败魔法 ",用一个 " 新世界 " 打败 " 数据垄断的旧世界 "。
数据垄断与数据剥削
自人类进入数字时代以来,数据以中心化的形式存储于特定的数字平台中,人类从中获得便利、甚至在其中构建新的业态和生活方式。于是,平台上的数据越来越多,被人们选中的数字平台成为了数据垄断方,而当这种默认契约达成后,数据剥削便产生了——
用户自愿生成的数据以及用户在数字平台上的 " 存在 " 被平台售卖给广告主和项目投资公司,平台在这一过程中赚得盆满钵满,而作为数据生产者的用户和作为流量的用户却并没有获得任何实质收益。这是对用户数字劳动的绝对剩余价值和相对剩余价值的双重剥削。
数字平台与数据剥削
这种数据垄断和数据剥削也成为当下一些社会问题的帮凶。比如,近来一组数据受到关注,根据北师大中国收入分配研究院 2021 年发表的调查数据,我国超过一半的人口月收入不到 2000 块。一个社会的财富总量在一定时期内总是有限的,有人靠垄断资源攫取了暴利,那么普通人得到的财富自然就少了。" 互联网巨头和背后的资本攫取了过多的暴利,这些暴利已经远远高于社会人均收入值,超出了合理范围。千万富翁越多,老百姓就越穷。" 吴翰清在个人公众号中发文表示。
他的观点是,当今互联网最深层次的主要矛盾在于:" 信息聚集导致的数据垄断 " 和 " 人们对自由、开放、共享、平等的网络环境的向往 " 之间的矛盾。
去掉 " 中间商 ",构建一个去中心化的互联网,是吴翰清创业的初衷。
只不过,他一直在等待一个时机。
时机到了
ChatGPT 横空出世,吴翰清认为,打破数据垄断的时机到了。
他要构建一个 AI 互联网,并构建个人 AI 计算机。如果这个想法能够实现的话,吴翰清的愿景是:"AI 互联网 " 将消灭精准营销广告,把精准营销广告商榨取的万亿级别人民币利润返还给供应商和老百姓。" 相当于,人们以后在互联网上买所有东西应当会免除一道广告税。
对于那些希望通过看广告来免费获取服务的用户来说,需要认识到广告的隐蔽危害最终抬高了商品和服务的价格。而想免费获取某些商品和服务其实有其他办法,比如通过自己的分享来换取,就是一个健康的机制,它提倡和鼓励人们分享,而非攫取。因此最终 AI 互联网会更省时、更便宜、更丰富。
于是,吴翰清成立了新公司 "KMind",第一代产品即 " 半个宇宙 "。
半个宇宙的 "AI 互联网 " 设想
半个宇宙的产品逻辑与 ChatGPT 有一定的共通之处,在半个宇宙的架构底层也使用大语言模型 LLM,不过囿于 LLM 当前存在的比较严重的幻觉等问题,半个宇宙在路线选择上,主要通过 LLM 在 LUI(Language User Interface,人机对话互動)中完成用户对话意图分类,以及在运算器的位置通过 LLM 提高效率。但并不需要 LLM 的逻辑推理能力。
" 逻辑推理能力是我们控制器要建设的核心能力,我们也不需要 LLM 的常识,因为我们的存储器将让用户建设自己的私有知识库。" 吴翰清表示。
也就是说,半个宇宙中的用户可以像使用云盘一样,将自己的数据存储在半个宇宙当中,用户可以选择这些数据是否共享。如果选择共享,当另一位用户向半个宇宙提出问题时,半个宇宙的 AI 框架会自动在已共享资料中寻找答案并将这些答案带给提问者。
在这样的模式下,数据存在于每一个用户手中,他们对自己的数据是共享享有决定权,当那些被共享出来的数据被其他用户以提问的形式召唤时,AI 将自动处理数据将信息 " 送货上门 "。
个人 AI 计算机
半个宇宙所使用的 AI 框架由冯 · 诺依曼架构的扩展而来,保留了冯 · 诺伊曼架构的主要部件:输入输出模块、控制器、运算器、存储器。
不过,依托冯 · 诺伊曼架构,半个宇宙的底层框架在输入输出模块增加了 LUI,它基于 LLM 对用户的自然语言做意图分类,然后触发控制器执行相应的动作。其次新增记忆器用于处理短时记忆,LLM 和提示词框架也被放到了运算器中。而其中的控制器相当于整个系统的 " 大腦 ",它理解用户意图并对复杂任务做拆解,并调度不同的执行单元完成任务。
吴翰清将这个扩展后的 AI 框架定义为个人 AI 计算机,这个系统也被命名为 kOS-1.0。
KMind 通用 AI 计算机架构图
"个人 AI 计算机主要实现两类任务,一是自动化的处理数据,二是学会使用工具。个人 AI 计算机要完成的本质工作只有一个:操作数据。" 吴翰清表示。这也决定了半个宇宙与 OpenAI 的本质不同,半个宇宙追求的是个人 AI 计算机,而 OpenAI 最终可能会形成一个 AI Agent 生态。
半个宇宙与 OpenAI
半个宇宙的世界中除了最终用户,还有一类群体会对这个宇宙的建立起到至关重要的作用,就是开发者。在半个宇宙的逻辑链中,开发者可以自主开发 ACT(Action 缩写),ACT 强调 AI 自主性,即定义自主智能(Autonomous Intelligence)行为,初衷在于用户可以用自然语言来操作计算机,LUI 则在中间完成自然语言 Query 到 ACT 之间的映射。
半个宇宙初始設定了 "Native ACT",通过 Python 编写代码,组合 Native ACT 的调用,开发者就可以开发出一个自定义的 ACT。不过,由于实现了 " 基于自然语言的 AI 编程 ", 半个宇宙的开发者群体有望从 700 万开发者,变成 7000 万的专业工作者。各行各业的专业工作者如作家、画家、美食家、律师、医生、教师、学者等等通过自然语言描述需求,AI 计算机自动完成任务。
吴翰清的观点是,在 AI 时代,ACT 会成为新的程式开发形态。
" 新世界 " 能成吗
叫板 OpenAI,棒打巨头垄断,半个宇宙这件事儿能成吗?谁来为这样一个反垄断、反剥削的新世界买单?
半个宇宙承诺不使用用户数据来训练 AI,也承诺绝不上线广告,但它最终还是需要用户买单的付费产品。
" 现在为计算机花多少钱,未来在‘半个宇宙’就会花多少钱。但半个宇宙价格可能会更亲民一点。" 吴翰清表示。
对于一家计算机公司来说,计算是重资产,伺服器也是重资产,这些成本无论如何也无法用广告收入来抹平,它必须是付费而不是免费的生意。就商业的本质来说,吴翰清认为,半个宇宙最终卖的是算力,用户未来按月弹性订阅,也可以抽成 48 个月付款,每个月花几十块钱就能够得到一台计算机了,并且这台计算机还可以随时扩容,随时进行算力更新。
为了触达用用户的不同使用场景,半个宇宙未来也不排除推出硬體类产品。" 你不能说我们把 AI 真的塞到这个硬體盒子里,不是这样的,但它肯定会有一些云端之间的协同,这是必然会产生的。" 从吴翰清的表达中看,硬體可能是更长期的布局,不会现在立即就做,它会跟随半个宇宙成长规模慢慢展开。
"半个宇宙的数据量最终会超过百度,会不会超过谷歌再说,但一定会超过百度。" 吴翰清表示。他也并不害怕与巨头的正面竞争," 这是两个时代的竞争,如果真的这件事情成了,或者说如果我预测的未来到来,他们就自然消亡掉了,所以都不是说我把它们打败,是时代把它们打败了。"
以下为访谈节选:
1. 在所有的 GPT 都是希望成为 OpenAI 的情况下,半个宇宙如何保证不成为 OpenAI?
吴翰清:这里面有一个很重要的区别就是,首先如果这个公司的商业模式是广告,那我觉得最终它很难避免自己不作恶。不提倡数据垄断意味着我们不会用大数据去盈利,但这不是说我们不会用大数据,我认为我们未来数据总量至少超过百度,会不会超过谷歌再说,但是我认为我们的数据总量未来至少是超过百度的。
第二我们不会自己搞一个拥有所有常识的 AI 出来,然后去收费,我们不会干这个事情。那我们这家公司干嘛呢?我们卖算力," 半个宇宙 " 提供的是算力,程式员进来提供的是算法,用户提供的数据,所以数据是归用户的。用户得到了数据,创造了价值,程式员得到了他写的算法创造的价值,最后 " 半个宇宙 " 提供了算力,这是一个良性的生态结构。OpenAI 是这三者全是它的,数据的价值是它的,算法的价值是它的,算力的价值还是它的,所以最后它是会让所有 agent 公司死掉,我们会让所有的 agent 公司活,这就是差别。
从另一个角度来讲,为什么我刚才提到 OpenAI 有点问题?就是它最近的这个 " 宫斗 ",我不知道外界怎么解读的,从我的角度我觉得是非常糟糕的一件事情。
2.OpenAI 的董事会和 Sam,你支持谁?
吴翰清:这不是一个支持不支持的问题,如果我在 Sam Altman 的位置我会做同样的事情,但是今天我是一个外部观察者的角度来看,我认为是非常非常糟糕的。原因就是 OpenAI 这个母体它的非盈利性的组织,它是通过協定在约束商业公司的,最后如果这个员工起义就能够把董事会给 fire 的话,那所有商业的契约精神就不复存在了,所以我认为这是一家没有契约精神的公司。不管他的出发点是不是正义的,但是他一定是违背了契约精神。你看看 OpenAI 它原本的董事会,他们想干嘛?他们是认为 AGI 对人类可能会造成威胁,所以他们试图去维护它。他们是在捍卫道德,还是在捍卫商业之间做了一个博弈,最后商业赢了。
在发生了这样的 " 宫斗 " 之后,我认为 OpenAI 对我们已经没有威胁了,因为我们的价值观比它更正。我们一直是走在希望创造更平等的互联网的道路上,但 OpenAI 曾经试图坚持这件事情,我认为如果他们真的把 Sam 给 fire 掉了,我认为这是一家非常伟大的公司。
3. 如何去抵抗数据剥削?因为 " 半个宇宙 " 最终要成为一家盈利的公司,要成为一家商业公司。
吴翰清:我要把最关键的 " 半个宇宙 " 信息推荐算法和检索算法开源掉,由一个开源社区来维护,第一天我们就做了这件事,断掉了未来 " 半个宇宙 " 想要闭源的根子。如果某一天 " 半个宇宙 " 竟然想要把它给闭源掉,把开源算法替换掉,那我也号召所有 " 半个宇宙 " 的居民来推翻它,因为从那一天可能就是他作恶的开始,他开始尝试又从不垄断数据走向了数据垄断,那就是违背了这家公司的使命和初心。
4. 刚才您提到了 " 半个宇宙 " 卖算力,这个具体是怎么做的?最终付费的是不是还是用户?
吴翰清:最终付费的当然是用户,因为我们是一家做计算机的公司,而且我也说了,我们只对标苹果,所以你想想吧,你买苹果手机是要付费的,没有人说会免费的给你用智能手机,除非是运营商买单,然后积分什么换,但实际上一定是有人为此去付费的。
5. 您刚才也提到了做硬體,接口很重要,那这个是必选项还是说未来可能为商业模式去考虑更顺利然后做这件事情?
吴翰清:刚才谈到硬體纯粹是出于商业考虑,就像我说的,我们真正的主体是在云上的,所以我们的星伴它一定是一个 AI 永远在线的形态,硬體只是为了更好的去通过商业触达不同的场景。因为今天很多消费者的购买选择是非理性的,比如说很多消费者去买车的时候,他压根不懂车里面的引擎到底有多好,他是看这个车的外形好不好看。不好看的统统否掉,就都不进入到购买选项,只去看好看的车,它贵也会买,所以消费者的选择往往是非理性的,我们做硬體可能也是出于这样的消费者心理的考虑。但你不能说我们把 AI 真的塞到这个盒子里,不是这样的,但它肯定会有一些云端之间的协同,这是必然会产生的。所以是不是做硬體对我来说是一个商业选择,而且可能也不是我们第一天的商业选择,但是随着我们成长的规模和路径慢慢地都会覆盖到。
6. 半个宇宙的思路在现在看来是超前的,因为超前就有可能失败,会有这个问题吗?
吴翰清:我认为可能之前我们看到了很多公司,他们尝试着想做类似的事情,但是他们可能出现在 10 年前,所以他们失败了。那到今天我之所以敢出来做,是因为我认为时机和条件成熟了。就像我在我们这里分析的就是到今天诞生个人 AI 计算机的几个基础前提今天已经具备了,今天出现了大模型这样的具备足够泛化能力的神经网络,在之前是没有这个东西的,之前都是小模型,都是基于特定场景的,必须依赖于数据的样本,这件事情大概在 4、5 年前还是这个样子,但是到今天我们突然发现大模型出来之后改变了很多,它最关键的改变我认为是在这个地方,所以 LUI 是一个巨大的变化。
第二是谈到云计算今年也是产生了,所以今天我们是有足够的能力支撑我们来做这样的事情,有足够的算力。这个算力不是指的英伟达这个东西,我们谈到的是云计算这种模式。
三是我们认为到今天可能这个临界点就是在于可编程这件事情,如何让一个 AI 具备可编程能力,我认为是到了一个临界点。这件事情还没有真正突破,但是恰恰因为它没有真正突破,所以我们才有机会。如果它已经被别的公司突破了,我们也没有机会了,所以我认为最后这临门一脚应该我们射出去。恰好是在一个天时、地利、人和的时间点上,天时、地利、人和,你不这样想吗?我认为是天时、地利、人和。
7. 打破数据垄断这个东西一定会动各大厂蛋糕,如何考虑这些难点?
吴翰清:首先我认为跟这些大厂的竞争是两个时代的竞争,所以我跟他们其实也没什么好竞争的。如果真的这件事情成了,或者说如果我预测的未来到来,他们就自然消亡掉了,所以都不是说我把它们打败,是时代把它们打败了,是时代淘汰了它们。时代认为未来应该是一个更平等的互联网,而不是说一个被垄断的互联网。所以 AI 互联网到来的那天,首先不一定是 " 半个宇宙 " 做成的,但是 AI 互联网我认为它一定会到来,所以那些公司就是今天做广告的,它自然就淘汰掉了。为什么会淘汰掉呢?因为我们认为它们很难转型,因为它们都是上市公司,财报把他们压到他们没法转型,没法调整,做任何的调整财务数据一掉,投资人跳起来,股民跳起来,他们就又不能调了,所以就很艰难。你会看到的现象是这些大厂里面的人才都流失,然后出来去拥抱 AI 互联网,你会看到这样的现象,那我就把这个预言放在这好了。
所以我才觉得 " 半个宇宙 " 是在顺势而为,我们不是说我们今天创造了 AI 互联网,我认为是 AI 互联网必将到来,我们看到了这样的未来,看到了这样的机会,所以我们提前进去了。
更高的事情,我们是在做一件效率更高的事情,所以最终我会把它做到安全让大家选择去相信它。今天是一个很好的开始,在今天我们一定会受到一些质疑,就是关于隐私和安全的挑战,但是我们会优先选择愿意相信我们的人来共同成长和发展。随着相信我们的人越来越多,我相信最终我们会被社会所普遍接受,所以这是一个社会需要去接受它的一个新事物的过程,它不是别的过程,所有技术都需要经历这样的过程。
8. 怎么看待下一代搜索?很多公司都想成为一家下一代搜索公司。
吴翰清:搜索引擎本身是在聚合互联网上的大量信息,才会有搜索这个概念。在我们 AI 互联的概念里面是没有这个概念的,你要做搜索也只是一个局部搜索,所以在我们 AI 互联的概念里面,应该是你有需求你要广播,无非是看你广播的范围,最后会有很多 AI 出来应答,应答是一个推荐的过程。推荐过程有可能开源掉,所以我认为在我们看到的 AI 互联的未来里面是没有搜索这个中心化概念的,这是我们非常重要的一个区别。
9. 但它实际上做的就是搜索这个事,只不过换了一种去中心化的方式。
吴翰清:它做的不是搜索这个事,因为搜索是人在找信息,我们 AI 互联讲究的是信息找人,是信息的反向流动。这个反向流动你已经不能把它叫做搜索了,你获得了信息,但它不是搜索来的。