今天小编分享的科技经验:AI Phone的开局战,手机拍照为什么重要,欢迎阅读。
生成式 AI 是新的数字世界和用户世界之间的桥梁。拍照会是智能手机最容易告别 " 过度优化 ",走向新一轮软硬體创新起点的开始?
vivo 刚刚尝到冠军选手该有的味道。vivo X200 系列眩光门这种极限概率的问题,被关注以及广泛讨论,都是当下智能手机末世和卷局的表现。动辄见观瞻,以及得咎于人,始终相伴。
手机大厂豢养的评测媒体和自媒体对手机功能的评测本身,不足以公平、客观地评价产品已经是众人皆知。北京大学某位教授所提到的语言腐败,是这个社会的每个人,每个行业,以及方方面面。
终有一日,大厂们要为此付出一定的代价。这一话题本身不足多论。
手机大厂们非常取巧地在共用一个 " 苹果设计师 "。当小米去年最早开始全面借鉴苹果的直板复古外观,vivo 也又借鉴了小米这种直板外观设计,X200 系列沿用了这种风格。其他大厂又会继续借鉴 vivo 的外观?
库克、雷军、沈炜这些大厂的领袖,看来目标是一致的,就是投资效率。虽然,库克曾经口头对 ROI 这个词加之自己和苹果,表示过强烈的愤慨。GoogleVC 的合伙人 Siegler 的评论十分确当,现在的 iPhone 就是 Over-Optimized,过度优化。
AI 影像的变化,会对手机软硬體创新带来机会
小米、vivo 的新产品也都属于优化过度,未必有太多新意。优化了多年的螢幕之后,现在影像似乎正在成为这群企业领袖们着力优化的方向,苹果、三星、华为、小米以及此次意外事故瑕疵的 vivo,都在发力这一领網域。有了生成 AI 的技术潜力,Marc Levoy 在谷歌 Pixel 开辟的计算影像路线,正在被几个大厂更新到一种 " 智能影像 " 的新高度。
vivo 此前确定的赛道技术路线当中,影像是唯一表现突出的,该公司的影像负责人也已获得了重要的晋升。几个月前上市的谷歌 Pixel 9 系列,除了相机之外,几乎没有任何重大的提升和改善。
抛开个别公司和个别人事不论,相机会是未来一两年,手机大厂们唯一真实在做的努力方向?
AI 影像的话题价值在于,作为智能手机最重要的功能,这个功能的 AI 化是否会影响到手机产品本身的进化?从所谓的智能手机,进化到智慧手机的第一个突破口,是否会与影像相关?
简单的逻辑,手机 AI 影像的更新并不会影响到智能手机大厂们卖广告,代理游戏运营的收入模式,不会影响到库克、雷军、沈炜们的 ROI,可以积极投入,而不用担心会影响到 " 广告机模式 " 的短期收益。
生成式 AI 对手机硬體型态的变化和影响,甚至超过了此前通信制式的变化,端侧智能对本地存储、算力、数据传输技术的影响已经在发生。
典型的例子是,从 4G 手机到 5G 的更新,iPhone 继续沿用了传统的石墨片散热方案,沿用了让人不齿的 6G 内存方案。现在,要想手机更好地运行一个本地化的 ChatGPT 架构,而不是访问一个 APP,苹果也不得不更新 iPhone 的存储方案,并且对 iPhone 的硬體架构更新。
明年的 iPhone 17 系列,苹果将会跟随安卓生态的脚步,引入 VC 散热的方案。中国大陆的一家企业,以及中国台湾的两家企业会苹果供应相应的方案。此外,苹果正在考虑一些新的 VC 方案。
当优化、过度优化都难以解决问题的时候,革命就会发生。此前,Marc Levoy 在谷歌所开创的人像模式、夜间模式、HDR+ 等玩法,后来苹果以及安卓生态发扬光大。2020 年,此人在 Pixel 团队的内乱时离开了谷歌,加入 Adobe,继续其计算影像之路。
Marc Levoy 此后只有不多的几次对外发言。2020 年,刚刚加入 Adobe 时,Marc Levoy 接受了 The Verge 的访谈当中,他谈到了对计算影像技术方向的看法,不认同中国大厂们一味追求 " 大底 " 的技术路线。
他认为,未来的战场是加速器和背后的计算能力。
也是在这一年,他因为在计算影像方面的贡献而被授予美国工程院院士。在接受 Adobe Life 的访谈时,他提到了一个重要的趋势和方向,一些原来专业的影像的处理、编辑的平台,应用到手机上时,往往受制于硬體的性能。随着硬體平台技术能力的提升,计算影像的新天地在被开启。
这一表述,发生在多模态技术刚刚兴起,以及 ChatGPT 诞生之前。
两年之后,再接受 CNET 的访问时,Marc Levoy 开始很明确地提到了 Adobe 和他本人正在努力的方向——在智能手机上,用一款通用的 APP 軟體,为那些有一定能力的摄影者提供帮助,让那些原来需要手动控制的功能更为方便,比如,iPhone 当中的 Halide,以及安卓上的 Open Camera。
如今来看,安卓和 iPhone 生态似乎应该积极拥抱 Adobe 的这种创意工具軟體和生态。《智物》此前提到过,每一个智能硬體平台之上,会有一个全新的作業系統,用以支持用户数据和应用之间的智慧服务,其实,就像是 ChatGPT 大模型和模型之上的各种 middle layer 的关系,替代此前安卓、iOS 的应用商店模式。
回顾 Adobe 公司和乔布斯以及 Mac 生态的恩怨,在 AI 时代的起点,Adobe 这样的公司有几个重要的优势,天生对各种 IT 技术应用敏感,愿意尝试,更重要的是,创意人群天生具有付费的意愿和能力。在生成式 AI 大潮之下,Adobe 的股价曾经一度被打压,跌势凶猛。
《智物》曾经跟多个投资机构交流过,Adobe 反而是最容易拿到 AI 时代船票的公司。过去两年的进展来看,Adobe 的进度似乎也验证了这个看法。
Adobe 传统的軟體平台 Camera RAW 目前适配支持多款手机,包括最新的 iPhone 16 以及三星旗舰版本,当然更是支持 Marc Levoy 老东家的 Pixel 系列,国内手机当中包括小米 15 系列,以及一加系列。
AI 軟體对手机影像的优化,可能会带来手机架构的本质变化
当智能手机可以完善地支持自身的 AI 影像,以及 Adobe 这种原本非常复杂的影像编辑、处理軟體,会对其他的应用带来怎样的变化和影响?是不是会动摇到现有智能手机运算架构系统的基础?是否会动摇到如今,这些手机大佬们万分不舍的 APP 分发和流量广告的商业模式?
那个时候,或许应该有产品经理和创业者和投资人,不屑于再去构思 " 过度优化 " 的手机,而是去从新做一款手机。就像最近 Marc Andreessen 所提到的,不是再在一个成熟的蛋糕上撒面粉,而是重新设计,烘焙一个新的蛋糕。
李飞飞在其自传当中反复提到过《第一只眼》这本书,视觉能力在生物进化过程中所扮演的关键角色。手机这样的硬體设备,能够具备更强的影像拍摄能力,会对整个硬體系统本身带来如何的影响吗?
简单地描述这个问题。特斯拉的自动驾驶摄像头和系统,除了规划道路之外,也在识别整个周边的世界,既包括行人,也包括车主,这会让车辆的系统和架构非常不同于传统意义上的电动车。
从这个意义上来说,多模态和生成式 AI 技术是用户和数字世界之间新的桥梁,机器系统准确记录物理世界的能力,理解物理世界的能力,和生成一个虚幻的数字世界的能力,本来就是一种能力。
接近 10 年前,三星、华为都曾经试图用摄像头感知,让手机去识别、判断用户的简单行为意图,以今天的算法能力,和软硬體系统来看,会不会有新的成果?