今天小编分享的互联网经验:谷歌在I/O 2023打响AI反击战:Pixel手机成配角、新模型部分超越GPT-4,欢迎阅读。
今天凌晨 1 点,一年一度的谷歌 I/O 开发者大会正式召开。在 AI 大潮下,以往的重头戏 Android 和手机硬體 " 退居二线 ",发布会开始后的一个多小时的时间里都在介绍全新一代的语言模型等 AI 新品,谷歌 CEO 桑达尔 · 皮查伊更是在一开场就讲到了 AI 对谷歌产品的重构。
值得注意的是,作为 AI 行业的 " 领导者 ",谷歌今年以来一直被 OpenAI 和微软压过一头,这次开发者大会也被认为是谷歌 " 一雪前耻 " 的机会。全新大语言模型 PaLM 2 的正式亮相,以及展示的大规模应用场景,似乎也是在告诉外界,自己在这场 AI 竞赛中并没有落后。
截至美股 5 月 10 日收盘,谷歌股价上涨超 4%,盘后微涨 0.24%,算是对这两个半小时 "AI 推介会 " 的认可,也缓解了谷歌这段时间的焦虑。
谷歌的反击,PaLM 2 部分性能已经超越 GPT-4
早在去年 4 月份,谷歌便推出了大语言模型 PaLM(Pathways Language Model ),使用了 5400 亿参数进行训练。作为更新版,全新发布的 PaLM2 在多语言文本处理以及推理和解码的能力上有了很大的提升。用谷歌官方的话来说,PaLM2 的部分性能比 GPT-4 还要好。
皮查伊指出,PaLM 2 是我们十年以来,用负责任的方式将 AI 带给数十亿人的旅程中的最新进展。
据了解,PaLM 2 建立在谷歌的基础研究和最新的基础设施之上,接受了逾百种的多语言文本训练,在各种任务中都具有很强的能力,并且易于部署,能够理解并生成精确的结果。
皮查伊介绍称,PaLM 2 模型可以被 " 拆分 " 为 4 种大小不同的版本,命名为 Gecko、Otter、Bison 和 Unicorn,在各种规模的情况下都能提供出色的基础功能,其中,Gecko 模型非常轻巧,可以在移动设备上工作,每秒大约可处理 20 个 Token,即使在离线的状态下,也可以在设备上运行互動式应用程式。
与此同时,PaLM 2 还可以让世界各地的开发人员进行合作开发,当用特定领網域的知识对它进行微调后,表现也会更加出色。
皮查伊举了一个例子,根据医学知识进行了微调的 Med-PaLM 2,与基础的模型相对比,这种微调使不准确的推理减少了 9 倍,接近于回答同一组问题的临床医生专家的表现。
他表示,Med-PaLM 2 是第一个在医学执照考试上展现出 " 专家 " 水平的语言模型,展现出目前的最高技术水平,目前还在努力增加 Med-PaLM 2 的功能,使其能够结合医学影像信息,如平片和乳房 X 光检查。
PaLM 2 赋能下的新体验,Bard 一雪前耻
作为此次开发者大会的核心,在介绍 PaLM 2 之前,谷歌先是展示了 AI 在 Gmail 、Google Maps 以及 Photos 上的应用。其中,Gmail 中推出的 "Help me write" 功能,只需输入你想要的信息,然后点击 " 创建 ",一份完整的草稿就会出现。而 Photos 中全新的 Magic Editor 功能,则可以让用户轻松对图片进行编辑。
在去年的 I/O 大会上,谷歌推出了沉浸式视图,即利用 AI 创建一个地方的高保真地图。现在,谷歌正在将同样的技术扩展到 Maps 最擅长的领網域:帮助用户到达目的地,用一种全新的方式来感受旅行。沉浸式路线视图将在夏季推出,并在今年年底前在 15 个城市上线,包括伦敦、纽约、东京和旧金山等。
AI 技术的应用,正在提升用户的体验和效率。根据谷歌透露的数据,目前已有 15 个为个人和企业提供帮助的产品用户数都超过了 5 亿,其中 6 个产品的用户数已超过了 20 亿。PaLM 2 的推出,更是让这些应用充满了想象,目前已应用在 25 项产品和功能中。
此前,谷歌匆匆上线的 AI 对话机器人 Bard 反馈并不是很理想,和 NewBing 的体验差距较大,一度导致谷歌股价的下跌。这一次,完全运行在 PaLM 2 之上的 Bard,已支持广泛的编程功能,并在推理和数学提示方面更加智能,还能识别图片以及通过图片的形式进行回答,谷歌地图等也能直接在 Bard 中调用。
值得注意的是,谷歌已经取消了 Bard 的候补名单,全球 180 多个国家和地区的用户可以直接使用 Bard 了,未来将逐步支持 40 种语言的互動。
而在 PaLM 2 的支持下,Google Workspace 也带来了新功能。除了在 Docs 和 Gmail 中的 "Help me write" 功能外,Google Workspace 的 Duet AI 还提供了一些工具,可以在 Slides 和 Meet 中从文本描述中生成影像,在 Sheet 中创建自定义计划等,类似于微软Copolit,办公的事情都交给 AI 来完成。
从谷歌演示的诸多应用在 PaLM 2 上的运行来看,其更像是对微软以及 OpenAI 的一个个回击。有了 PaLM 2 的加持,加上自身在搜索业务上的优势,自然少不了新的革新,Search Lab 的推出,也进一步推出了传统搜索方式的变革。谷歌方面透露,多年前之所以开始深入投资 AI,就是因为看到了让 Search 变得更好的机会。
在全新的搜索模式下,AI 将会给用户提供更为直接的答案,包括文字、图片和视频等。并且,通过进一步的细分交流,能够帮助用户得到更为准确的结果。不过,生成式 AI 用于搜索仍处于早期阶段,目前这一功能还没有全部开放。
Android 和 Pixel 设备成了配角
作为往年开发者大会的主要看点,今年由于 AI 太过抢眼,Android 和新 Pixel 设备成了配角。对于 Android14,谷歌方面没有太多的介绍,更多的是分享了 AI 技术对 Android 的赋能,以及 AI 的进步如何让手机更加个性化。
在 Android 14 上,新推出了 Magic Compose ( 魔法撰写 ) 和 Cinematic Wallpapers(电影桌面)和 Generative AI Wallpapers (生成式 AI 桌面)等功能。其中,通过 Magic Compose 功能,AI 可以根据消息内容生成回复文本,并且可以生成为你喜欢的风格。
而在硬體方面,谷歌对外发布了旗下首款折叠屏手机 Pixel Fold,搭载自研 Tensor G2 芯片,采用横向内折的方式,内屏为 7.6 英寸 2208*1840 分辨率螢幕,外屏为 5.8 英寸 2092*1080 螢幕,机身重量为 283g。影像能力上,Pixel Fold 后置 4800 万像素主摄广角 +1080 万像素超广角 +1080 万像素潜望式长焦镜头,起售价 1799 美元。
Pixel Fold
从现场参会人员发布的体验来看,无论是在折痕还是在黑边等方面的表现上,Pixel Fold 都很一般,如果放在国内市场,这个价格对比 OPPO 和 vivo 更是没有性价比可言。不过,谷歌也是另辟蹊径,买手机送手表,现在预定购买可获赠一支去年发售的 Pixel Watch 手表。
Pixel Tablet
除了首款折叠屏产品外,谷歌还发布了 Pixel 7a 和 Pixel Tablet 平板电腦,均搭载 Tensor G2 自研芯片。Pixel 7a 作为入门级产品,起售价为 499 美元,而 Pixel Tablet 作为谷歌重返平板电腦市场的第一款产品,起售价同样为 499 美元。
今年的 I/O 大会,可谓是诚意满满,谷歌也再一次向外界表明了全面拥抱 AI 的决心。全新大模型的发布,让谷歌跟上了队伍。生成式 AI 与搜索的结合,也将颠覆传统的搜索理念与模式。而大规模场景的应用,虽然像是友商产品的再发布,很难引起观看者兴奋,但终归是得到了资本市场的认可,只是后续的体验还需要市场的检验。
(本文首发钛媒体 App,作者 / 杜志强,编辑 / 钟毅)
更多精彩内容,关注钛媒体微信号(ID:taimeiti),或者下载钛媒体 App