今天小編分享的互聯網經驗:直擊谷歌IO重磅發布:全新Bard緊逼ChatGPT,AI全家桶火線更新,歡迎閱讀。
時隔三年,品玩 / 矽星人終于又回到了谷歌 IO 大會的現場。
在跟谷歌矽谷總部一街之隔的 Shoreline Amphitheatre 露天劇場上,開發者和媒體參會者們早早地聚集于此。相較于過去這兩年人文氣息偏重、重磅產品較少的 IO 大會,已經拉響了紅色警報的谷歌今年顯然卯足了勁,無論還是 AI 更新還是全新的硬體產品,今年谷歌 IO 都可以說是近幾年來少有的一場科技盛會。
尤其突出的是,谷歌此次重磅打出了一系列 AI 組合拳,旗下幾乎所有產品都開始跟 AI 進行全面集成、并進行跨越式更新。在當前 AI 競賽中起跑慢了一步的谷歌似乎已經不再藏着掖着,作為 AI 領網域的長期領導者,在本次 IO 上,谷歌充分向大眾展現了其巨大的 AI 能量和潛力。
在正式 Keynote 開始之前,現場首先預熱了幾首由谷歌全新音樂 AI 工具 MusicLM 和 Bard 參與創作的迷幻電子音樂。
現場播放的 AI 制作的音樂《ducks with lips》,矽星人現場拍攝
在一片歡樂的氣氛中,谷歌 CEO 皮柴登場,幾句簡單的寒暄後他直擊主題," 眾所周知,人工智能今年非常忙碌,而作為一家 AI-first 公司,我們有很多話要談。所以,讓我們開始吧。"
Gmail、Maps 等 AI 更新,創造更智能的生活體驗
活動的一開始,谷歌先上了幾個 " 開胃前菜 "。皮柴表示,谷歌的 AI 技術其實已經被大量融入到了一些跟用戶日常生活息息相關的軟體之中,比如 Gmail、Google 地圖和圖片編輯。
首先,大家期盼已久的 Gmail 自動寫郵件功能終于來了。早在 2017 年 Gmail 就推出了郵件的 Smart Compose 一鍵簡短回復功能,而今天,谷歌在此基礎上推出了一個名為 "Help Me Write" 的全新功能,能夠幫助你快速撰寫完整的郵件和回復。
在 IO 上,谷歌展示了一個向航空公司申請退款用例,你只需告訴 Gmail 你想要退款的意圖,它就會根據你的班機詳情寫一份完整的郵件,同時也可以調整不同的語氣。
谷歌 Map 則引入了一個全新的 3D 沉浸式路線視圖功能。在 AI 和計算機視覺技術的幫助下,谷歌将數十億張航拍和街景影像融合在一起創建了空間 3D 模型。也就是說,未來你用 Google Maps 進行路線導航時,你看到的不僅只是從 A 到 B 的 2D 路線,而是能夠以可視化的形式看到道路和周邊的建築情況,甚至包括當地實時天氣、交通等。
谷歌表示,這個功能将在今年很快上線,首先将在包括阿姆斯特丹、柏林、都柏林、佛羅倫薩、拉斯維加斯等 15 個城市推出。
此外,名為 Magic Editor 圖片編輯功能讓小白也能輕松改圖。跟蘋果此前的圖片功能類似,Magic Editor 可以對照片中的不同事物進行識别,并允許你用拖拉拽的方式進行編輯。比如把人往左邊右邊拉一下,讓構圖更加符合你的想象。
最強語言模型 PaLM2 亮相,Bard 能力爆炸躍升
幾個小功能熱身之後,接下來,谷歌此次真正的硬菜開始接連登場。首先,像此前大家猜測的一樣,谷歌推出了下一代超強語言模型 PaLM 2。
PaLM 是 Google 在 2022 年 4 月宣布的大語言模型,使用了 5400 億參數進行訓練,約是 GPT-3 的三倍。此次 PaLM 2 又在 PaLM 上進一步進行了提升和改進,具有多語言、推理和編碼功能。
PaLM 2 在多語言文本方面接受了更多的訓練,涵蓋了 100 多種語言,對于理解、生成和翻譯包括成語、詩歌和謎語在内的細微差别文本的能力非常顯著,還通過了 " 精通 " 級别的高級語言能力考試。
在推理方面,PaLM 2 的數據集包括科學論文和帶有數學表達式的網頁,擁有超強的邏輯、常識推理和數學能力。
同時,PaLM2 在大量公共源代碼數據集上進行了預訓練,寫代碼能力更強了。除了 Python 和 JavaScript,還包括在 Prolog、Fortran 和 Verilog 中生成專用代碼等。
值得注意的是,PaLM 2 已經被開發出了不同的版本,可以面向不同的客戶、部署在不同企業環境中。
目前,PaLM 2 有四種規格,從小到大依次為 Gecko、Otter、Bison 和 Unicorn,其中,體積最小的 Gecko 可以在手機上運行,每秒大約可處理 20 個 Token,也就是約 16 或 17 個單詞。也就是說,開發者們不用花費大量的時間和資源來創建和調整 PaLM 2,而是能夠直接拿來就用進行部署。
在谷歌内部, PaLM 2 也早已經被用在了自家的 25 項功能和產品之中,其中也包括 AI 聊天機器人 Bard、谷歌的全線辦公套件等。
在 PaLM 2 的加持下,此次 Bard 也開始真正的顯現出 "ChatGPT 殺手 " 的實力。
此前 Bard 是基于 LaMDA 開發,該模型擁有 1370 億種參數,但現在 Bard 已經全面轉用 PaLM,在答案生成的數據組和更多元化的内容方面能力飛升。同時,谷歌将 Bard 跟旗下和外部產品的集成,讓 Bard 也跳出了聊天機器人的範疇,而是真正讓其成為了一款實用性工具。
比如現在 Bard 為你提供答案時,除了文字之外,還能提供包括圖片、視頻、外部鏈接等多元化的信息。
比如你在問了 Bard 問題之後,你現在可以将這些問題答案一鍵導出到 Gmail、谷歌文檔、表格之中,Bard 還可以動幫你給圖片、文檔等做加标注。未來也将支持更多谷歌應用程式和 Bard 的集成體驗,包括 Drive、地圖等。
對于軟體工程師們來說,Bard 提供了改進後的代碼引用功能,在提供來源的同時還能解釋代碼片段。此外,現在開發者們也可以把 Bard 生成的代碼進行導出,不僅能發送到谷歌的 Colab 平台,還能和另一個基于浏覽器的 IDE Replit 一起使用(目前支持首先 Python)。
目前 Bard 能支持 20 多種編程語言,基本涵蓋了工程師們所有編程開發需要,并為開發者們提供了新的深色界面。開發者們只需輸入 prompt 就能得到完整的代碼片段。
此外,跟 ChatGPT 類似,Bard 現在也可以跟其他外部工具進行集成使用。在 IO 上谷歌也展示了一個 Bard 跟 Adobe Firefly 合作生成圖片的例子,比如你想給孩子辦一個生日派對需要做一個請柬照片,所要做的就是給 Bard 說 " 制作一張在兒童派對上獨角獸和蛋糕的影像 ",接着在 Adobe 的支持下它會在幾秒鍾内生成四張影像。這不就是 Midjourney 復雜操作方法的替代嗎?
除了 Adobe 之外,Bard 目前還在推進跟更多外部工具的集成使用,包括 Kayak、OpenTable、ZipRecruiter、Instacart、Wolfram、Khan Academy 等。
尤其重要的是,現在人人都可以用上 Bard 了。谷歌此次取消了等候隊列,Bard 将面向 180 多個國家和地區的用戶全面開放。此外在英語之外,還增添了日語和韓語兩種語言,未來将逐步支持 40 種語言的互動。
回擊微軟 Copilot,谷歌工作套件迎來 "Duet AI"
今年 3 月,微軟宣布推出 Copilot 之後,在生產力工具領網域掀起了一場革命。谷歌當時馬不停蹄地也為其 Workspace 應用程式套件宣布了一系列人工智能功能,争取在跟微軟的競争中不掉隊。當時,這些人工智能功能還比較零散,并沒有一個類似于 Copilot 這樣系統性的工具。
但在今天的 IO 上,谷歌終于給出了它的對标方案—— Duet AI。
跟微軟 Copolit 類似,Duet AI 将被全面集成至谷歌旗下的 Work Space,包括谷歌文檔、表格、幻燈片、會議、GmailMeet 的自動會議摘要等等。同時還推出了一項名為 Sidekick 的新功能,能夠跨不同的谷歌應用程式進行閱讀、總結和回答文檔中的問題。
比如在文檔之中,直接輸入文章主題就能完整的生成一篇文章。
在谷歌表格中,僅需輸入一句話 " 遛狗業務客戶和寵物統計 " 就能自動生成完整的表格,包含狗、地址、電子郵件、日期、時間、持續時間和費用等,還可以通過自然語言命令來對表格進行編輯。
在演示文稿中根據你的在側邊欄輸入的要求自動生成 PPT 和插圖,并且按時間要求幫演示者總結每一頁的演講稿的講話内容等等。
雖然這些功能我們在微軟此前辦公套件中都多多少少看到過,但對于谷歌來說,此次 Duet AI 的推出,讓我們看到了谷歌在面對 Copilot 等競争對手時的應對能力。
而除了應用于辦公套件中之外, Duet AI 也将被應用于谷歌雲業務之中。借助 Duet AI,谷歌雲推出了一系列開發者工具,包括可以提供實時代碼幫助,指出錯誤的同時推薦生成的代碼塊,以及回答代碼和谷歌雲相關的問題等。該功能支持 Go、Java、Javascript、Python 和 SQL 等多種語言。谷歌表示,目前在谷歌雲上進行 AI 的訓練速度提高了 80%,成本降低了 50%。
但目前,谷歌辦公領網域的 Duet AI 功能還沒有對公眾進行開放,如果想試用這些新工具,需要先注冊 " 工作場景實驗室(Workspace Labs)" 并加入等候名單。
生成式 AI 上線谷歌搜索,數十億用戶即将開啟搜索新旅程
面對 Bing 的步步緊逼,作為谷歌的立身之本,搜索業務此次也迎來了重大的 AI 更新。
跟 Bing 類似,在用戶搜索問題之後,搜索欄的下方會首先出現由 AI 提供的更直接的答案,以及與這個問題相關的圖片、鏈接、視頻等。根據第一次提問返回的信息,你還可以進一步進行互動查詢更多的信息,知道你得到最需要的答案。
而當你打算通過谷歌搜索并購買一款產品時,AI 不僅能夠為你返回你需要的產品鏈接還能夠為你想購買的產品提供摘要,包括提醒你購買時需要注意的事項、產品的特點、最新的評論等等。
這種新的基于搜索的 AI 購物體驗建立在谷歌的 Shopping Graph 之上的,該 Shopping Graph 擁有超過 350 億個產品列表,是目前世界上最全面的、且動态更新的產品、賣家、品牌、評論和庫存數據集。但谷歌同時也強調,廣告與自然搜索結果将被區分開來,不會影響用戶的使用體驗。
雖然 AI 功能登陸谷歌搜索令人振奮,但在全球數十億用戶面前,谷歌的推進步伐仍然相對謹慎。跟 Duet AI 的工作場景實驗室(Workspace Labs)" 類似,為了測試全新的搜索功能,谷歌也設立了一個新的 " 搜索實驗室(Search Labs)",用戶如果想要訪問這新的搜索功能,必須選擇一個名為 Search Generative Experience(簡稱 SGE)的功能。
此外,谷歌也強調并非所有搜索都會引發 AI 答案,只有當 Google 的算法認為它比标準結果更有用時 AI 才會出現,而有關健康、财務等敏感主題的信息則不會出現。
一些全新的硬體亮相,首款可折疊的 Pixel 手機問世
除了一系列 AI 更新之外,一些谷歌硬體粉也非常關注谷歌今年的產品更新,此次谷歌也誠意滿滿,拿出了首款折疊手機、新的平板電腦和更親民的 Pixel 手機
Google 的首款折疊屏產品亮相,售價 1799 美元起
而今年的硬體產品中,關注度最高的當屬 Google 的首款折疊屏產品 Pixel Fold。該手機的造型非常類似 OPPO 發布的 Find N 系列,也采用 " 翻開即橫屏 " 的操作理念,讓用戶在使用折疊屏内屏時無需在旋轉 90 度才可以達到全屏顯示的效果。
該機器的内屏使用了一塊 7.6 英寸 120Hz OLED 柔性顯示屏,螢幕比例為 5:6,分辨率為 2208*1840,官方宣稱峰值亮度可達到 1450nit。而外屏則為 5.8 英寸 120Hz OLED 外屏,螢幕比例為 9:17.4,分辨率 2092*1080,峰值亮度可達到 1550nit。
Pixel Fold,矽星人現場拍攝
性能方面,Google Pixel Fold 搭載了與 Pixel 7 系列相同的自研 Tensor G2 處理器 + Titan M2 協處理器,配合 12GB LPDDR5 内存 + 256/512GB UFS 3.1 存儲組成 Google 的 " 性能鐵三角 "。Pixel Fold 擁有 4821 毫安時電池,支持 30W 有線快充,但不出意外的話 Pixel Fold 應該算是今年售價超 1 萬元的旗艦產品中充電速度最慢的產品了。
在發布會之前,Google 宣稱 Pixel Fold 會擁有 "Pixel 級别的影像系統 ",與爆料不同的是,Google Pixel Fold 的後置鏡頭模組選擇了 48MP 廣角(支持 OIS)+10.8MP 超廣角 +10.8MP 5 倍長焦的三攝組合。
Pixel Fold,矽星人現場拍攝
該機擁有黑白兩個配色,12GB+256GB 的版本售價 1799 美元(約 12450 元人民币),12GB+512GB 版本售價 1919 美元(約 13280 元人民币),現在預定購買可免費獲贈一支 Google 在去年發售的 Pixel Watch 手表。
平板電腦終于回歸,但不跟 iPad 搶市場
除去 Pixel Fold 之外,Google 還在這屆 I/O 上正式發布了另一款大屏產品:Google Pixel Tablet。這也是 Google 沉寂多年後重返平板電腦市場的第一款產品,它的定位與目前市面上的平板電腦不同,更像是一個家庭智能終端設備。
Pixel Tablet 圖源:Google
Pixel Tablet 并不是一款剛公布的產品,它的首次亮相是在一年之前。Google 認為平板電腦更多的使用場景是在家中而非室外,它是智能家居中樞,也是用于流媒體播放及視頻通話的多媒體終端。為此,Google 為 Pixel Tablet 配備了一個磁力吸附的充電底座,讓它可以長時間處于有電的狀态。
Pixel Tablet 依舊使用 Google 自研 Tensor G2 處理器,搭配 8GB 運行内存,128GB/256GB 存儲,售價 499 美元起(約 3450 元人民币),不含底座。
入門級 Pixel 7a 發布,新增紅藍 CP 雙色
廉價版的 Google Pixel a 系列一直都會在正代 Pixel 發布的次年推出,Google Pixel 7a 也不例外。該手機的外觀與 Google Pixel 7 采用了相同的設計語言,新增了更加活潑的珊瑚色和海洋藍兩個配色,更加适合有活力的年輕用戶。
矽星人現場拍攝
相比去年發布的 Pixel 6a,7a 的更新主要體現在處理器與攝像頭方面。Pixel 7a 使用了與 Pixel 7 系列相同的自研 Tensor G2 芯片,并且将鏡頭模組更新為 64MP 廣角 +13MP 超廣角的組合,成像質量将會有非常明顯的進步。
與 Google Pixel 7 系列不同的是,Pixel 7a 僅有 8GB+128GB 存儲這一個容量可選,但卻分為支持 Sub 6 5G 與 mmWave 5G(毫米波)兩個版本,其中 Sub 6 5G 版本的售價為 499 美元(約人民币 3450 元人民币),而 mmWave 5G 版本的售價稍貴,為 549 美元(約 3800 元人民币)。
總體來看,今天谷歌 IO 是一場誠意滿滿的大會,在整個開幕演講中,谷歌多次提到" 大膽而負責任(bold and responsible)" 這個詞,試圖證明谷歌可以在對社會和業務負責任的同時仍然可以快速行動。
在此前的訪談中,皮柴曾表示谷歌并不擔心推出語言模型的步伐較對手慢,把事情做對比搶快更加重要。而現在,谷歌似乎已經做好了一切準備。