今天小編分享的互聯網經驗:谷歌Bard“史上最大更新”!終于會說會讀圖,支持中文等40多種語言,歡迎閱讀。
7 月 13 日周四,谷歌發布了旗下與 ChatGPT 正面打擂台的人工智能聊天機器人 Bard 最新進展,并稱之為 "Bard 工具迄今為止最大規模的擴張 "。
谷歌 A 周四午盤後漲幅擴大至 4.4%,至一個月最高。生成式 AI 競争對手微軟也漲超 1%。
Bard打赢監管阻攔進軍歐盟市場,新增讀圖、調整答案語氣和風格等 " 硬實力 "
官方博文稱 Bard 已可以支持 40 多種語言,包括阿拉伯語、中文、德語、印地語和西班牙語。用戶可在巴西和整個歐洲進行訪問,即使用場景拓展到全球更多地區,特别是重要的歐盟市場。
同時,用戶可以獲得更多定制化、個性化的 AI 回復。
例如,Bard 可以将回答用語音讀出來了,這一功能已支持 40 多種語言。谷歌相關負責人稱," 這對想聽聽單詞的正确發音,或者聽一首詩歌或劇本被朗誦出來等格外有用 "。
用戶還可以調整 AI 回復的語氣和風格,目前抽成五個選項,即簡單、長、短、專業或休閒。該功能僅限英語使用,但将很快拓展到新的語言。
此外,Bard 還推出了四個 " 增進用戶生產力 " 的新功能,包括在網頁左側固定(pin)和重命名此前的對話記錄,方便随時重新訪問;将 Bard 撰寫的 Python 代碼導出到 Google Colab 和 Replit 等軟體開發工具中;提供可分享的鏈接,方便用戶與他人分享部分或全部與 AI 工具的聊天内容,這三種功能均已支持 40 多種語言。
更引人注目的是,Bard新增了讀圖功能,可在用戶提問框中上傳影像,要求 AI 聊天機器人解讀影像、提供更多畫面信息,以及根據影像撰寫标題。這一功能目前僅限英語使用,未來将很快拓展到更多新語言中。5 月谷歌的 I/O 年度開發者大會上,曾宣布把 Google Lens 的功能引入 Bard。
谷歌還在官方博文中給出了一段疑似 AI 撰寫的 " 雞湯文字 ",稱:" 好奇心和想象力是人類創造力背後的驅動力……想象新可能性的能力也是人類與生俱來的人類品質之一。這就是我們創建 Bard 的原因:幫助您探索好奇心,增強想象力,并最終将想法付諸實踐,而不僅僅是回答您的問題。有鑑于此,Bard 現在可以在世界大部分地區使用且能理解最廣泛使用的語言。"
有分析稱,Bard 的最新改進正值谷歌試圖在白熱化的生成式人工智能領網域保持領先地位,以在來自微軟支持的 OpenAI、Anthropic 和其他公司的快速、激烈競争中脫穎而出。
而在一個月前,谷歌還因歐盟《通用數據保護條例》(GDPR)背後的歐洲主要數據監管機構——愛爾蘭數據保護委員會的阻攔而無法如期在歐盟推出 Bard。
當時該監管機構的反對理由是,這家科技巨頭沒有就如何尊重歐盟數據隐私規則提供足夠的信息。谷歌今日在 Bard 拓展到歐盟後稱,将 " 大膽而負責任的開發人工智能 ",主動與專家、政策制定者和隐私監管機構進行接洽,未來會将 Bard 引入更多的地區和語言,并聆聽公眾反饋。
見聞使用感受:還讀不懂人類諷刺圖片,中文讀詩 AI腔太濃不夠驚豔
上述新功能聽起來天花亂墜,實際使用效果究竟如何?針對普通閱聽人最關心的 " 聽說讀寫 " 功能,華爾街見聞也對 Bard 做了如下測試,簡單來說,新功能使用起來似乎暫時算是 " 馬馬虎虎 "。
首先,華爾街見聞詢問了 Bard 如何解讀周三馬斯克宣布成立新公司 xAI 後,網友嘲笑 Meta 的小扎将挖牆腳抄襲的圖片,這顯然是諷刺 Meta 的 Threads 抄襲了馬斯克的推特。
Bard 反應了一會兒後,給出的回答很簡單:" 不好意思,我當前還不能解讀有關人物的畫面。"并在給出回答的同時删除了提問對話框中的影像本身。
接着,華爾街見聞詢問如何解讀昨日另一熱門網圖,即 xAI 掀起的飓風正在摧毀一座标有 ChatGPT 字樣的房子," 自然人智能 " 都可以理解這是一副諷刺漫畫,形容 ChatGPT 在 xAI 面前不堪一擊。
Bard 一開始只是簡單描述了畫面中有的物體:房子正在被飓風摧毀,并描述了飓風的特性,以及房子已經搖搖欲墜的畫面感。但結論卻是:" 該影像有力地提醒人們龍卷風的破壞力,它還提醒人們為惡劣天氣事件做好準備的重要性。" 可見并不是一個令人滿意的答復。
華爾街見聞緊跟着詢問為何畫面上出現了 X.AI 和 ChatGPT 的字樣,Bard 回復稱,這是因為兩者都是能產生文本的大語言模型 LLM,解釋了一下 LLM 的定義,并認為 " 該影像旨在隐喻 LLM 的破壞力就像龍卷風一樣,可以做善事也能作惡 ",還稱 " 圖片上的 X.AI 和 ChatGPT 的标志提醒我們 LLM 是強大的工具,應該負責任地使用,需要确保它們不會被用來造成傷害。"
是熟悉的 AI 聊天雞湯味兒了。
如果詢問給圖片配上标題,Bard 給出了 "LLM 的力量 "、"LLM 的危險性 " 和 "LLM 的未來 " 等驢唇不對馬嘴的内容,很顯然,人類的毒舌諷刺實力,AI 機器人還未能很好地貫徹領會。
華爾街見聞玩心漸起,又上傳了一張北極熊捂臉的圖片讓 Bard 解讀。見聞老讀者們都知道,美股熊市之際這張圖片會屢屢出現在媒體中。
如果只是簡單詢問 " 圖片講了什麼 ",Bard 給出的答復也非常中規中矩,但點明熊的動作和面部表情說明它要麼是悲傷、要麼是恐懼、要麼是專注,可能是感到孤獨或者害怕,總之是感情強烈。
如果具體詢問北極熊與股市的關系,Bard 的回復便靠譜多了,準确地答出 " 是熊市隐喻,作為空頭對股市悲觀情緒的象征 "。還稱圖片也可以被看作是對股市投資風險的提醒。
要求它給出的标題也恰如其分,例如:" 股市看跌的時候,連北極熊都捂着臉 ";" 熊市即将來臨,北極熊已經做好了準備 ";" 當股市崩盤時,就是冬眠的時候了 ",屬實非常優秀。
華爾街見聞也詢問了鴿子影像與美聯儲之間的關系。Bard 一開始顯然在 "AI 式扯淡 ",稱 " 它與美聯儲的聯系是明确的:鴿子代表美聯儲的獨立性、對和平的承諾以及對未來的希望。"
如果具體詢問鴿子與美聯儲貨币政策有何關系時,Bard 顯然在嘗試理解 " 隐喻 / 比喻 "(metaphor)這個概念,但給出的不是 " 鴿派聯儲 " 這種标準回答,而是稱 " 它與美聯儲貨币政策的聯系是顯而易見的:鴿子代表了美聯儲即使面對不确定性也保持經濟步入正軌的決心。"
好吧,Bard 讀圖能力看上去還不能令人眼前一亮,畢竟人像解讀功能還沒有上線,對畫面中諷刺和隐喻的理解也不夠到位,那麼 Bard" 用語音讀出回復 " 的新功能如何呢?
華爾街見聞輸入了李白《靜夜思》的中文文字,首先要求 Bard 根據這首詩給出相關圖片,但被告知只能給出圖片的文字描述版," 對不起,我沒有生成圖片的功能。我只能生成文本。"
随後華爾街見聞點擊答案框的右上角 " 小喇叭 " 标志要求 Bard 進行朗讀,讀出來的統統都是 AI 味兒,不論如何詢問 " 請用深情朗讀 "、" 換成男聲朗讀 " 等具體要求,Bard 都表示 " 臣妾做不到 "。
若朗讀莎士比亞的英文劇本,倒是比較純正的美式發音,可見中文的進步空間還有不少!