今天小編分享的互聯網經驗:暴走1萬步,36氪帶你看AI春晚,歡迎閲讀。
作者 |楊逍 林炜鑫
制圖 |虞景霖
編輯 |蘇建勳
大模型的風吹了半年,2023 年的世界人工智能大會(WAIC)成了不可缺席的盛典。
7 月 6 日,WAIC 在上海世博展館正式開幕。本次 WAIC 參展企業超 400 家,首發產品達 30 餘款,大會聚集了國内外領軍學者、知名企業家、國際組織代表等 1400 餘位嘉賓,國内外院士 80 餘位。
可以説國際上有頭有臉的人工智能專家、創業者都集齊了,特斯拉 CEO 埃隆 · 馬斯克(Elon Musk),華為輪值董事長胡厚崑,微軟全球資深副總裁、微軟大中華區董事長兼 CEO 侯陽,地平線創始人、CEO 餘凱,圖靈獎得主楊立昆(Yann LeCun),微軟原執行副總裁、美國國家工程院外籍院士沈向洋與 IEEE CEO 拉曼 ......
和熱鬧的學術、產業盛典相比,展館中的展品也并不遜色。大模型、機器人、自動駕駛等企業都争相大秀肌肉。這裏大概是,離未來最近的地方。
從大模型火熱以來,AI 繪畫、AI 寫文、AI 作詩等早已不是新鮮事。
展會上,騰訊帶來了 AI 遊長城的體驗,站在展廳中間,就如同真實地站在長城牆上,能一覽城牆外的高樹和牆上的一磚一瓦;
商湯則帶來了針對籃球運動的智慧籃球場,不用攝影師,就可以記錄下投中三分的精彩瞬間;
還有人體支架一般的康復機器人、做切割手術的微創機器人、能翻跟頭的巡檢機器人,都着實吸引眼球。
頂着上海 30 度的濕熱,36 氪深度參觀了本屆 WAIC,為大家帶來了第一手的 AI 報道,以及那些即将在 AI 助力下,進入大眾生活的智能體驗。
一、玩轉 AI 應用
AI 除了能寫詩、畫畫,還可以成為你的球場專屬拍攝員,24 小時口語教練,讓你雲遊長城,漫步中國。
商湯的智慧籃球場和秒畫
實時記錄投中三分球的高光時刻不再是夢想。
每一個打球的人或許都希望自己是聚光燈下的焦點。現在,商湯科技的 SenseShot 智慧籃球場能幫你實現心願。
在 AI 能力的加持下,這塊球場實現了無人化賽事直播。當你站上球場,直播攝像頭自動跟蹤籃球和球員進行運鏡,實現 " 推 / 拉 / 搖 / 移 " 的直播效果。直播畫面還能實時顯示比賽得分。
打完球,你可以在商湯科技的 SenseShot(智勝時刻)小程式看到自己和球隊的精彩鏡頭視頻集錦、AI 運動分析等。
團隊利用了 2D 關鍵點提取和 3D 視頻動作捕捉技術等進行了球場 3D 建模,市民在錄入人臉信息後,系統會自動捕捉人臉人體的 29 個關鍵點和籃球,進行單人 / 多人的邏輯計算和分析。有了每個人在空間中的三維坐标,就能夠實現鏡頭的自動跟随、個人視頻集錦以及分析人在不同運動狀态下的動作特點。
商湯 SenseShot~ 智慧籃球場
據商湯工作人員介紹,實現這樣一種運動類型的數據訓練和軌迹捕捉,大概只需要一周的時間。
除了智能籃球場,商湯也展現了其畫面生成功能的 SenseMirage 秒畫功能。
商湯 SenseMirage 秒畫
不懂代碼沒關系,只要輸入簡單的 prompt(文字描述),商湯秒畫平台就能生成你想要的影像,而且支持二次元、三次元等多種風格。這背後是基于商湯 " 日日新 " 大模型的支持。比如,把 20 張港風照片拖到秒畫平台,大概只需要幾分鍾,就能獲得一個能夠生成港風照片的大模型。
騰訊 AI 遊長城
在騰訊展台上,騰訊遊戲将整座長城搬到了手機上,用户只需要踏上長城開啓鍵,就可以通過裸眼 3D 全息投影展陳的方式,雲遊長城。
而這背後想展示的,是騰訊的雲遊長城。為了提升使用體驗,開發團隊運用自研 AI 技術,加強畫質。我們不僅能看到長城上的磚塊紋路,還能看到一只蝴蝶從長城石階上的樹枝飛過。
騰訊 ~AI 遊長城
借助數據自動生成和植被模型處理等 AI 能力,它真實再現了長城的峽谷、山峰、懸崖、岸邊等不同地形,有不同高低落差、不同種類的植被錯落,實現了毫米級别的長城主體,以及清晨、中午、傍晚、深夜不同時間的光影互動,和動态的植被、鳥蟲雲霧等特效。
網易有道口語教練
找英語口語教練不再是難題。
虛拟人口語教練是網易有道首個教育領網域自研大模型 " 子曰 " 的應用成果,希望成為普通人英語口語練習神器。
口語教練不僅有類真人形象,發音地道,還能進行開放式對話,适配不同英語水平的用户。
網易有道 ~ 口語教練
在對話過程中,口語教練像老師一樣,有步驟地引導、啓發式學習陪伴,同時還能進行實時反饋。在生成對話報告中,AI 老師會從發音、語法等維度給予建議和潤色,盡最大可能幫助英語口語學習者。
這款產品,目前仍處于測驗階段,即将上線,在網易有道等產品中就可以免費使用。
出門問問 奇妙元 3D 數字人
短視頻達人都在用的數字人創作平台,要屬奇妙元了。
該平台由出門問問的創新團隊打造,擁有數十位高逼真寫實數字人和 3D 數字人,還有百餘種精品發音人可供選擇。平台提供一站式服務,僅需 5 分鍾、簡單 4 步,就能批量生成你想要的視頻内容。
在展會上,身穿出門問問軌迹定位設備的小姐姐在前方舞蹈,後方視頻正實時生成 3D 動漫人物。
出門問問 ~ 奇妙元 3D 數字人
會玩的朋友,也可以在奇妙元制作自己的數字分身,只需前期采集 5 分鍾有效的人物視頻,就能構建一個媲美真人的 AI 數字分身。
蜜度文稿通:一位詩人
蜜度展區站着一位 "AI 詩人 ",只要把你想要的主題風格告訴它,比如 " 故鄉 "" 青春 "" 塞外大漠 " 等提示詞,它就能現場作詩,交給你一篇符合主題的現代詩。
蜜度文稿通
"AI 詩人 " 即蜜度推出的 AI 輔助創作工具——文稿通,除了寫詩,文稿通還覆蓋了媒體稿件、政務公文、企業辦公等不同應用場景。在功能上,文稿通擁有 AI 寫作、續寫、配圖和校對 4 大模塊,用户可以一站式完成文稿寫作。
二、機器人已來
機器人無疑是本場展會的亮點之一。
醫療機器人、巡檢機器人等產品,在人工智能技術幫助下,已掌握了靈活的避障能力、行走能力、工作能力,可以作為生產力工具進入工業、醫療現場,幫助降低人的工作壓力。
人形機器人,則由于其硬體難度高、軟體智能程度、情緒感知能力要求高,被稱作機器人界難以攀越的珠峰。很長一段時間,只有技術一流、商業化場景不明的波士頓動力在撐起這個賽道。在大模型技術爆發後,其流暢的對話能力,讓學界和產業界又燃起了對人形機器人的期望。
特斯拉 Optimus
本場的最大亮點,本應該是特斯拉的 Optimus,就在開幕式上,馬斯克還通過連麥的方式為其 Optimus 打廣告,表示特斯拉希望通過 Optimus 來取代人類勞動中重復、無聊且危險的部分。未來,這款產品會将先應用于工廠。
然而,在展台上,特斯拉沒有帶來真 " 人 "Optimus,只展示了其模型。
據特斯拉展台工作人員介紹:"Optimus 搭載了 D1 芯片,能實現的只有動作互動,對話和情感互動還在研發,未來還會想開拓 C 端的場景,比如陪護,遛狗。目前的價格和 model Y 差不多,暫時不量產。"
特斯拉 Optimus
傅立葉人形機器人和外骨骼機器人
傅立葉在開幕式上推出了他們的人形機器人 GR-1。有 1.65 米高,體重 110 斤,标準健康體重。
為了實現這樣的能力,GR-1 全身自由度有 40 個關節,最大關節模組峰值扭矩可達 300NM,步行速度可達到 5KM/h,能負重 50 公斤。
傅立葉人形機器人
它有着不錯的運動能力,整個身體高度仿生,運動控制也呈現拟人化姿态,可以進行快速行走、敏捷避障、穩健上下坡、抗衝擊幹擾等動作。未來,GR-1 可以用在搶險救災、養老陪護、家政服務等應用場景。
傅立葉也帶了外骨骼機器人出場,主打康復功效。
傅立葉外骨骼機器人
這款產品主要用來幫助病人復健,在身體行動不便時,身體肌肉不會出現萎縮等情況,幫助肢體障礙的人士重新恢復運動功能。
達闼人形機器人
讓機器人跳舞有多難?達闼推出的服務機器人 Cloud Ginger 1.0(小姜)表示,so easy。當你告訴小姜," 跳個舞吧 ",小姜就會跟随音樂開始起舞。你還别説,小姜的身板毫不僵硬,手臂靈活,卡點精準,最關鍵的是,小姜給人舒展、松弛之感,打破了我們對機器人的刻板印象。
工作人員介紹,小姜身高 158cm,搭載 34 個智能柔性關節 SCA,還内置多個 2D/3D 攝像頭、激光雷達、超聲傳感器等。小姜的大腦搭載了自研的 HARIX OS 作業系統,賦予小姜 AI 能力。
達闼機器人
實際上,小姜不僅會跳舞,還能衝咖啡。得益于高精度的傳感器和控制系統,小姜制作的咖啡能精确到每一滴。
不過,目前,達闼推出的機器人足部仍然是單柱形态,非雙足的人形姿态。它的使用場景,主要應用于商場、銀行、展會、養老院等迎賓場景。
優艾智合高原科考機器人 ARIS-8848
機器人 ARIS-8848 很酷,它曾攀登珠峰。
去年五月,為了保障氣象科考隊在珠峰的氣象考察工作,優艾智合基于巡檢機器人的技術框架和商用案例積累,花費一年進行產品設計與打磨,推出了高原科考機器人 ARIS-8848。
優艾智合 - 攀登珠峰
針對青藏高原的高海拔、超低温和復雜地形,ARIS-8848 擁有履帶式的移動底盤,可以在沙石、冰川等復雜路面運行,同時機身集成包括 3D 攝像頭、激光雷達、紅外攝像儀在内的多種傳感器,能夠識别復雜地形和障礙物。
除了攀登珠峰,ARIS-8848 更強的是能在低温環境下運行,信号傳輸穩定,輔助科考工作順利進行。
睿爾曼雙臂復合升降機器人
睿爾曼其實是一家機械臂公司。
睿爾曼的雙臂復合升降機器人,則被定位為家庭服務管家,當你需要一杯水,機器人會幫你從廚房取出來端給你,當你需要整理雜物,機器人可以按你的指示,自動收納物品。甚至,晚上你躺在床上,懶得起床去關燈,喊一聲機器人就行了。
為了讓機械臂更貼近普通用户的家庭場景,睿爾曼對核心零部件采用了全鏈路、強耦合的設計方式,達到了本體自重 6Kg(含控制器 7.2Kg),額定負載 5Kg,負載自重比達到 1:1.2,最大負載 9Kg 的極致性能。
同時,睿爾曼把大模型產品接入機器人作業系統,提升了語音互動體驗。
睿爾曼雙臂復合升降機器人
雲深處科技絕影 Lite3 和 X20
巡檢,是機器狗的常用場景。
展廳上,雲深處帶來了絕影 Lite3 和絕影 X20 兩款產品。
絕影 Lite3 主要用于教育科研場景,可幫助呈現編程效果。絕影 X20 則是一款電力巡檢和特種應用機器人。 Lite3 展現了翻跟頭的絕技,絕影 X20 也展現了上樓梯的效果。
絕影 X20 最快速度 4.95m/s,能負重 20 公斤,可以上 20 公分的樓梯,跳過寬 1 米的溝壑,且在廢墟裏也能行走。
雲深處科技 ~ 絕影四足機器人
絕影 X20 擁有 IP66 的防護等級,工作台可以搭載雙光雲台、機械臂、調試架、4G/5G 模塊、北鬥 /GPS/RTK 模塊等,環境感知方面可實現自動的目标檢測與識别,搭配深度相機、激光雷達和智能算法,可實現精準導航、動态避障和人機互動等功能。
當下,絕影 X20 與電力巡檢和特種應用這兩大場景結合緊密。絕影 X20 能完成從自主規劃路徑,到采集巡檢數據、生成巡檢報告,再到自主充電、循環作業的全流程巡檢。在消防偵查場景,絕影 X20 能靈活開展無人偵查和搜救工作。
微創機器人
機器人也可以做手術了,還能遠程操作。
" 圖邁 " 胸腔手術機器人,是外科醫生的好幫手。這款機器人由上海微創醫療機器人公司自主研發,是目前唯一一款由中國企業研發并獲批上市的四臂腔鏡手術機器人。
" 圖邁 " 已經在全國 20 多個省份的 40 多家醫院,完成了超過 1000 多例的臨床驗證,手術全面覆蓋了胸腔、腹腔、盆腔的一系列高難度微創傷。在手術過程中," 圖邁 " 可以幫助醫生做到精準識别、精準切除、精準解剖。
微創機器人
" 圖邁 " 在 5G 超遠程手術方面也得到臨床研證。據介紹,2022 年 6 月 11 日," 圖邁 " 連接橫跨近 5000 公裏的新疆克州和江蘇南京,順利完成兩例泌尿外科超遠程手術,實現迄今為止世界最遠距離的 5G 遠程機器人手術。
展台工作人員介紹,與進口手術機器人相比,同等性能下,圖邁的成本價格 " 有非常大的優勢 "。
三、這些硬體可能改變未來
科技總是先成為創新產品,再逐步邁入生活。
大會上也展出了一些好玩的,能改變大家日常生活的新科技產品。送外賣的無人機,還有新的掌中付款碼,還有自動控制的轎車充電器。
随着商業化的進展和推廣,他們可能會從科技展廳飛入大家的生活。
美團第四代無人機
為了送外賣,美團把無人機都用上了,将自動駕駛用到了極致。
美團展出了最新的第四代無人機,采用六軸飛行器,最大載重 2.5 公斤,滿載最大配送距離 10 公裏,3 公裏半徑内的外賣配送時間一般不超過 15 分鍾。
美團第四代無人機
和上一代相比,新機型除了性能更佳,對環境的适應性也更強,即便在 " 零下 20 度至 50 度 " 的雨雪大風天氣,也能安全運行。
目前,美團無人機僅在深圳、上海等城市落地 15 條航線,更多還是配合外賣員完成日常配送。
微信刷掌支付
在機器視覺能力的加持下,付款方式正一步步被改變。從最早的相機掃描二維碼,再到人臉識别。如今,微信又推出了刷掌支付功能,識别更為細致的手掌紋路。
微信刷掌支付
有了微信刷掌支付,只需要錄入手掌紋樣,在消費時,伸手就可以完成支付。相比刷臉支付,刷掌支付無論在安全,還是精準度上,都要更高一些。
據報道,北京的部分地鐵線已經上線刷掌乘車服務,乘客伸手即可進出站。