今天小编分享的互联网经验:暴走1万步,36氪带你看AI春晚,欢迎阅读。
作者 |杨逍 林炜鑫
制图 |虞景霖
编辑 |苏建勋
大模型的风吹了半年,2023 年的世界人工智能大会(WAIC)成了不可缺席的盛典。
7 月 6 日,WAIC 在上海世博展馆正式开幕。本次 WAIC 参展企业超 400 家,首发产品达 30 余款,大会聚集了国内外领军学者、知名企业家、国际组织代表等 1400 余位嘉宾,国内外院士 80 余位。
可以说国际上有头有脸的人工智能专家、创业者都集齐了,特斯拉 CEO 埃隆 · 马斯克(Elon Musk),华为轮值董事长胡厚崑,微软全球资深副总裁、微软大中华区董事长兼 CEO 侯阳,地平线创始人、CEO 余凯,图灵奖得主杨立昆(Yann LeCun),微软原执行副总裁、美国国家工程院外籍院士沈向洋与 IEEE CEO 拉曼 ......
和热闹的学术、产业盛典相比,展馆中的展品也并不逊色。大模型、机器人、自动驾驶等企业都争相大秀肌肉。这里大概是,离未来最近的地方。
从大模型火热以来,AI 绘画、AI 写文、AI 作诗等早已不是新鲜事。
展会上,腾讯带来了 AI 游长城的体验,站在展厅中间,就如同真实地站在长城墙上,能一览城墙外的高树和墙上的一砖一瓦;
商汤则带来了针对篮球运动的智慧篮球场,不用摄影师,就可以记录下投中三分的精彩瞬间;
还有人体支架一般的康复机器人、做切割手术的微创机器人、能翻跟头的巡检机器人,都着实吸引眼球。
顶着上海 30 度的湿热,36 氪深度参观了本届 WAIC,为大家带来了第一手的 AI 报道,以及那些即将在 AI 助力下,进入大众生活的智能体验。
一、玩转 AI 应用
AI 除了能写诗、画画,还可以成为你的球场专属拍摄员,24 小时口语教练,让你云游长城,漫步中国。
商汤的智慧篮球场和秒画
实时记录投中三分球的高光时刻不再是梦想。
每一个打球的人或许都希望自己是聚光灯下的焦点。现在,商汤科技的 SenseShot 智慧篮球场能帮你实现心愿。
在 AI 能力的加持下,这块球场实现了无人化赛事直播。当你站上球场,直播摄像头自动跟踪篮球和球员进行运镜,实现 " 推 / 拉 / 摇 / 移 " 的直播效果。直播画面还能实时显示比赛得分。
打完球,你可以在商汤科技的 SenseShot(智胜时刻)小程式看到自己和球队的精彩镜头视频集锦、AI 运动分析等。
团队利用了 2D 关键点提取和 3D 视频动作捕捉技术等进行了球场 3D 建模,市民在录入人脸信息后,系统会自动捕捉人脸人体的 29 个关键点和篮球,进行单人 / 多人的逻辑计算和分析。有了每个人在空间中的三维坐标,就能够实现镜头的自动跟随、个人视频集锦以及分析人在不同运动状态下的动作特点。
商汤 SenseShot~ 智慧篮球场
据商汤工作人员介绍,实现这样一种运动类型的数据训练和轨迹捕捉,大概只需要一周的时间。
除了智能篮球场,商汤也展现了其画面生成功能的 SenseMirage 秒画功能。
商汤 SenseMirage 秒画
不懂代码没关系,只要输入简单的 prompt(文字描述),商汤秒画平台就能生成你想要的影像,而且支持二次元、三次元等多种风格。这背后是基于商汤 " 日日新 " 大模型的支持。比如,把 20 张港风照片拖到秒画平台,大概只需要几分钟,就能获得一个能够生成港风照片的大模型。
腾讯 AI 游长城
在腾讯展台上,腾讯游戏将整座长城搬到了手机上,用户只需要踏上长城开启键,就可以通过裸眼 3D 全息投影展陈的方式,云游长城。
而这背后想展示的,是腾讯的云游长城。为了提升使用体验,开发团队运用自研 AI 技术,加强画质。我们不仅能看到长城上的砖块纹路,还能看到一只蝴蝶从长城石阶上的树枝飞过。
腾讯 ~AI 游长城
借助数据自动生成和植被模型处理等 AI 能力,它真实再现了长城的峡谷、山峰、悬崖、岸边等不同地形,有不同高低落差、不同种类的植被错落,实现了毫米级别的长城主体,以及清晨、中午、傍晚、深夜不同时间的光影互動,和动态的植被、鸟虫云雾等特效。
网易有道口语教练
找英语口语教练不再是难题。
虚拟人口语教练是网易有道首个教育领網域自研大模型 " 子曰 " 的应用成果,希望成为普通人英语口语练习神器。
口语教练不仅有类真人形象,发音地道,还能进行开放式对话,适配不同英语水平的用户。
网易有道 ~ 口语教练
在对话过程中,口语教练像老师一样,有步骤地引导、启发式学习陪伴,同时还能进行实时反馈。在生成对话报告中,AI 老师会从发音、语法等维度给予建议和润色,尽最大可能帮助英语口语学习者。
这款产品,目前仍处于测验阶段,即将上线,在网易有道等产品中就可以免费使用。
出门问问 奇妙元 3D 数字人
短视频达人都在用的数字人创作平台,要属奇妙元了。
该平台由出门问问的创新团队打造,拥有数十位高逼真写实数字人和 3D 数字人,还有百余种精品发音人可供选择。平台提供一站式服务,仅需 5 分钟、简单 4 步,就能批量生成你想要的视频内容。
在展会上,身穿出门问问轨迹定位设备的小姐姐在前方舞蹈,后方视频正实时生成 3D 动漫人物。
出门问问 ~ 奇妙元 3D 数字人
会玩的朋友,也可以在奇妙元制作自己的数字分身,只需前期采集 5 分钟有效的人物视频,就能构建一个媲美真人的 AI 数字分身。
蜜度文稿通:一位诗人
蜜度展区站着一位 "AI 诗人 ",只要把你想要的主题风格告诉它,比如 " 故乡 "" 青春 "" 塞外大漠 " 等提示词,它就能现场作诗,交给你一篇符合主题的现代诗。
蜜度文稿通
"AI 诗人 " 即蜜度推出的 AI 辅助创作工具——文稿通,除了写诗,文稿通还覆盖了媒体稿件、政务公文、企业办公等不同应用场景。在功能上,文稿通拥有 AI 写作、续写、配图和校对 4 大模块,用户可以一站式完成文稿写作。
二、机器人已来
机器人无疑是本场展会的亮点之一。
医疗机器人、巡检机器人等产品,在人工智能技术帮助下,已掌握了灵活的避障能力、行走能力、工作能力,可以作为生产力工具进入工业、医疗现场,帮助降低人的工作压力。
人形机器人,则由于其硬體难度高、軟體智能程度、情绪感知能力要求高,被称作机器人界难以攀越的珠峰。很长一段时间,只有技术一流、商业化场景不明的波士顿动力在撑起这个赛道。在大模型技术爆发后,其流畅的对话能力,让学界和产业界又燃起了对人形机器人的期望。
特斯拉 Optimus
本场的最大亮点,本应该是特斯拉的 Optimus,就在开幕式上,马斯克还通过连麦的方式为其 Optimus 打广告,表示特斯拉希望通过 Optimus 来取代人类劳动中重复、无聊且危险的部分。未来,这款产品会将先应用于工厂。
然而,在展台上,特斯拉没有带来真 " 人 "Optimus,只展示了其模型。
据特斯拉展台工作人员介绍:"Optimus 搭载了 D1 芯片,能实现的只有动作互動,对话和情感互動还在研发,未来还会想开拓 C 端的场景,比如陪护,遛狗。目前的价格和 model Y 差不多,暂时不量产。"
特斯拉 Optimus
傅立叶人形机器人和外骨骼机器人
傅立叶在开幕式上推出了他们的人形机器人 GR-1。有 1.65 米高,体重 110 斤,标准健康体重。
为了实现这样的能力,GR-1 全身自由度有 40 个关节,最大关节模组峰值扭矩可达 300NM,步行速度可达到 5KM/h,能负重 50 公斤。
傅立叶人形机器人
它有着不错的运动能力,整个身体高度仿生,运动控制也呈现拟人化姿态,可以进行快速行走、敏捷避障、稳健上下坡、抗冲击干扰等动作。未来,GR-1 可以用在抢险救灾、养老陪护、家政服务等应用场景。
傅立叶也带了外骨骼机器人出场,主打康复功效。
傅立叶外骨骼机器人
这款产品主要用来帮助病人复健,在身体行动不便时,身体肌肉不会出现萎缩等情况,帮助肢体障碍的人士重新恢复运动功能。
达闼人形机器人
让机器人跳舞有多难?达闼推出的服务机器人 Cloud Ginger 1.0(小姜)表示,so easy。当你告诉小姜," 跳个舞吧 ",小姜就会跟随音乐开始起舞。你还别说,小姜的身板毫不僵硬,手臂灵活,卡点精准,最关键的是,小姜给人舒展、松弛之感,打破了我们对机器人的刻板印象。
工作人员介绍,小姜身高 158cm,搭载 34 个智能柔性关节 SCA,还内置多个 2D/3D 摄像头、激光雷达、超声传感器等。小姜的大腦搭载了自研的 HARIX OS 作業系統,赋予小姜 AI 能力。
达闼机器人
实际上,小姜不仅会跳舞,还能冲咖啡。得益于高精度的传感器和控制系统,小姜制作的咖啡能精确到每一滴。
不过,目前,达闼推出的机器人足部仍然是单柱形态,非双足的人形姿态。它的使用场景,主要应用于商场、银行、展会、养老院等迎宾场景。
优艾智合高原科考机器人 ARIS-8848
机器人 ARIS-8848 很酷,它曾攀登珠峰。
去年五月,为了保障气象科考队在珠峰的气象考察工作,优艾智合基于巡检机器人的技术框架和商用案例积累,花费一年进行产品设计与打磨,推出了高原科考机器人 ARIS-8848。
优艾智合 - 攀登珠峰
针对青藏高原的高海拔、超低温和复杂地形,ARIS-8848 拥有履带式的移动底盘,可以在沙石、冰川等复杂路面运行,同时机身集成包括 3D 摄像头、激光雷达、红外摄像仪在内的多种传感器,能够识别复杂地形和障碍物。
除了攀登珠峰,ARIS-8848 更强的是能在低温环境下运行,信号传输稳定,辅助科考工作顺利进行。
睿尔曼双臂复合升降机器人
睿尔曼其实是一家机械臂公司。
睿尔曼的双臂复合升降机器人,则被定位为家庭服务管家,当你需要一杯水,机器人会帮你从厨房取出来端给你,当你需要整理杂物,机器人可以按你的指示,自动收纳物品。甚至,晚上你躺在床上,懒得起床去关灯,喊一声机器人就行了。
为了让机械臂更贴近普通用户的家庭场景,睿尔曼对核心零部件采用了全链路、强耦合的设计方式,达到了本体自重 6Kg(含控制器 7.2Kg),额定负载 5Kg,负载自重比达到 1:1.2,最大负载 9Kg 的极致性能。
同时,睿尔曼把大模型产品接入机器人作業系統,提升了语音互動体验。
睿尔曼双臂复合升降机器人
云深处科技绝影 Lite3 和 X20
巡检,是机器狗的常用场景。
展厅上,云深处带来了绝影 Lite3 和绝影 X20 两款产品。
绝影 Lite3 主要用于教育科研场景,可帮助呈现编程效果。绝影 X20 则是一款电力巡检和特种应用机器人。 Lite3 展现了翻跟头的绝技,绝影 X20 也展现了上楼梯的效果。
绝影 X20 最快速度 4.95m/s,能负重 20 公斤,可以上 20 公分的楼梯,跳过宽 1 米的沟壑,且在废墟里也能行走。
云深处科技 ~ 绝影四足机器人
绝影 X20 拥有 IP66 的防护等级,工作台可以搭载双光云台、机械臂、调试架、4G/5G 模块、北斗 /GPS/RTK 模块等,环境感知方面可实现自动的目标检测与识别,搭配深度相机、激光雷达和智能算法,可实现精准导航、动态避障和人机互動等功能。
当下,绝影 X20 与电力巡检和特种应用这两大场景结合紧密。绝影 X20 能完成从自主规划路径,到采集巡检数据、生成巡检报告,再到自主充电、循环作业的全流程巡检。在消防侦查场景,绝影 X20 能灵活开展无人侦查和搜救工作。
微创机器人
机器人也可以做手术了,还能远程操作。
" 图迈 " 胸腔手术机器人,是外科医生的好帮手。这款机器人由上海微创医疗机器人公司自主研发,是目前唯一一款由中国企业研发并获批上市的四臂腔镜手术机器人。
" 图迈 " 已经在全国 20 多个省份的 40 多家医院,完成了超过 1000 多例的临床验证,手术全面覆盖了胸腔、腹腔、盆腔的一系列高难度微创伤。在手术过程中," 图迈 " 可以帮助医生做到精准识别、精准切除、精准解剖。
微创机器人
" 图迈 " 在 5G 超远程手术方面也得到临床研证。据介绍,2022 年 6 月 11 日," 图迈 " 连接横跨近 5000 公里的新疆克州和江苏南京,顺利完成两例泌尿外科超远程手术,实现迄今为止世界最远距离的 5G 远程机器人手术。
展台工作人员介绍,与进口手术机器人相比,同等性能下,图迈的成本价格 " 有非常大的优势 "。
三、这些硬體可能改变未来
科技总是先成为创新产品,再逐步迈入生活。
大会上也展出了一些好玩的,能改变大家日常生活的新科技产品。送外卖的无人机,还有新的掌中付款码,还有自动控制的轿车充电器。
随着商业化的进展和推广,他们可能会从科技展厅飞入大家的生活。
美团第四代无人机
为了送外卖,美团把无人机都用上了,将自动驾驶用到了极致。
美团展出了最新的第四代无人机,采用六轴飞行器,最大载重 2.5 公斤,满载最大配送距离 10 公里,3 公里半径内的外卖配送时间一般不超过 15 分钟。
美团第四代无人机
和上一代相比,新机型除了性能更佳,对环境的适应性也更强,即便在 " 零下 20 度至 50 度 " 的雨雪大风天气,也能安全运行。
目前,美团无人机仅在深圳、上海等城市落地 15 条航线,更多还是配合外卖员完成日常配送。
微信刷掌支付
在机器视觉能力的加持下,付款方式正一步步被改变。从最早的相机扫描二维码,再到人脸识别。如今,微信又推出了刷掌支付功能,识别更为细致的手掌纹路。
微信刷掌支付
有了微信刷掌支付,只需要录入手掌纹样,在消费时,伸手就可以完成支付。相比刷脸支付,刷掌支付无论在安全,还是精准度上,都要更高一些。
据报道,北京的部分地铁线已经上线刷掌乘车服务,乘客伸手即可进出站。