今天小编分享的互联网经验:直击2024WCC现场:从棋盘世界看大模型落地,欢迎阅读。
文 | AI 大模型工场,作者|参商,编辑|星奈
2016 年,AlphaGo 横空出世,以 4:1 的战绩击败世界围棋冠军李世石,震惊全球。
AlphaGo 的胜利成功地展示了 AI 在解决复杂策略问题上的潜力,成为人工智能发展史上的一个重要轉捩點。
从象棋到围棋,从深蓝到 AlphaGo,棋盘上的对弈不再是单纯的胜负较量,而是人类智慧与人工智能深度交融的舞台。
如今,AI 与棋盘的故事仍在继续。2024 年国际象棋世界冠军赛(WCC)11 月 23 日正式拉开帷幕,现任棋王丁立人接受年仅 18 岁的印度国际象棋特级大师多曼拉朱 · 古凯什挑战「王冠之战」。
值得关注的是,谷歌作为此次大赛的赞助商,在现场也带来了 AI 深度体验项目。
AI 大模型工场有幸受到谷歌邀请来到在新加坡举办的 2024 年国际象棋世界冠军赛(WCC)现场,见证这场巅峰对决。
在 WCC 现场,谷歌展示了基于棋类 AI 的最新探索,从 AlphaGo 到 AlphaZero,从 Chess Fiction 到 GenChess,AI 在跨越棋盘,落地我们生活的方方面面。
一、现场直击 WCC,用 AI 解锁国际象棋新玩法
在 WCC 上,谷歌的 AI 体验区成为焦点。 三大展台 Chating Chess、Chess Fiction 和 GenChess,让 AI 用游戏的方式帮助大家重新理解象棋。
Chating Chess:象棋知识一键解锁
顾名思义,Chating Chess,是能够通过对话快速提升观众对国际象棋的理解水平的 "AI 解说员 "。在对话框中向 Gemini 提问关于国际象棋的问题,Gemini 就会深入浅出地讲解各种复杂概念
比如,对象棋小白来说,只需输入 " 如何下象棋 " 这类关键词,Gemini 就能详细讲解国际象棋的规则,不仅如此,它还能预测你的后续问题。同时,如果你将棋局给它,它还能指导你的棋局下一步。
Chess Fiction:象棋赛事的拟人化演绎
Chess Fiction 通过 Gemini 模型,将经典赛事拟人化,让不懂国际象棋的人也能像读小说一样了解整个对战的过程,赋予每场比赛叙事的魔力。
例如,当你输入 " 将 2017 年侯逸凡对战 Borya Ider 的比赛改编成一个奇幻故事 ",Gemini 会生成以下充满想象力的内容:
在神秘的直布罗陀王国,一位名为侯逸凡的女巫以精妙的策略和冷静的判断统治棋盘。面对充满大胆与冒险精神的蒙古骑士 Borya,他们展开了一场智谋与魔法的对决。侯逸凡召唤了 " 迷人的棋子 " 和 " 无懈可击的防御网 ",而 Borya 释放的 " 凶猛骑士 " 与 " 雷霆般的攻击 " 同样让人屏息凝神……
即便是毫无棋艺基础的观众,也能通过这种叙事方式,感受到棋盘上的紧张与刺激,体会象棋场上的激烈对决。
GenChess:打造你的专属棋盘
在 AI 体验环节,最具创意的还要当属 GenChess,可以输入 prompt 生成专属的风格化国际象棋。
比如,我让 Gemini 帮我生成了一个 Butter Bear(黄油小熊)的专属棋子,一个奶黄色的可爱小熊棋子,拿捏人心。不仅如此,还可以用同一主题生成不同各具特色的棋盘进行对弈。
在展示墙上,也放满了人们的想象力,包括饺子、鸡蛋等个性化的象棋。
实际上,这些好玩的 AI 应用背后包括影像生成模型 Imagen 3 和 Gemini Flash 模型等。
就在 3 个月前,谷歌发布了影像生成模型 Imagen 3,在文本语义还原、色彩搭配、文本嵌入、影像细节、光影效果等方面相比第二代大幅度提升,同时还能支持生成人物影像。GenChess 背后 Imagen 3 功不可没。
这些技术背后都体现了 AI 在棋盘世界的新高度,而提到这一切,不得不追溯到 AI 棋类技术的开端,从 AlphaGo 到 AlphaZero,以及背后推动这场变革的关键人物。
二、AI 棋盘背后的那个男人:从 AlphaGo 到 AlphaZero
今年诺贝尔奖 AI 成为当之无愧的顶流,先是 AI 教父辛顿凭借深度学习的突破获得诺贝尔物理学奖; 第二天 Google DeepMind 联合创始人兼首席执行官 Demis Hassabis。
则因开发了 AlphaFold 解决蛋白质结构预测难题而获得诺贝尔化学奖。
实际上,谷歌在棋盘上取得的成就,Demis Hassabis 在其中扮演了重要角色。
在新加坡 WCC 现场,谷歌组织了一场 Demis Hassabis 自传电影《The Thinking Game》观影会。这个电影耗时五年拍摄,详细讲述了 Demis 及其团队如何一步一步探索 AI 的未来发展,以及为人类带来的价值。
Demis 的故事始于棋盘,13 岁时,他已是国际象棋少年冠军,并且世界排名第二。那时,他腦海中萌生了一个独特的想法:如果将所有人类智慧与计算机结合,会发生什么?
Demis 似乎一直在思考,14 岁考上牛津,他本可以在 15 岁时进入剑桥学习计算机科学,但他延迟了两年才入学。在此期间,他进入公司,设计开发出经典模拟游戏《主题公园》。
但这只是开始,他始终在思考大腦是如何工作的,为了更深入地了解大腦的工作原理,Demis 在 2005 年进入伦敦大学学院攻读认知神经科学博士学位,并开创性地发现了大腦中海马体与情景记忆间的关系。
2010 年,Demis 与苏莱曼、谢恩 · 莱格共同创办了 DeepMind,目标明确:创造能够 " 思考 " 的人工智能。2016 年,AlphaGo 的问世震撼全球,这个 AI 程式不仅在围棋上战胜了世界冠军李世石,更向世界证明了人工智能在复杂认知任务上的强大潜力。随后的 2017 年,AlphaGo 以 3:0 的比分击败围棋世界第一柯洁,再次刷新了人类对 AI 的认知。
但 Demis 没有止步于此。两年后,AlphaZero 的推出,彻底改变了游戏规则。不同于 AlphaGo 的围棋专项训练,AlphaZero 通过自我对弈,迅速掌握围棋、国际象棋和将棋的复杂规则,超越了所有人类顶级棋手的水平。
2018 年,Demis 再次将目标锁定在科学的前沿:蛋白质折叠。通过 AlphaFold,DeepMind 成功预测了蛋白质的三维结构,并且将所有成果开源。
电影中经常出现的列车旅行场景仿佛象征着人生的旅途以及关于 AGI 发展的征程。
最打动我的是 Demis 对于 AGI 阐释 " 人工智能需要具备通用性,即,可以解决任意问题而不是单一问题。这是智慧的体现。"
从 AlphaGo 到 AlphaZero 再到 AlphaFold,Demis 对于 AGI 的技术理念奠定了 Gemini 系列模型发展的基石,Google 在棋盘上验证的技术也在不断向更广泛的医疗、文化、社会领網域扩展。
三、从棋局开始,不止棋局
自 20 世纪 50 年代以来,游戏一直是人工智能的试验场。
1990 年,奇努克 ( Chinook ) 机器击败了世界上最好的跳棋选手,这是一个轉捩點。7 年之后,IBM 的 " 深蓝 " 超级计算机超越了国际象棋特级大师加里 · 卡斯帕罗夫 ( Garry Kasparov ) 。
2011 年,另一台 IBM 机器 " 沃森 " 超越了《危险边缘》游戏的所有赢家。
之后,谷歌的 AlphaGo 横空出世、 AlphaZero 全面进化,AI 在棋类领網域的胜利不仅展示了其超越人类的决策能力,更验证了深度学习的潜力。
自 2022 年 OpenAI 发布 ChatGPT 后,大模型爆火出圈,从科技巨头到初创公司,从模型到应用,AI 发展进入加速期。
谷歌也迅速响应,去年年底 Gemini1.0 诞生,当时和市面上现有大语言模型相比,Gemini 从一开始定位就是多模态模型,可以处理包括文本、影像、视频、音频等不同类型的信息。
今年 2 月,Google 又推出了拥有百万 token 超长上下文視窗的 Gemini 1.5 。三个月后又推出 1.5 Pro ,上下文长度翻倍,达到 200 万 token,同时也推出轻量级 Gemini 1.5 Flash,速度更快、效率更高。
同时,在多模态领網域,谷歌也发布了文生图工具 Imagen 3、与 Youtube& 音乐家合作的 "AI 音乐沙盒 ",以及视频生成模型 Veo。
如果说去年大家还在卷模型,到今年一个明显的变化是卷向应用层,让 AI 落地到应用场景成了潮水翻涌的方向。
在 Gemini 模型的加持下,谷歌在应用方面也做出不少探索。
除了上文展示的 Chess Fiction、Chating Chess、GenChess 等在棋盘上推出的应用外,谷歌在 AI 搜索中引入多模态搜索功能,计划推出订阅服务 "Gemini Advanced",允许用户定制个性化助手,实现高度个性化互動。
在办公领網域,谷歌将 Gemini 1.5 Pro 整合至 Workspace Labs,用户可利用 AI 快速生成邮件摘要、分析 PDF 附件、提取 Google Meet 录音摘要等,提升办公效率。
在端侧,则计划将轻量化的 Gemini Nano 引入 Pixel 手机,借助 "Circle to Search" 功能,用户通过简单手势即可搜索文字、图片、视频或音频,进一步优化移动端 AI 体验。
还有最近爆火的 AI 播客生成工具 NotebookLM,连 OpenAI CEO 奥特曼都连连称赞。
事实上,当下国内外的大模型公司已经逐渐从单纯的技术比拼阶段,悄然向产品应用的竞争维度过渡。谷歌在这一转型浪潮中,凭借自身极为广泛且完善的产品生态体系,将 AI 技术落地到搜索、办公軟體、手机等诸多实际应用场景之中,稳步构建起庞大而多元的商业生态格局,并确立其在市场中的领先地位。
谷歌的 AI 技术在棋盘上找到归宿,但它的影响力早已突破棋局本身。棋盘的胜利成为 AI 技术向办公、生活、医疗、科学等更广泛领網域延展的基石。AI 正在不断突破行业边界,融入人类社会的方方面面。
棋局之上,AI 为人类解锁了更多可能。
注:部分 Google 技术仅适用于出海开发者 。