今天小编分享的科学经验:8月10日TF116报名,欢迎阅读。
为工程师提供顶级交流平台
CCF TF 第 116 期
时间:2023 年 8 月 10 日 19:00-21:00
主题:多模态大模型进展及应用
大模型技术的蓬勃发展极大地推动了人工智能领網域的技术进步和产业应用。国内外巨头公司、高校、研究部門等纷纷在此领網域加大投入,基于大模型的丰富应用悄然进入人们的生产生活。
与此同时,结合计算机视觉、语音处理、自然语言处理等技术的多模态大模型技术也呈现出勃勃生机。多模态预训练联合图文音等多模态内容统一学习,突破了单一模态的限制,在内容理解、内容生成、人机互動等领網域具有巨大的应用价值。同时,多模态大模型也面临模态表示、模态融合等方面的挑战。
8 月 10 日,CCF TF 第 116 期活动将围绕多模态大模型话题,邀请来自学术界和产业界的专家学者共同研讨,回顾多模态大模型的历史,介绍其发展现状和丰富的产业应用,探讨所面临的挑战并展望未来发展前景。以期能够激发讨论,促进技术进步。
会议安排
TF116:多模态大模型进展及应用 主持人:何中军 CCF TF 算法与 AI SIG 主席,百度人工智能技术委员会主席 | ||
时间 | 主题 | 讲者 |
19:00-19:05 | 活动介绍及致辞 | 何中军 CCF TF 算法与 AI SIG 主席,百度人工智能技术委员会主席 |
19:05-19:35 | 《多模态预训练模型的技术回顾与展望》 | 郭龙腾 中国科学院自动化研究所 副研究员 |
19:35-20:05 | 《多模态技术与应用》 | 曾妍 字节跳动 AI-LAB 算法工程师 |
20:05-20:35 | 《多模态内容生成技术与应用》 | 肖欣延 百度杰出架构师 |
20:35-20:55 | 参会者提问互动 | |
20:55-21:00 | 活动总结 |
CCF TF 算法与 AI SIG
特邀讲者
郭龙腾中国科学院自动化研究所 副研究员
主题:《多模态预训练模型的技术回顾与展望》
主题简介:近年来,从预训练模型到预训练大模型,从文本、音频、视觉等单模态大模型,到现在的图文、图文音等多模态预训练大模型,无论在学术界还是企业界预训练模型都得到了广泛关注与爆发式发展。多模态预训练通过联合图文音等多模态内容进行通用模型学习,并应用于跨模态分析、检索、转换等下游任务上,其在内容理解、搜索、推荐、问答、人机互動、AIGC、具身智能等场景领網域中具有巨大的应用价值。本报告主要包含三方面内容:分析多模态预训练模型的研究背景与必要性;回顾当前多模态预训练模型的研究进展,并介绍多模态大模型的架构设计、学习优化、下游应用,以及最新前沿研究方向如多模态大语言模型、多模态具身智能等;最后分析多模态预训练模型所面临的技术挑战与未来展望。
个人简介:郭龙腾,中科院自动化所副研究员,紫东太初大模型研究中心团队成员。主要研究兴趣包括影像分析与理解、多模态预训练模型、跨模态生成等。在相关领網域发表高水平学术论文二十余篇,包括 CVPR、IJCAI、ACM MM、SIGIR 等。相关成果在 ICCV COCO-Place 场景解析、CVPR VATEX 视频描述、ACM MM 预训练视频理解等国际竞赛中取得多项冠军。
曾妍字节跳动 AI-LAB 算法工程师
主题:《多模态技术与应用》
主题简介:多模态理解和生成的应用范围广泛。本次分享首先将介绍我们提出的多模态预训练技术(涵盖影像 / 视频和文本)以及该技术在多模态场景下的应用,同时探讨多语言场景下的多模态应用,分享研究工作应用到实际业务中的挑战和解决方案。本次还将介绍我们在多模态大语言模型方面的尝试,我们发现如何同时做到视觉信号的准确理解和开放式文本生成是一个难点。因此,我们研究了如何训练大语言模型使得其更好地具备这两方面能力,从而提高其在基于视觉信息的开放式文本生成任务中的表现。
肖欣延百度杰出架构师
主题:《多模态内容生成技术与应用》
主题简介:随着大模型的革命性突破,基于人工智能的内容创作,也就是 AIGC,逐渐兴起并受到广泛关注。多模态内容生成是 AIGC 中最重要的方向之一,能够极大提升影像、视频等内容的生产效率,在数字经济中具备广泛的应用价值。本报告介绍百度在多模态内容生成的技术与应用,重点介绍从自然语言到视觉内容的生成,同时探讨当前面临的主要挑战和未来的发展趋势。
个人简介:肖欣延博士,正高级工程师,百度杰出架构师,内容生成与 AIGC 技术负责人。长期从事自然语言处理相关研究和应用,已发表 CCF A/B 类论文 30 余篇,获授权发明专利 90 余项并获中国专利优秀奖 1 项,相关成果已在百度的搜索、推荐、百家号、百度云、小度、输入法等业务中得到广泛应用。
SIG 主席
何中军CCF TF 算法与 AI SIG 主席,百度人工智能技术委员会主席
个人简介:长期从事机器翻译研究与开发,研发了全球首个互联网神经网络机器翻译系统及语义单元驱动的机器同传系统。曾获国家科技进步二等奖、中国电子学会科技进步一等奖、北京市科技进步一等奖、中国专利银奖等多项奖励。
参会说明
1、如报名后无法参加,请及时于活动开始前发送邮件申请取消(联系邮箱:[email protected]),无故缺席将影响下一期活动的参与。
3、会议链接和密码将在活动当天通过邮件、短信通知。可点击腾讯会议链接,输入密码参加。
4、请于活动前一天 12:00前完成报名,及时获取会议链接。
5、CCF 会员免费参加,非会员 99 元 / 次,加入会员可免费参与全年 20 场线上活动。
会员权益
会员免费参加 CCF TF 全年 20 场线上活动,优惠价参加 14 场线下活动,为自己的技术成长做一次好投资,用高性价比获取专业知识的绝佳路径!
专业会员 / 高级会员 / 杰出会员 / 会士:360 元 / 年
学生会员:50 元 / 年。
具体权益请点击查看:
申请公司会员,可享受更多免费名额、品牌宣传及其他权益,详情点击查看:或咨询电话 0512-65900856 转 27
报名联系方式合作部門
* 本文系量子位获授权刊载,观点仅为作者所有。
— 完 —
量子位 QbitAI
վ ' ᴗ ' ի 追踪 AI 技术和产品新动态
一键三连「分享」、「点赞」和「在看」
科技前沿进展日日相见 ~
>