今天小编分享的科学经验:微软全球合伙人姜大昕被曝大模型创业,欢迎阅读。
大模型比武场战火纷飞了半年有余,左有 OpenAI 动作频频,右有 Meta 开源 Llama2,开闭源方面,均被巨鳄占领山头,创业投资也已经进入了新阶段。
现在再下场,会不会晚了?
会者不晚。
因为就在最近,又一重量级大牛入局创业。量子位获悉,微软全球合伙人、副总裁、前微软亚洲研究院首席科学家姜大昕出现在最新名单中。
这位在微软工作 16 年有余、曾作为微软必应搜索引擎和 Cortana 智能助手自然语言理解负责人,近期被曝已经从老东家离职,下一站,自己创业,剑指大模型领網域。
而且据说姜大昕还不是一个人战斗,他背后还有两位 MSRA 故旧,一位是地位卓然、微软华人旗帜的 AI 大牛,另一位则是年少有为、知名 AI 独角兽的 CEO。
他们,将在 AI 高地上海的助推下集结。
姜大昕是谁?
姜大昕,2005 年获纽约布法罗州纽约州立大学计算机科学博士,在机器学习、数据挖掘、自然语言处理、生物信息等领網域有丰富的经验和工程经验。
迄今为止,他发表论文 100 余篇,被引用次数接近 1 万次。
现在的领英网站上,姜大昕的职业动态还停留在年初的更新。
"2023 年 3 月起,担任微软副总裁 ",所在部门为 STCA(微软亚洲互联网工程院)。
从 2007 年 3 月加入微软到 2023 年,姜大昕已经和这家公司携手度过了 16 个年头。
姜大昕本硕分别毕业于中国科学技术大学和中国科学院軟體研究所,当他远赴美国攻读计算机博士学位,做生物信息领網域的数据挖掘研究时,恰逢深度学习方兴未艾。
博士毕业后,他选择了前往南洋理工大学担任助理教授,为研究生和大學生教授数据挖掘和生物信息学课程。
2006 年 12 月,他从南洋理工离职,并在次年 3 月成为 MSRA(微软亚研院)的副研究员。
他在 MSRA 工作了四年,负责数据挖掘、机器学习和信息检索等领網域的应用研究,从事着个性化和上下文感知搜索等工作,一路从副研究员做到研究员再到首席科学家。
此期间,他在 SIGKDD、SIGIR,WWW 和 WSDM 等会议上发表了多篇文章,获得 SIGKDD 2008 最佳应用论文奖,还担任多个期刊和会议的副主编和 PC 成员。
2011 年开始,姜大昕转入 STCA 工作。
STCA 主要负责微软全球产品的研发工作,包括必应搜索引擎、智能语音助手 Cortana、Azure 认知服务以及 Microsoft 365 的自然语言理解系统等。
6 年后,姜大昕的 title 已经升为了微软全球合伙人,STCA 副院长、首席科学家。
2023 年 3 月,姜大昕正式升任为微软副总裁,同时兼任亚洲軟體技术中心 WebXT S+D(网络体验、搜索和分销)集团总经理。
此时,姜大昕的工作重点是带领 400 多名应用科学家和工程师,为微软必应开发算法和基础结构。
同时,姜大昕团队还为各种 Microsoft 产品(如 Office,Xbox 和 Microsoft 认知服务)提供 NLP 模型和算法。
大模型创业进程中的微软系
姜大昕并不是第一位出身微软的大模型创业者,细数起来,不少头部玩家都有微软背景。
李开复,前微软全球副总裁,也是 MSRA 的创办者之一。
3 月底,李开复开始筹备、塔尖孵化创业公司零一万物,走自研大模型路线,核心业务集中在大模型技术、人工智能算法、自然语言处理、系统架构、算力架构、数据安全、产品研发等领網域。
已加入的联创团队成员,包含前阿里副总裁、前百度副总裁、前滴滴 / 百度首席算法负责人、前谷歌中国高管、前微软 /SAP/Cisco/ 副总裁,算法和产品团队背景均来自国内外大厂。
目前,零一万物正自建平台,构建数千卡 GPU 集群进行训练、调优和推理,提高数据有效参数量,以及使用的高质量数据的密度,以构建连续、可控、科学化的训练能力。
筹备至今,该公司已经实现百亿参数规模的模型内测,正往 300 到 700 亿参数规模扩大。
周明,MSRA 前常务副院长,旗下创业公司名为澜舟科技,于 2021 年 6 月成立。
公司选择了大模型的轻量化路径,并且瞄准 To B 赛道,聚焦于金融、营销、文化创意、机器翻译等场景。
今年 3 月,澜舟科技完成了 Pre-A+ 轮融资,融资金额数亿人民币。由北京中关村科学城公司领投,斯道资本和创新工场跟投。
同时,澜舟发布了语言生成模型——孟子 MChat 可控大模型,具有类 ChatGPT 能力,加上原来澜舟科技孟子大模型 N 个项目功能引擎,既有对话能力,又具备翻译、生成、信息搜索等能力。
MChat 背后依托的孟子大模型,是澜舟科技自研技术研发的大规模预训练语言模型,于 2021 年 7 月推出。
李笛,微软亚洲互联网工程院(STCA)前副院长、前微软全球资深合伙人,目前是小冰公司的 CEO。
小冰公司前身是微软亚洲互联网工程院的人工智能小冰团队,于 2013 年 12 月在北京组建。2020 年 5 月,小冰公司 " 单飞 ",微软将小冰分拆为独立实体。
早在 2014 年,小冰就发布过一款名叫 " 小冰 " 的 AI 聊天机器人。并且一直沿着生成式 AI 的框架和路径前进。
今年 2 月,小冰一度短暂上线了内测版本的小冰链(X-CoTA,X-Chain of Thought & Action)。
小冰链同样是个大语言模型,通过对话的方式帮人们解答问题。其核心,是利用大模型技术,实现下一代的控制中枢。
与 ChatGPT 等不同,小冰链的数据来源是实时的,并且仅仅用 GPT-3 参数量 2% 的模型,就实现了思维链,能够把 AI 的思考过程完整、透明地呈现出来。
5 月 16 日,小冰公司宣布启动 "GPT 克隆人计划 ",基于小冰框架大模型、神经网络渲染及超级自然语音技术,进行实时情感互動、提供 AIGC 能力。
聂再清,MSRA 前首席研究员,现为清华大学国强教授、AIR(智能产业研究院)首席研究员。
其在 AIR 主导的项目,在今年 7 月孵化出了初创公司水木分子。
水木分子专注生物医药垂直行业大模型的研发与应用,以及构建新一代对话式生物医药研发助手。
7 月初,公司宣布完成千万级种子轮融资。同时宣布了联合创始人、CTO 的人选,乔木。
3 个月前,团队开源了轻量科研版 BioMedGPT-1.6B。
BioMedGPT1.6B 从研究层面验证了将文献、分子、蛋白、测序、知识图谱等数据,压缩到统一的多模态大模型框架内,可使模型在分子性质预测、药物 - 靶点亲和力预测等方面,具备 " 融汇贯通 " 的能力,
梅涛,MSRA 前资深研究员,今年 3 月成立 AI 创业公司HiDream.ai 。
公司走多模态路线,尤其专注视觉与语言多模态互動与生成。
HiDream.ai 在今年 4 月完成种子轮融资,投资方包括阿尔法公社和中喝大种子一号基金。
官方解释称,HiDream.ai 的目标,是要在基础模型上超越 Stable Diffusion 最新版本,在产品上则要赶超 Midjourney。
公司目前正在开发一个生成式视觉多模态基础模型,该模型不仅能够支持文生图,还能支持文生视频、图生视频以及文生 3D 等功能。
袁进辉,MSRA 前主管研究员。
其公司一流科技,在 2017 年 1 月成立,立足于通用性深度学习标准框架的研发和推广使用。
公司从事大模型的研发业务,主要围绕数据处理、执行体、分布式数据、决策系统、拓扑图等技术领網域展开。
今年 3 月,一流科技与王慧文创立的光年之外达成并购意向,交易以换股形式进行。
4 月中旬,一流科技完成工商变更,光年之外成为一流科技的最大股东,持有约 46.52% 股权。
后来,王慧文因病辞任,美团于 6 月 29 日发布公告称,已完成光年之外境内外主体 100% 股权的收购,一流科技也一并转归美团麾下。
张家兴,MSRA 前研究员,公司据传代号深度空间,IDEA 研究院理事长沈向洋担任公司顾问。
大方向是打造大模型底座,希望瞄准 B 端市场打造企业级应用。
今年 4 月即有消息称,该公司首轮估值在数亿美元左右。据悉,该公司的融资进程仍在持续。
不难发现,在清华系创业公司占据国内大模型头部梯队半壁江山时,微软系也是不容小觑的一股力量。
而姜大昕此番从微软出走,入局大模型创业,要锚定领網域中的具体什么方向?除了背后的两位 AI 大牛,有哪些技术或商业骨干选择加盟?迎来新一名重磅玩家的大模型战事,又会发生怎样的变局?
大约只有假以时日,才能知道答案。
— 联系作者 —
>