今天小編分享的科技經驗:騰訊傑出科學家、混元大模型技術負責人之一劉威離職,歡迎閲讀。
編輯 | 褚杏娟、蔡芳芳
AI 前線獨家獲悉,騰訊傑出科學家、騰訊混元大模型技術負責人之一劉威,目前已經從騰訊離職。
今年 5 月,劉威以混元大模型技術負責人之一的身份,出席 InfoQ 舉辦的 AICon 全球人工智能開發與應用大會并發表了《騰訊混元大模型技術和應用實踐》的主題演講。今年 9 月,他還在 2024 外灘新媒體年會上發表了題為《生成式 AI 的發展與騰訊混元大模型的實踐》的主旨演講。
劉威于 2012 年獲得美國哥倫比亞大學計算機科學與電子工程博士學位,曾任 IBM 沃森研究中心研究科學家。劉威博士長期從事計算機視覺、機器學習、數據挖掘、信息檢索等領網域的基礎研究和產品開發,迄今發表和錄用論文 100+ 篇,總引用次數為 3600+ 次。
劉威曾先後獲得 2011 年底 Facebook 博士研究生獎學金、2013 年度哥倫比亞大學優秀博士論文獎、2014 年度計算機視覺與模式識别國際會議 ( CVPR ) 青年研究者獎、2016 年度國際信息檢索大會 ( SIGIR ) 最優論文榮譽獎。
劉威多次擔任國際權威期刊的客座編委與審稿人,自 2007 年起一直擔任國際頂級會議 NIPS、CVPR、ICCV 等的程式委員成員,擔任第四屆自然語言處理與漢語計算會議 NLPCC 2015 的領網域主席,并自 2014 年起擔任美國自然科學基金信息與智能系統分部 ( NSF IIS Division ) 的研究項目評審。
2017 年 3 月,劉威從 NSF IIS Division 離職,加盟騰訊 AI Lab,擔任 AI Lab 計算機視覺中心總監、廣告多媒體 AI 中心總監,負責影像視頻數據相關的 AI 研究。
2022 年 11 月,劉威入選 2023 IEEE Fellow,入選理由是對大規模機器學習和智能多媒體的貢獻。IEEE Fellow 是 IEEE 授予成員的最高榮譽,每年由同行專家在做出突出貢獻的會員中評選出,當選人數不超過 IEEE 會員總人數的 0.1%。
劉威曾對外介紹,騰訊混元大模型名稱的由來,表示 " 混元 " 在古代漢語中意味着從無序到有序、從混亂到規律的過程,這也正是生成模型的使命。
去年 9 月,騰訊混元大模型上線,之後騰訊又發布了混元大模型 MoE,目前已經涵蓋了輕量版到中版,并且輕量版在騰訊雲上完全免費。今年 5 月,騰訊混元文生圖大模型發布,并宣布開源;到了 9 月,騰訊宣布推出新一代大模型 " 混元 Turbo"。
騰訊混元積累了大量自研技術,包括創新的專家路由 Routing 算法、獨創的 MoE Scaling Law 機制以及合成數據技術,實現模型總體性能相比上一代 Dense 模型提升 50%,在文生圖方面,混元實現了基于 LLM + DiT 的生成能力;視頻生成上,騰訊混元擁有文生視頻、圖生視頻、圖文生視頻、視頻生視頻等多種能力,支持 1k~4k 的分辨率。
" 有人問騰訊為何如此擁抱生成式 AI?我認為軟體的未來就是生成式 AI。" 劉威曾在公開演講中表示。據悉,目前混元大模型已接入騰訊内部 700 多個司内業務應用及場景,有很多是輕量模型,如微信輸入法、微信 " 搜一搜 "、騰訊新聞、騰訊會議、企業微信等。
在推理方面,劉威認為,如果一個 AI 無法推理,人類可以寫一個很長的 Prompt 告訴它如何推理,但幾年後 ChatBot 可能就不再有用了。因此,AI 的推理能力必須從被動推理變為主動推理。
在劉威看來,大模型越來越大的原因是人們希望無論是多模态、單模态、聽説讀寫還是具身智能,它做越來越多的任務。由于整個方法論範式的改變,從單任務變成了多任務、從單模态變成多模态,多網絡變成了一個大網絡,這便是系統性的革新。生成式 AI 的系統性變革至少包含三個維度,即方法論的變革、運算模式的變革和算力的變革。