今天小編分享的互聯網經驗:阿裡雲開源通義千問多模态大模型Qwen-VL,歡迎閱讀。
大模型資訊:
阿裡雲開源通義千問多模态大模型 Qwen-VL
阿裡雲今天宣布推出開源大規模視覺語言模型 Qwen-VL。Qwen-VL 以通義千問 70 億參數模型 Qwen-7B 為基座語言模型研發,支持圖文輸入,具備多模态信息理解能力。
Qwen-VL 是支持中英文等多種語言的視覺語言(Vision Language,VL)模型,相較于此前的 VL 模型,Qwen-VL 除了具備基本的圖文識别、描述、問答及對話能力之外,還新增了視覺定位、影像中文字理解等能力。
在主流的多模态任務評測和多模态聊天能力評測中,Qwen-VL 取得了遠超同等規模通用模型的表現。
IBM 将參與 Hugging Face2.35 億美元 D 輪融資
IBM 和開源人工智能平台 Hugging Face 周四聯合宣布,前者參與了後者的 2.35 億美元的 D 輪融資。
這筆額外的資金将進一步加強 Hugging Face 作為領先的開源和開放科學人工智能平台的地位。IBM 和 Hugging Face 最近宣布在 IBM 的生成式人工智能平台 watsonx 上展開合作,幫助企業構建、部署和定制跨多個領網域的基礎模型。
在 watsonx 中,人工智能構建者可以利用 IBM 和 Hugging Face 社區的模型,這些模型經過預先訓練,可以支持一系列自然語言處理 ( NLP ) 任務,包括問題回答、内容生成和摘要、文本分類和提取。
AMD 收購 AI 軟體公司 Mipsology,将加強 AMD AI 軟體開發能力
據 AMD 官網顯示,AMD 宣布收購 AI 軟體公司 Mipsology。
AMD 表示, Mipsology 的軟體團隊将加入 AMD AI Group,幫助進一步加快 AMD 的客戶參與度并擴展 AMD 的 AI 軟體開發能力。該團隊将幫助開發 AMD 完整的人工智能軟體堆棧,擴展 AMD 的軟體工具、庫和模型的開放生态系統,為在 AMD 硬體上運行的人工智能模型的簡化部署鋪平道路。
Mipsology 成立于 2015 年,總部位于法國帕萊索。該公司主要開發針對 AMD 硬體量身定制的領先 AI 推理、優化解決方案和工具。
微軟 Teams 引入 Typeface AI 工具,加強品牌營銷内容
微軟近日宣布,将為微軟 Teams 加入 AI 工具 Typeface 。
據悉, Typeface 整合了 Azure 機器學習、Azure OpenAI 服務和 Typeface 品牌個性化 AI 的強大能力,可以用于創建創意簡報、電子郵件營銷活動以及多媒體在線廣告等内容。用戶可以在無須切換應用程式的情況下增強品牌内容。企業可以使用 Affinity AI 模式來訓練 Typeface AI 應用程式,創建自己的專屬内容。
Meta AI 公布開源基礎模型 Code Llama,專攻代碼生成
Meta AI 近日發布論文,公布了一款針對代碼生成功能的基礎大語言模型 Code Llama。
據悉,Code Llama 基于 Llama 2 開發,具有開放式模型中領先的性能、填充能力、對大型輸入上下文的支持以及用于編程任務的零指令跟随能力。它提供包括基礎模型、Python 專用版本以及指令跟随模型等多個模型,每個模型的參數分别為 7B、13B 和 34B。所有模型都是基于 16k 标記序列進行訓練,并在最多 100k 标記輸入上顯示出改進。
Code Llama 以寬松許可證方式開源,允許研究和商業使用。
奇安信發布 Q-GPT 安全機器人和大模型衛士
奇安信集團在京發布了 Q-GPT(奇安信大模型)安全機器人和大模型衛士。
據介紹,Q-GPT 安全機器人是基于奇安信大模型的 " 虛拟安全專家 ",可以全天候工作。大模型衛士集安全風險發現、大模型訪問控制、數據洩露管控、違法違規行為溯源等功能為一體。
會上,京東方集團和吉利集團等客戶現場籤約,成為國内首批 Q-GPT 安全機器人和安全大模型用戶。
重點論文:
中國科學技術大學聯手新加坡管理大學,推出影像生成模型 CgT-GAN
據 Arxiv 頁面顯示,中國科學技術大學近日聯手新加坡管理大學發布一款影像生成模型 CgT-Gan。
CgT-GAN 通過将影像納入訓練過程,使模型能夠 " 看到 " 真實的視覺模态。具體來說,研究團隊采用對抗訓練來教導 CgT-GAN 模型模仿外部文本語料庫的短語,同時利用基于 CLIP 的獎勵機制提供語義指導。
實驗結果顯示,CgT-GAN 在所有指标上明顯優于現有的方法。
論文地址:點此前往