阿裡雲開源通義千問多模态大模型Qwen-VL

今天小編分享的互聯網經驗：阿裡雲開源通義千問多模态大模型Qwen-VL，歡迎閱讀。

大模型資訊：

阿裡雲開源通義千問多模态大模型 Qwen-VL

阿裡雲今天宣布推出開源大規模視覺語言模型 Qwen-VL。Qwen-VL 以通義千問 70 億參數模型 Qwen-7B 為基座語言模型研發，支持圖文輸入，具備多模态信息理解能力。

Qwen-VL 是支持中英文等多種語言的視覺語言（Vision Language，VL）模型，相較于此前的 VL 模型，Qwen-VL 除了具備基本的圖文識别、描述、問答及對話能力之外，還新增了視覺定位、影像中文字理解等能力。

在主流的多模态任務評測和多模态聊天能力評測中，Qwen-VL 取得了遠超同等規模通用模型的表現。

IBM 将參與 Hugging Face2.35 億美元 D 輪融資

IBM 和開源人工智能平台 Hugging Face 周四聯合宣布，前者參與了後者的 2.35 億美元的 D 輪融資。

這筆額外的資金将進一步加強 Hugging Face 作為領先的開源和開放科學人工智能平台的地位。IBM 和 Hugging Face 最近宣布在 IBM 的生成式人工智能平台 watsonx 上展開合作，幫助企業構建、部署和定制跨多個領網域的基礎模型。

在 watsonx 中，人工智能構建者可以利用 IBM 和 Hugging Face 社區的模型，這些模型經過預先訓練，可以支持一系列自然語言處理 ( NLP ) 任務，包括問題回答、内容生成和摘要、文本分類和提取。

AMD 收購 AI 軟體公司 Mipsology，将加強 AMD AI 軟體開發能力

據 AMD 官網顯示，AMD 宣布收購 AI 軟體公司 Mipsology。

AMD 表示， Mipsology 的軟體團隊将加入 AMD AI Group，幫助進一步加快 AMD 的客戶參與度并擴展 AMD 的 AI 軟體開發能力。該團隊将幫助開發 AMD 完整的人工智能軟體堆棧，擴展 AMD 的軟體工具、庫和模型的開放生态系統，為在 AMD 硬體上運行的人工智能模型的簡化部署鋪平道路。

Mipsology 成立于 2015 年，總部位于法國帕萊索。該公司主要開發針對 AMD 硬體量身定制的領先 AI 推理、優化解決方案和工具。

微軟 Teams 引入 Typeface AI 工具，加強品牌營銷内容

微軟近日宣布，将為微軟 Teams 加入 AI 工具 Typeface 。

據悉， Typeface 整合了 Azure 機器學習、Azure OpenAI 服務和 Typeface 品牌個性化 AI 的強大能力，可以用于創建創意簡報、電子郵件營銷活動以及多媒體在線廣告等内容。用戶可以在無須切換應用程式的情況下增強品牌内容。企業可以使用 Affinity AI 模式來訓練 Typeface AI 應用程式，創建自己的專屬内容。

Meta AI 公布開源基礎模型 Code Llama，專攻代碼生成

Meta AI 近日發布論文，公布了一款針對代碼生成功能的基礎大語言模型 Code Llama。

據悉，Code Llama 基于 Llama 2 開發，具有開放式模型中領先的性能、填充能力、對大型輸入上下文的支持以及用于編程任務的零指令跟随能力。它提供包括基礎模型、Python 專用版本以及指令跟随模型等多個模型，每個模型的參數分别為 7B、13B 和 34B。所有模型都是基于 16k 标記序列進行訓練，并在最多 100k 标記輸入上顯示出改進。

Code Llama 以寬松許可證方式開源，允許研究和商業使用。

奇安信發布 Q-GPT 安全機器人和大模型衛士

奇安信集團在京發布了 Q-GPT（奇安信大模型）安全機器人和大模型衛士。

據介紹，Q-GPT 安全機器人是基于奇安信大模型的 " 虛拟安全專家 "，可以全天候工作。大模型衛士集安全風險發現、大模型訪問控制、數據洩露管控、違法違規行為溯源等功能為一體。

會上，京東方集團和吉利集團等客戶現場籤約，成為國内首批 Q-GPT 安全機器人和安全大模型用戶。

重點論文：

中國科學技術大學聯手新加坡管理大學，推出影像生成模型 CgT-GAN

據 Arxiv 頁面顯示，中國科學技術大學近日聯手新加坡管理大學發布一款影像生成模型 CgT-Gan。

CgT-GAN 通過将影像納入訓練過程，使模型能夠 " 看到 " 真實的視覺模态。具體來說，研究團隊采用對抗訓練來教導 CgT-GAN 模型模仿外部文本語料庫的短語，同時利用基于 CLIP 的獎勵機制提供語義指導。

實驗結果顯示，CgT-GAN 在所有指标上明顯優于現有的方法。

論文地址：點此前往