今天小編分享的科技經驗:人人都是程式員,英偉達聯合推出 StarCoder2 模型,歡迎閱讀。
IT 之家 2 月 29 日消息,英偉達近日聯合 Hugging Face 和 ServiceNow,發布了名為 StarCoder2 的 LLMs 系列模型,希望成為代碼生成領網域的新标準,具備性能、透明度和成本效益等諸多優勢。
該系列模型包括一個由 ServiceNow 訓練的 30 億參數模型、一個由 Hugging Face 訓練的 70 億參數模型和一個由英偉達訓練的 150 億參數模型。
這是通過使用名為 Stack v2 的新代碼數據集實現的,該數據集比 Stack v1 大七倍;新的訓練技術也意味着該模型可以更好地理解 COBOL 等低資源編程語言、數學和程式源代碼讨論。
StarCoder2 經過 619 門編程語言培訓,可以執行源代碼生成、工作流生成、文本摘要等專業任務。英偉達表示,開發人員可以利用它進行代碼補全、高級代碼總結、代碼片段檢索等,從而提高工作效率。
英偉達表示相比較初版 StarCoder LLMs,新的 30 億參數模型進一步精簡和篩選了優質參數,其性能相當于 150 億參數模型的初版 StarCoder。
StarCoder2 采用 BigCode Open RAIL-M 許可證,允許免版稅訪問和使用。IT 之家注:感興趣的用戶可從 BigCode 項目的 GitHub 頁面獲取源代碼,可從 Hugging Face 下載模型。