今天小編分享的科技經驗:OpenAI 公布 AI 文生圖“sCM”,号稱效率是傳統擴散模型 50 倍,歡迎閱讀。
IT 之家 10 月 27 日消息,OpenAI 本周公布了一款名為 sCM(Continuous-Time Consistency Model)的新型 AI 文生圖方案。
與傳統的擴散模型相比,sCM 僅需兩個步驟即可生成高質量樣本,号稱能夠将文生圖效率提升約 50 倍,且生成的樣本質量能與 " 業界較強的擴散模型 " 相比較,為 AI 文生圖提供了新的方案。
目前業界通常使用擴散模型生成圖片及音視頻,但傳統擴散模型的取樣過程通常緩慢,通常需要數十到數百個逐步降噪的過程才能生成高質量樣本(例如小夥伴們使用 SD" 煉丹 " 繪圖就需要等待特别長的降噪時間),這使得相應模型效率低下,不适合商業化應用。
雖然目前業界已出現一些技術以加快擴散模型的速度,但無非只是利用復雜訓練過程 " 提純 " 模型,或通過降低輸出樣本質量下降以提升效率。
而 OpenAI 研究團隊則提出了一種名為 sCM 的文生圖方案,這一生成模型方法繞開了傳統擴散模型範疇,号稱僅需兩個取樣步驟即可生成與擴散模型質量相當的高分辨率樣本,極大縮短了生成時間。
IT 之家獲悉,sCM 訓練方法主要利用預訓練擴散模型蒸餾出來的知識直接打造模型,号稱能夠在縮短取樣時間的同時保持高質量樣本生成。
▲ 通過 sCM 方案訓練的模型生成的圖片
研究人員使用 ImageNet 512x512 數據集,利用 sCM 方法訓練模型,号稱能夠生成細節豐富且高質量的影像,展示其在高分辨率生成方面的能力。盡管 sCM 只有兩個取樣步驟,生成樣本的質量仍接近業界 " 最佳的擴散模型 ",号稱 " 差異不到 10%"。