今天小编分享的科技经验:字节发布文生图开放模型SDXL-Lightning,欢迎阅读。
从 AI 开源社区 Hugging Face 的最新榜单上,新闻媒体查询到了该模型。
图源:新闻媒体
新闻媒体从知情人士处获悉,字节发布文生图开放模型 SDXL-Lightning。
从 AI 开源社区 Hugging Face 的最新榜单上,新闻媒体查询到了该模型。SDXL-Lightning 跻身模型趋势榜,同时也成为 Hugging Face Spaces 上的热门模型。
与 SDXL-Lightning 一同上榜的,是谷歌新近推出的 " 最强开放大模型 "Gemma 系列,以及 Stability AI 的新一代文生图模型 Stable Cascade。
在影像生成领網域,先进模型的生成技术依赖于扩散过程,就是把噪声逐步转化为影像样本的迭代。这个过程通常需要 20 到 40 次调用神经网络,不仅会耗费巨大的计算资源,生成速度也比较慢。生成一张高质量影像,大约需要 5 秒。
据知情人士透露,字节跳动的 SDXL-Lightning 通过渐进式对抗蒸馏的技术,实现前所未有的生成速度。该模型能够在 2 步或 4 步内生成极高质量和分辨率的影像,将生成速度加快十倍,是 1024 分辨率下速度最快的文生图模型,计算成本则降低为十分之一。
一位分析人士表示,对于需要快速影像生成的应用场景,如实时广告创意、游戏角色设计等,SDXL-Lightning 模型表现出一些应用潜力。这项技术也可以被运用于快速且高质量生成视频、音频以及其他多模态内容。
字节跳动智能创作团队对新闻媒体回应称,开源开放的浪潮已成为推动人工智能迅猛发展的关键力量,SDXL-Lightning 模型基于已有繁荣生态的文生图开放模型 SDXL,设计之初就考虑到与开放模型社区的兼容。SDXL-Lightning 可以作为增速插件无缝整合到卡通、动漫等多样风格的 SDXL 模型中,并支持当前流行的控制插件 ControlNet、生成軟體 ComfyUI,方便开发者、研究人员和创意从业者结合使用这些工具,助力整个行业的创新和协作。