今天小编分享的互联网经验:“旗舰版”文生图开源模型来袭,Stability AI发布SDXL 1.0,欢迎阅读。
作者 | 黄金琼
编辑 | 邓咏仪
北京时间 7 月 27 日,Stability AI 宣布推出最新的影像生成模型 Stable Diffusion XL 1.0,Stable Diffusion XL 1.0 的开源版本,当前可在GitHub 上进行访问。
Stable Diffusion 已经是目前全球使用最广泛的开源文生图模型。本次推出的 Stable Diffusion XL 1.0,其实只和上一个版本 0.9 的推出时间相差不久,新版本相当于是一个 " 旗舰版本 "。
来源:Stability AI
Stability AI 也称其是目前为止 " 最先进 " 的版本,事实也如此。Stable Diffusion XL 1.0 在图片的色彩更鲜艳和准确,并且对比度、阴影以及光影效果方面更佳。
并且,Stability AI 这次还发布了 Stability 的 API 和消费者应用程式 ClipDrop 和 DreamStudio。其中发布的 API 包含了测试版的微调功能,允许用户使用最少 5 张影像来 " 专门 " 生成特定的人、产品等。
参数是模型的核心参数,在这一方面,Stable Diffusion XL 1.0 有进一步的提升。据 TechCrunch 报道,Stability AI 的应用机器学习负责人 Joe Penna 表示,Stable Diffusion XL 1.0 包含 35 亿个参数,能在 " 几秒钟内 " 生成多种长宽比的 100 万像素分辨率的完整影像。
相对于此,上一代模型 Stable Diffusion XL 0.9 尽管能生成更高分辨率的影像,并且在修复、补全影像上能力更强,但同时要求更高的计算能力。
Stable Diffusion XL 1.0 在操作上也更方便快捷,提供更具个性化的操作。Penna 表示:"Stable Diffusion XL 1.0 是可定制的,可以根据概念和风格进行微调。它也更容易使用,可以通过基本的自然语言处理提示,来实现复杂的设计。"
目前,Stability AI 已将稳定的 Stable Diffusion XL 1.0 部署亚马逊关于生成式 AI 模型的云平台项目(Amazon Bedrock)中,也宣布与 AWS 进行深度合作。
不过,Stability AI 当前还是面临各类道德争议。比如在训练模型的数据来源方面,Stability AI 采用了包括艺术家的作品等数据用于训练,这引发了艺术家本人的抗议。
尽管 Stability AI 认为,这符合美国的合理使用原则并坚持使用,但在艺术家们选择诉讼来警告这种行为后,Stability AI 还是选择尊重艺术家们的要求——从数据集中删除作品。而后,Stability AI 转而与新兴企业 Spawning 合作,以寻求训练数据。
并且,Stable Diffusion XL 1.0 也和之前的版本尚未能避免被滥用的问题——不少人利用开源版本来进行换脸、生成有害的内容。
除此之外,Stability AI 近期也深陷负面新闻漩涡,包括创始人 Emad 的造假传闻等等。而据 TechCrunch,Stability AI 由于在快速烧钱,在资金方面也颇有压力,正在大力拓展销售,并且寻找融资。