Stable Diffusion 3突然发布！与Sora同架构，一切都更逼真了 - 大酷樂

今天小编分享的科技经验：Stable Diffusion 3突然发布！与Sora同架构，一切都更逼真了，欢迎阅读。

白交丰色发自凹非寺

量子位 | 公众号 QbitAI

Stable Diffusion 3，它终于来了！

足足酝酿一年之多，相比上一代一共进化了三大能力。

来，直接上效果！

首先，是开挂的文字渲染能力。

且看这黑板上的粉笔字：

Go Big or Go Home（不成功便成仁），这个倒是杀气腾腾啊～

路牌、公交灯牌的霓虹效果：

还有刺绣上 " 勾 " 得快要看到针脚的 " 晚安 "：

作品一摆出，网友就大呼：太精确了。

以至于有人表示：赶紧把中文也安排上啊。

其次，多主题提示能力直接拉满。

什么意思？你尽管一次性往提示词中塞入 n 多 " 元素 "，Stable Diffusion 3：漏一个算我输。

呐，仔细瞅下图，这里面就有 " 宇航员 "、" 穿着芭蕾舞裙的小猪 "、" 粉色雨伞 "、" 戴着礼帽的知更鸟 "，角落里还有 "Stable Diffusion" 几个大字（可不是什么水印）。

有了这个能力，一幅作品你想多丰富就有多丰富。

最后，当属影像质量，再次进化了一个度。

光看前面这些图，就被冲击到有没有？！

而各种超清特写，那是再信手拈来不过的了。

心动吗？目前官方已开放排队名单，大伙可以前往官网申请。

咳咳，也不得不说，最近这 AI 圈可真是相当热闹啊。

有网友直呼，我的电腦已经 Hold 不住了……

Stable Diffusion 3 来了！

全新的 Stable Diffusion 效果有多好，再给大伙奉送一些。

当然，所有出图均来自官方，比如 StabilityAI 媒体负责人：

不得不说，文字效果实在最为吸人眼球，各种形式都能呈现得相当清楚和 " 应景 "。

而看到上面这幅图，不得不想到 "Midjourney 尴尬亮相学术界：为生物学论文乱配图 " 一事——有了 SD3 之后，我们是不是可以制作非常专业的学术配图了？

除了这些，SD3 的 " 酒精水墨画 " 也相当别出心裁：

动漫风格：

again，你可以在上面加清晰的文字了。

由于目前需要排队申请，大伙还不好实际测试摸底。

不过有机智的网友已经用相同的提示词喂给了 Midjourney（v 6.0）。

比如开头的那张 " 红苹果与黑板字 "（prompt：cinematic photo of a red apple on a table in a classroom, on the blackboard are the words "go big or go home" written in chalk）

最终 Midjourney 给出的结果如下：

从这组对比来看，可以说是高下立判—— SD3 无论是文字拼写还是质量、色彩协调性等方面都更胜一筹。

技术方面，目前，模型可选择的参数范围在 800M 到 8B。

详细的技术报告还未公布，官方目前只透露主要结合了扩散型 transformer 架构以及 flow matching。

前者实际上同 Sora 一样，附上的技术论文正是 22 年 William Peebles 同谢赛宁合写的 DiT。

DiT 首次将 Transformer 与扩散模型结合到了一起，相关论文被 ICCV 2023 录用为 Oral 论文。

在该研究中，研究者训练了潜在扩散模型，用对潜在 patch 进行操作的 Transformer 替换常用的 U-Net 主干网络。他们通过以 Gflops 衡量的前向传递复杂度来分析扩散 Transformer ( DiT ) 的可扩展性。

而后者 flow matching 同样也是来自 22 年，由 Meta AI 以及魏茨曼科学研究所的科学家完成。

他们提出了基于连续归一化流（CNFs）的生成模型新范式，以及 flow matching 的概念，这是一种基于回归固定条件概率路径的矢量场的免模拟 CNFs 的方法。结果发现使用带有扩散路径的 flow matching，可以训练出来的模型更稳健和稳定。

不过最近看了这么多视频生成进展，也有网友表示：

你觉得呢？

One More Thing

除此之外，也就在前一天，他们的视频产品 Stable Video 正式开放公测。

基于 SVD1.1（Stable Video Diffusion 1.1），人人可用。

主要支持文生视频和图生视频两个功能。

熱門排行

张一鸣的“贵人”，今年财富激增了17 賁芳蕤 | 2025-03-17
深圳市海洋发展局与华为、腾讯签署幸聽楓 | 2025-03-17
不是CG？没加速？这个国产机器人跳「斧繁綺文 | 2025-03-17
邓超孙俪带娃日本度假，一家四口幸福嬴覓晴 | 2025-03-17
7次40+成队史首人：华子飞扣7尺中锋甄正浩 | 2025-03-17
深圳无人面馆火了！一碗面只要6元，48 習又夏 | 2025-03-17
马斯克母亲签约MCN机构入股凌势动繁綺文 | 2025-03-17
何小鹏：全新小鹏G6上市后首个周末创甄正浩 | 2025-03-17
朱自强：整本书阅读如何真正深入？寸飛蘭 | 2025-03-17
新规满月，投行IPO收费数据来了習又夏 | 2025-03-17
高露现身上海虹桥机场黑色外套点缀亮色爱心装饰俏皮亮眼惠惠君 | 2023-05-02
《歧路旅人2》：向光而生衛青柏 | 2023-05-02
vivo X90S曝光：处理器更新为天玑9200+ 安卓最强芯袁曼雁 | 2023-05-05
“懒癌”发病率上升，定期体检别忽视幸聽楓 | 2023-05-02
宋慧乔获百想视后韩素希发图手动加爱心表情庆祝賁芳蕤 | 2023-05-02
十年了，他们终于要HE！惠惠君 | 2023-05-07
曹操墓，里面都有啥？衛青柏 | 2023-05-02
中央部署经济工作，释放5大信号郜萌運 | 2023-05-02
陈自瑶抱病为爱女做蛋糕庆生，王浩信点赞没露面賁芳蕤 | 2023-05-02
高德上线手机弯道会车预警功能習又夏 | 2023-05-02
高端国产车：军车血统，目前电动车越野的“天花板”？謝飛揚 | 2023-05-02
等比例长大的童星，李兰迪算一个郟君昊 | 2023-05-02
这些被抓来做实验的流浪狗，最终拯救了无数糖尿病人集玲琳 | 2023-05-02
信用风险释放趋缓，结构性风险需重点关注 ——2023年一季度债市信用风险回顾与下阶段展望袁曼雁 | 2023-05-02
《云襄传》终于抬上来啦，男O女A让人好上头！集玲琳 | 2023-05-02
21家A股游戏公司2022年收入651亿今年“游戏+AI”能否逆风翻盘？衛青柏 | 2023-05-04
与周立波夫妇闹纠纷成老赖，唐爽被司法拘留15日寸飛蘭 | 2023-05-05
中银证券给予南京银行增持评级袁曼雁 | 2023-05-03
普京签署总统令，批准对俄刑法典相关法条的修正案集玲琳 | 2023-05-02
前董事长被免，天山生物全面进入“中植系”时代？股价曾在一月内暴涨超400% 惠惠君 | 2023-05-02
解除资格！停止一切合作佼昌翰 | 2023-05-02
3699起联想小新mini主机上架 13代酷睿标压处理器習又夏 | 2023-05-05
疯成这样，怎么还能被全网吹捧？郜萌運 | 2023-05-02
狂吼11次“让一下”！交警咆哮开道嘶吼到吐寸飛蘭 | 2023-05-03
摩根大通收购美国第一共和银行謝飛揚 | 2023-05-02
台剧赢麻了，又来一部8.9 衛青柏 | 2023-05-02
下降45分，上涨35分！34所自划线院校复试分数线涨幅汇总袁曼雁 | 2023-05-07
事关农村土地承包和农民权益，《农村土地承包合同管理办法》5月1日起施行郟君昊 | 2023-05-02
"三高"已盯上青少年，做好这件事是关键習又夏 | 2023-05-05
五一档没一个能打的集玲琳 | 2023-05-05
恐怖韩剧下神坛，这次胆小可入袁曼雁 | 2023-05-05
这剧是不是用ChatGPT写的呀？惠惠君 | 2023-05-02
性骚扰惯犯，滚出娱乐圈謝飛揚 | 2023-05-05
200户连夜疏散，原因让人愤怒！“损失超一亿”，官方通报袁曼雁 | 2023-05-03
48岁何炅自曝已老花眼，黄磊睡前认老，《向往的生活》证实将停办佼昌翰 | 2023-05-02
一个《长月烬明》倒了，《狐妖》《长相思》《与凤行》…在路上了惠惠君 | 2023-05-02
当年轻人开始不随份子钱袁曼雁 | 2023-05-02
张天爱假期晒“酷”存照卷发披肩穿黑色吊带裙大秀好身材嬴覓晴 | 2023-05-02
毕滢用8年时间成功逼宫？曾被传已婚生子的她，不容小觑幸聽楓 | 2023-05-03
宋慧乔获视后首次晒照，拿奖杯笑容温柔郜萌運 | 2023-05-02