人工智能
Stable Diffusion 3.5模型发布,图像更真实了
Stable Diffusion 3.5模型发布,图像生成更真实,性能提升,并专注于多样化输出和易用性。
StabilityAI昨天发布了其全新的Stable Diffusion 3.5系列 AI 图像模型,与之前的3.0版本相比,这次升级显著提高了图像的逼真度、对提示的响应能力以及文本渲染效果。
与 SD3.0 类似,Stable Diffusion 3.5有三个版本——大型版 (8B)、大型加速版 (8B Turbo) 和中型版 (2.6B)。这些模型都可以根据用户需求进行定制,并能在消费级硬件上运行,同时也可以通过稳定AI社区许可证使用。
简单来说,这一升级让任何用户都能更轻松地生成逼真的 AI 图像。在一份新闻稿中,StabilityAI承认今年6月发布的中型模型“未能完全达到我们的标准或社区的期望”。
公司进一步解释道:“在听取了宝贵的社区反馈后,我们决定花更多时间开发一个能够推进我们改变视觉媒体使命的版本,而不是快速修补。”
我们的AI编辑Ryan Morrison已经测试了3.5版,他认为这次升级显著提升,甚至可能超过最近发布的Flux 1.1 Pro的能力。
Stable Diffusion3.5有什么新功能?
StabilityAI 表示,新模型的重点是可定制性、高效性能和多样化输出。“Stable Diffusion3.5是我们迄今为止最强大的模型,体现了我们为创作者提供广泛可用且先进工具的承诺。”公司发言人解释道。
这意味着图像可以进行精细调整,模型可以“开箱即用”在消费级硬件上运行,生成的图像会更加独特。
Ryan Morrison 对Stable Diffusion 3.5的大型版进行了快速测试,发现其生成速度快,能够准确响应提示,且风格控制能力强。相比3.0版尤其是中型版,这次升级显著。
新版本还加入了更多的风格选择,包括摄影、绘画等,甚至可以通过标签提示来指定特定风格,如波西米亚风格或时尚风格。此外,通过在提示中突出关键字,可以引导模型朝特定方向发展。
公司分析指出:“Stable Diffusion 3.5大型版在提示响应方面处于市场领先地位,图像质量也与更大规模的模型相媲美。”
“Stable Diffusion 3.5加速版提供了同级别中最快的推理速度,且在图像质量和提示响应上也保持了高度竞争力,即便与其他同规模非蒸馏模型相比。”
“Stable Diffusion 3.5中型版则在中型模型中表现优异,兼顾了提示响应和图像质量,是高效且高质量表现的理想选择。”
该模型可供非商业用途免费使用,包括科研项目,以及年收入不超过100万美元的小型和中型企业使用。超过这一收入范围的企业则需获得企业许可证。
Github:https://github.com/Stability-AI/sd3.5
本文译自 Toms Guide,由 BALI 编辑发布。