Stability AI 發布 Stable Diffusion 3.5 標志開源文生圖模型重大進步
10月23日,Stability AI 公司發布博文,宣布推出新一代開源文生圖模型——Stable Diffusion 3.5。這一更新被視為該領域的重要進展,提供了更強大且易于使用的工具,以滿足科研人員、開發者和企業的需求。
Stable Diffusion 3.5 包含三種規模版本:Medium、Large和 Large Turbo,其中 Medium 版本預計將在10月29日正式發布。
Stable Diffusion 3.5 Large:擁有80億個參數,提供卓越的圖像質量和快速響應,適合于高達100萬像素的專業應用場景,成為Stable Diffusion家族中最強大的模型。
Stable Diffusion 3.5 Large Turbo:作為Large版本的精簡版,能夠在僅需4個步驟內生成高質量圖像,其生成速度顯著快于Large,極大提升了使用效率。
Stable Diffusion 3.5 Medium:該模型擁有25億個參數,基于改進的MMDiT-X架構和訓練方法,專為消費級硬件設計,旨在實現“開箱即用”的體驗,能夠生成分辨率在25萬到200萬像素之間的圖像。
盡管此次發布受到廣泛關注,Stability AI承認其模型尚未完全達到公司的標準和社區的期望,并表示將持續改進,以提供更穩健的解決方案。
此外,Stability AI 為此次發布實施了一項寬松的社區許可政策,這些模型可以供非商業用途免費使用,并且對年收入低于100萬美元的企業開放。對于收入超過該門檻的企業,則需獲得單獨的許可安排。