Hugging Face發布diffuser模型AI繪畫庫初嘗鮮！( 二 )

2026-05-09 生活百科

更抽象的情況回到松鼠，嘗試生成更抽象的圖像，例如 a giant squirrel destroying a city『一只巨大的松鼠摧毀一座城市』，我們隨機采樣了一些結果如下，好壞參半：
prompt = "a giant squirrel destroying a city"images = ldm([prompt],num_inference_steps=100,eta=.3,guidance_scale=6)images['sample'][0]

Hugging Face發布diffuser模型AI繪畫庫初嘗鮮！

文章插圖

prompt = "a giant squirrel destroying a city"images = ldm([prompt],num_inference_steps=50,eta=.3,guidance_scale=6)images['sample'][0]

Hugging Face發布diffuser模型AI繪畫庫初嘗鮮！

文章插圖

prompt = "a giant squirrel destroying a city"images = ldm([prompt],num_inference_steps=100,eta=.3,guidance_scale=2)images['sample'][0]

Hugging Face發布diffuser模型AI繪畫庫初嘗鮮！

文章插圖
我們似乎觀察到，目前這個小模型似乎很難融合兩個通常相關度沒那么高的概念，即『（巨型）松鼠』和『城市』。我們從一些生成的效果不是特別好的圖片可以觀察出這一點，下面的結果中，要么對城市與天際線做了很好的描述卻忽略了松鼠，要么對松鼠和自然環境做了很好的描述，卻沒有特別強的城市背景：

prompt = "a landscape image showing a giant squirrel destroying a city"images = ldm([prompt],num_inference_steps=50,eta=.8,guidance_scale=2)images['sample'][0]

Hugging Face發布diffuser模型AI繪畫庫初嘗鮮！

文章插圖

prompt = "a landscape image showing a giant squirrel destroying a city"images = ldm([prompt],num_inference_steps=50,eta=.8,guidance_scale=2)images['sample'][0]

Hugging Face發布diffuser模型AI繪畫庫初嘗鮮！

文章插圖
多次運行這些提示后，我們發現當前這個小模型下，總是在主體之間切換但很難將兩者融合在一起。
DALL-E 2的結果我們把同樣的內容"a dramatic shot of a giant squirrel destroying a modern city"灌給 DALL-E 2 ，讓它從提示做圖，得到的結果如下：

Hugging Face發布diffuser模型AI繪畫庫初嘗鮮！

文章插圖
果然在更龐大的AI模型下，生成的結果更自然，也能把不同的細節關聯起來。
總結【Hugging Face發布diffuser模型AI繪畫庫初嘗鮮！】這就是 Hugging Face 新庫的初嘗鮮！盡管目前開源的小模型上，還有一系列的問題，但是這類模型就像一把鑰匙，解鎖一些令人敬畏的人工智能類人的藝術創造水平。
短期看，這個小小的預訓練模型當然無法取代 DALL-E 2、Imagen 或 Midjourney，但隨著開源社區的強大，它會表現越來越好。
參考資料

你給文字描述，AI藝術作畫，精美無比！附源碼，快來試試?。篽ttps://www.showmeai.tech/article-detail/313

Hugging Face發布diffuser模型AI繪畫庫初嘗鮮！

文章插圖

推薦閱讀

上一篇：C#-多線程的使用Tread

下一篇：手把手教你從安裝CentOS7.4鏡像開始，搭建IoT視頻監控系統