Hugging Face發布diffuser模型AI繪畫庫初嘗鮮!( 二 )


更抽象的情況回到松鼠,嘗試生成更抽象的圖像,例如 a giant squirrel destroying a city『一只巨大的松鼠摧毀一座城市』,我們隨機采樣了一些結果如下,好壞參半:
prompt = "a giant squirrel destroying a city"images = ldm([prompt],num_inference_steps=100,eta=.3,guidance_scale=6)images['sample'][0]

Hugging Face發布diffuser模型AI繪畫庫初嘗鮮!

文章插圖
prompt = "a giant squirrel destroying a city"images = ldm([prompt],num_inference_steps=50,eta=.3,guidance_scale=6)images['sample'][0]
Hugging Face發布diffuser模型AI繪畫庫初嘗鮮!

文章插圖
prompt = "a giant squirrel destroying a city"images = ldm([prompt],num_inference_steps=100,eta=.3,guidance_scale=2)images['sample'][0]
Hugging Face發布diffuser模型AI繪畫庫初嘗鮮!

文章插圖
我們似乎觀察到 , 目前這個小模型似乎很難融合兩個通常相關度沒那么高的概念,即『(巨型)松鼠』和『城市』 。我們從一些生成的效果不是特別好的圖片可以觀察出這一點,下面的結果中 , 要么對城市與天際線做了很好的描述卻忽略了松鼠,要么對松鼠和自然環境做了很好的描述,卻沒有特別強的城市背景:
prompt = "a landscape image showing a giant squirrel destroying a city"images = ldm([prompt],num_inference_steps=50,eta=.8,guidance_scale=2)images['sample'][0]
Hugging Face發布diffuser模型AI繪畫庫初嘗鮮!

文章插圖
prompt = "a landscape image showing a giant squirrel destroying a city"images = ldm([prompt],num_inference_steps=50,eta=.8,guidance_scale=2)images['sample'][0]
Hugging Face發布diffuser模型AI繪畫庫初嘗鮮!

文章插圖
多次運行這些提示后 , 我們發現當前這個小模型下,總是在主體之間切換但很難將兩者融合在一起 。
DALL-E 2的結果我們把同樣的內容"a dramatic shot of a giant squirrel destroying a modern city"灌給 DALL-E 2 ,讓它從提示做圖,得到的結果如下:
Hugging Face發布diffuser模型AI繪畫庫初嘗鮮!

文章插圖
果然在更龐大的AI模型下,生成的結果更自然,也能把不同的細節關聯起來 。
總結【Hugging Face發布diffuser模型AI繪畫庫初嘗鮮!】這就是 Hugging Face 新庫的初嘗鮮!盡管目前開源的小模型上 , 還有一系列的問題,但是這類模型就像一把鑰匙,解鎖一些令人敬畏的人工智能類人的藝術創造水平 。
短期看,這個小小的預訓練模型當然無法取代 DALL-E 2、Imagen 或 Midjourney,但隨著開源社區的強大,它會表現越來越好 。
參考資料
  • 你給文字描述,AI藝術作畫 , 精美無比!附源碼,快來試試?。篽ttps://www.showmeai.tech/article-detail/313

Hugging Face發布diffuser模型AI繪畫庫初嘗鮮!

文章插圖

推薦閱讀