Stable Diffusion 是什麼?
Stable Diffusion 是 2022 年發布的深度學習文生圖模型,主要根據文字描述產生詳細圖像,讓使用者通過下關鍵字生成頗具水準的繪畫。因為被朋友推坑的原故?所以認真的跟 AI 練習了幾天繪圖。以現今的科技水準,想通過幾個關鍵字生出一張圖是很簡單的,但如果想要這張圖能夠完美展示腦海中的想像,那還是有段不短的路要走。筆者摸索幾天後,偶然想起一句話「人事時地物」,這句話就很適合拿來做為使用 Stable Diffusion 等軟體繪圖的思考方向。
Stable Diffusion 教學
這篇沒有要教大家怎麼使用網頁版或是安裝到自家電腦內,這些在網路已經有很多資訊可參考,比如朋友就是丟這篇鄉民教學給筆者,有興趣加入 AI 小畫家行列的應該稍微搜尋下都能開始。有朋友只用網頁就產出工作能用到的圖,也有朋友裝了電腦版不斷研究還寫攻略。那種比較適合你筆者也不清楚,但這個與 ChatGPT 都屬於未來趨勢之一,早點開始瞭解也是挺不錯的。2023 年 3 月更新:現在也有用 Google Colab 在線上 Stable Diffsuion WebUI,克服沒有高階顯卡的困境,有興趣可以去巴哈文章瞭解。
安裝 Stable Diffusion 的電腦需求?
因為沒有官方答案,筆者依照經驗來說說,Stable Diffusion 對 CPU 沒什麼特別要求、顯示卡至少 GTX 980 以上會比較好,這關係到你能輸出的尺寸大小以及輸出的時間。記憶體至少要 16G,想在出圖時用電腦做其它事最好可以 32G 以上。硬碟沒太大影響,所以放那個槽都可以。
Stable Diffusion 課程推薦
筆者好友在天地人文創有開設「AI 智慧生成藝術創作:Stable Diffusion創作班」的課程,如果你真的在安裝上以及應用有疑問,課程會手把手教你 AI智慧圖像生成工具介紹、Stable Diffusion 安裝教學、Stable Diffusion 原理與基礎操作、Stable Diffusion 進階與其他應用。
購買課程填入優惠碼「TC1459WE」可以折扣 500 NTD,
Stable Diffusion 怎麼用?
以下就讓筆者用「人事時地物」為思路出張圖,示範就以「兩位閨蜜去法國艾菲爾鐵塔前旅遊自拍」做為目標,當然可以產出類真人或是二次元風格,為了避免爭議筆者還是以二次元做教學就好。PS. 下面示範皆為安裝至電腦的版本,網頁版畫人物限制還是比較多點,但風景什麼的應該沒問題。
人
假設今天我們要產出一張有人物的圖,那麼要先設定是男還是女,假設以女生為主,就要思考她的年紀、職業、穿著與造型等。以「兩位閨蜜去法國艾菲爾鐵塔前旅遊自拍」為主題的話,首先要先設定這兩人最簡單的資料。
2 girl,backpacker,long hair
設定這幾個關鍵字後 AI 丟了這張圖給我,要設更詳細也可以,但沒關係我們先這樣就好。
事
兩位女子去巴黎旅遊,最多的事大概就是逛街,所以我們家加逛街的動作。
2 girl,backpacker,long hair,walk
雖然設了走路後人換了?但至少看的出來已經開始走路?!
時
逛街嘛,逛到黃昏也挺正常的,所以設定成夕陽西下的黃昏時間,光線也漂亮
2 girl,backpacker,long hair,walk,sunset
加上夕陽後兩人突然不想看鏡頭,而且看起來又換了人,但的確變成黃昏沒錯
地
巴黎最知名地標不用說就是艾菲爾鐵塔,所以我們就去那附近逛逛。
2 girl,backpacker,long hair,walk,sunset,Eiffel Tower
兩位閨蜜好友終於來到艾菲爾鐵塔觀光,有看見塔沒錯,但是在那拍的筆者也不曉得。
物
都到了鐵塔,當然要一起合照一下,所以我們要讓他們站好拍照
2 girl,backpacker,long hair,walk,sunset,Eiffel Tower,selfie
於是,我們就能得到「兩位閨蜜去法國艾菲爾鐵塔前旅遊自拍」的主題照
看吧,使用 Stable Diffusion 畫張圖就是那麼簡單,但也許你會想這不是自己腦海中想像的畫面,圖片品質跟網上那些美圖都有落差該怎麼辦?這時我們就可以回頭再加些提高品質常用關鍵字:
2 girl,backpacker,long hair,walk,sunset,Eiffel Tower,selfie,masterpiece,best quality,detailed
這樣品質瞬間提升不少,接下來如果你覺得這衣服不適合觀光,也可以設定成自己喜歡的
2 girl,backpacker,long hair,walk,sunset,Eiffel Tower,selfie,masterpiece,best quality,detailed,jeans,sweater,sneakers
兩人馬上就變身成觀光客模式,然後你又會覺得這巴黎除了鐵塔外沒別的嗎?那就來加點街景吧!
2 girl,backpacker,long hair,walk,sunset,Eiffel Tower,selfie,masterpiece,best quality,detailed,jeans,sweater,sneakers,paris street,paris roadside
總之就是這麼一路下去,把你平生所學的英文單字極限運用,不斷嘗試看看如何才能讓自己滿意,比如說筆者在填了一堆單字後,最終的成品就會像下圖這樣,是不是覺得很神奇呢!www
以上就是初心者/新手的關鍵字思路,用這方式思考可以很簡單創作內容,希望對剛入門不知如何上手的人有些幫助,簡單分享給大家,有空大家記得找機會去嘗試看看,最後送上一張擬真人版本。wwww
《Stable Diffusion》的其它咒語
夕陽、逆光、大光圈咒語
最近剛好朋友介紹進了 SD 的社團,也分享幾張練習照,有些人說光線不錯,就在這補充下光線的咒語。基本上是從攝影方面的用語著手,包含 Sunset and magic hour、Depth of Field 以及 Lens Flare,可以嘗試不同數值產生的效果,藉這幾個咒語模擬大光圈鏡頭拍逆光人像的感覺。
水下、漂浮咒語
假如你玩夠在海平面以上的咒語,想把人帶進水世界該如何創作?最近看見社團有人分享了在水下的照片,於是也好奇玩了下如何有一張在海平面下的照片。在海裡需要在意的是漂浮感,不管是人、頭髮或是衣服,都要看起來有漂浮的感覺。首先要到海平面下的關鍵字為 underwater、如果沉不下去請設到 1.4 。
在水裡要讓人、頭髮與衣服有浮起來,請加上 zero gravity、hair floating in water 等關鍵字,至少都要超過 1.5 才可以。如果還是站在水面上,有可能是你用的 Lora 所造成,可以換別的試試看。當然海裡也不能暗摸摸,所以加個 sun shining into the sea 也是很合理的。結合之前一些提升品質的關鍵字,就可以開始骰了?www
以上擬人化的作品都是使用 chilloutmix 模組製作,Lora 只是臉長的不同,大家就自己選喜歡的就好,然後每個 Lora 對咒語的適用性也不盡相同,就像上面提到有時候會沉不到海裡,就和用那個 Lora 與骰子有關係,大家遇到問題可以換個試試看。