訂閱電子報
第一屆同學會  ·  2026-03-28

Morris — AI 不確定性於主題餐廳室內設計 提案工作流程之應用

Morris — AI 不確定性於主題餐廳室內設計 提案工作流程之應用

講者:森恒設計 林世昌Morris
Facebook
日期:2026-03-28


Morris 簡報封面
Morris 簡報封面

Morris 站上台的時候先幫老闆打了一波廣告,「辦公室在富錦街,天天在缺人,有在找工作的可以報名」,台下笑了一片,有需要的朋友記得跟 Morris 聯繫!​

他的碩士論文研究的是 Midjourney 圖生圖在室內設計提案中的應用,拆開來看,他其實在解決一個所有設計師都會碰到的問題:找參考圖找到懷疑人生。

「我們在找 Image 的時候,有時候點了 A 就少了 B,找到 C 又沒了 A,這種情況是層出不窮的」

一、核心觀點

用 Morris 的話說:Midjourney 世代的設計提案,真正的重點不是生圖的技術本身,而是「第一張原圖(媽媽圖)」的選擇品質。只要拿到一張有深度、有層次的好圖,後面透過 Style Reference 風格移轉,就可以快速帶出整個空間的一致風格。此外,隨著版本從 V6 進化到 V7 再到 V8,Midjourney 對提示詞的理解能力越來越強,這意味著提示詞的用詞精準度已直接決定成果的好壞。Morris 建議用「人文地理」的框架去思考風格提示詞,而不是籠統地說「中式」或「歐式」。

AI 工具在實務設計上的運用:語言模型 + Midjourney,Image Reference 與 Style Reference
AI 工具在實務設計上的運用:語言模型 + Midjourney,Image Reference 與 Style Reference

二、圖生圖四步驟工作流程

整個工作流程的核心目的,是解決提案找照片時「找到 A 就少了 B、找到 C 又沒了 A」的痛點,目標是縮短找參考圖的時間。工具只用兩種:語言模型(GPT 或 Gemini)和圖像生成(Midjourney),兩者交替作業。

步驟 1:找出原圖(媽媽圖)

第一步是找「媽媽」——Morris 用「行為模式」去判斷一個空間該長什麼樣子,有圓桌的聯想到中餐廳,有長吧台的就是日本料理,用這個方式抓出空間的獨特性,然後找到那張能代表這個空間本質的照片。

「先找 10 張媽媽,再從每張媽媽生出一堆小孩,後面就非常快」
圖生圖的原圖概念:右下角是「媽媽」,其餘是衍生的「小孩」
圖生圖的原圖概念:右下角是「媽媽」,其餘是衍生的「小孩」

步驟 2:讓 Midjourney 自動生成提示詞

將媽媽圖丟入 Midjourney,用 Describe 功能讓它自動生成四段提示詞。這一步解決了「詞窮」的問題。如果跑出來的提示詞不符合預期,直接再丟一次,每次跑出來的結果都不一樣。

步驟 3:用語言模型豐富提示詞

把 Midjourney 生成的提示詞丟進 GPT 或 Gemini,請它加入風格元素(例如書法、山水畫、中式元素),可以要求給出 10 種、20 種甚至 30 種變體,讓提示詞更豐富。若對提示詞有疑慮,可先請語言模型翻成中文確認方向對不對,再調整後回丟 Midjourney。

步驟 3:用 GPT 4o 將提示詞加入風格元素,一次產出多種風格變體
步驟 3:用 GPT 4o 將提示詞加入風格元素,一次產出多種風格變體

步驟 4:生成圖像、挑選、風格移轉

生成圖像後挑選滿意的版本,再用 Style Reference 把這張圖的風格移轉到各個空間。生成後可以順著原圖比例作業,再使用 Midjourney 的往外平移指令做兩側擴展,擴展過程中它會自動給出「有窗戶的、沒窗戶的、有酒櫃的、沒酒櫃的」等選項,不知不覺也會影響你對提案方向的想像。

而真正的殺招是 Style Reference。只要拿到第一張滿意的圖,用風格移轉就能把整間空間的所有角落全部帶出來,客廳到餐廳到吧檯,風格一致。

「我只要拿到第一張,這才是真正的重點」

三、版本差異速查表

這段對有在用 Midjourney 的人特別實用,版本不同,操作策略也要跟著調。

V6

  • 理解能力較弱,你說什麼它不太聽得懂,因此自由度較高
  • 提示詞影響力相對小
  • 室內設計圖略有塑膠感

V7

  • 你說什麼它都聽得懂,提示詞的精準度和圖像參考的干擾度影響非常大
  • 光影和材質質感明顯比 V6 更好
  • Style Reference 的 SW 參數預設值 100,數值越高華麗度越大(開到 200 可能讓中式餐廳變成杜拜風)
  • Morris 測試後建議 SW 設定在 40 到 60 之間,較符合台灣人口味,但每個空間需要自行測試調整
  • 做法與 V6 相同,成果更好看
V7 Style Reference 的 SW 參數調校:SW 20 vs SW 40,數值越高華麗度越大
V7 Style Reference 的 SW 參數調校:SW 20 vs SW 40,數值越高華麗度越大

V8(2026 年 3 月 18 日 Alpha 版)

  • 多了對話模式
  • Standard 模式會加入 Midjourney 預設美學;Raw 模式則純粹照提示詞走
  • Style 數值越大,裝修風格度越強
  • 怪異性(Weird)控制同一次生成四張照片之間的差異性,V7 建議開在 5 到 10 之間
  • Morris 的初步象是「終於對室內設計比較友善了」,之前那種油膩感消失了,現在跑出來的風格更接近當代的 Style
  • Morris 注意事項:目前 AI 仍不理解物理世界(3 米乘 3 米空間放一盞燈,12 次測試只照中 1 次),「不要太苛刻它了」
V8 生成的首爾風格室內空間:油膩感消失,更接近當代 Style
V8 生成的首爾風格室內空間:油膩感消失,更接近當代 Style

四、風格提示詞策略

「大圖,美圖還有創意,才是王道」Morris 對提示詞策略的核心提問
「大圖,美圖還有創意,才是王道」Morris 對提示詞策略的核心提問

Morris 的核心觀點是「風格即人文地理」。他認為只說中式、西式、歐式太過籠統,因為風格本質上是一種人文,人文是被地理影響而形成的,最終成為一個國家的共識。

「用地區性去建立風格,而不是籠統地說我要一個中式風格」

因此,他在與 Gemini 作業時,會給出以下架構:

  • 帶入知名城市作為風格錨點
  • 對應城市的材質敘述
  • 城市化的空間感描述
  • 三位該地知名的設計師與攝影師名字

用這個框架,同一間中式餐廳可以分別被放進米蘭、京都、杜拜、台北、北京,每個版本跑出來的室內都會被當地的文化提示詞影響。Morris 舉例說,京都版本的餐廳,隱隱約約就會感受到那個氛圍在裡面。

他也進一步把「中式」細分到朝代,例如明式、宋代,從每個朝代的當代美學去抓細節,以取得比「中式」更具體的提示詞。

另外,Morris 對於「詞重要還是句子重要」表示自己還沒有定論,但他選擇用句子,原因是 Midjourney 可以吃情緒性描述,例如「漂亮的」、「少女風的」這類形容,用句子能傳達更多層次的感覺。

城市風格生成範例:同一間中式餐廳放進米蘭、京都、杜拜的對比
城市風格生成範例:同一間中式餐廳放進米蘭、京都、杜拜的對比

五、進階技巧

Gemini 先打底、Midjourney 再添色

Midjourney 是 diffusion model,容易亂跑。Morris 最近的做法是先用 Gemini 生成穩定的底圖(「Gemini 叫它做什麼就做什麼,非常乖」),再讓 Midjourney 用提示詞去豐富顏色和細節,他形容這個步驟叫「畫蛇添足」,結果就是「又穩又準又漂亮」。這樣的組合可以同時兼顧穩定性和視覺豐富度。

Gemini 打底 + Midjourney 添色:生成首張圖像,再延伸出風格宇宙
Gemini 打底 + Midjourney 添色:生成首張圖像,再延伸出風格宇宙

白模上色(自然上色模式)

可以讓 Midjourney 直接對沒有顏色的白模空間自然上色,不需要預先建白模,直接生圖就能達到相近效果。Morris 評估這種做法效果漂亮,用來提案應該沒問題,最便宜的方案大約台幣 300 元左右。

媽媽圖庫的複利效果

花心思找到一張好的媽媽圖,後續可以重複使用。先收集 10 張定義好的媽媽圖,再從每張媽媽生出大量衍生,工作效率會越來越快。

SW 參數調校

Style Reference 的 SW 參數需要針對每個空間個別測試。台灣市場傾向 40 到 60 之間,但不同空間型態的最適值可能不同,沒有通用公式。


六、Q&A 精選

問:AI 生圖用在客戶提案上,真的有幫助成交率嗎?客戶接受度如何?

Morris 的答案:他現在仍然以 Pinterest 找媽媽圖為主。比較有印象的一次是台中一間模型店,業主在現場決定不了地板顏色,就即興用 Midjourney 跑了幾個選項,當場比對,蠻順的。

問:Midjourney 可以做到固定只換某個材質嗎?

Morris 的答案:不行,它一次就是整張換。看起來風格一致的成果,是因為用了媽媽圖做整體風格移轉,整體才一致,並不是在局部置換材質。

問:像 ComfyUI 那樣先做白模再上色,Midjourney 可以嗎?

Morris 的答案:可以,讓 Midjourney 自然上色就行了。這一塊不太好控制,但效果很漂亮,而且這樣做不用白模,直接生就可以,好像還蠻擬真的,用來提案應該沒問題。最便宜的方案大概台幣 300 塊左右。

問:丟一張圖進去,Midjourney 就會自動吐出四段提示詞嗎?

Morris 的答案:對,任何照片丟進去它就幫你生成四段提示詞,主要解決「詞窮」的問題。

問:如果跑出來的提示詞不是想要的怎麼辦?

Morris 的答案:直接再丟同一張,每次跑出來的都不一樣。或者把提示詞拉到 GPT 或 Gemini 先翻成中文確認方向,不對的地方請它調整,改好了再丟回 Midjourney 測試。


七、方法論整理

工具 / 方法怎麼用適合什麼場景
Midjourney 圖生圖丟原圖 → 自動生成四段提示詞 → 風格擴充 → 生圖提案找參考圖
Style Reference(SW 40–60)用第一張好圖做風格移轉到其他空間整案風格統一
Gemini + Midjourney 組合Gemini 出穩定底 → Midjourney 加工潤色需要穩定但豐富的成圖
語言模型(GPT / Gemini)擴充提示詞、翻譯確認、加入風格元素詞窮的時候
地理風格框架城市 + 材質 + 設計師 + 攝影師替代籠統的風格描述

八、核心觀點

  • 第一張原圖(媽媽圖)的選擇品質,決定了後面所有衍生圖的天花板
  • 從 V7 開始,提示詞的用詞精準度已直接決定成果好壞
  • 風格不要籠統地分中西歐,用「城市 + 材質 + 設計師 + 攝影師」的地理框架更精準
  • Gemini 打底 + Midjourney 添色是目前最穩的組合
  • AI 生圖在實際提案中仍在早期,現階段更像「找靈感的加速器」

九、實戰建議

以下是 Morris 分享的做法裡,可以直接帶回去嘗試的具體行動:

  • 先建媽媽圖庫。從下一個案子開始,嘗試用「行為模式」(空間裡有什麼行為在發生)去找 3 到 5 張原圖,累積到 10 張之後工作速度會快很多。
  • 不要硬記提示詞,讓 Midjourney 幫你生成。把你喜歡的參考圖丟進去,它會自己吐出四段描述,再拿去語言模型擴充即可。
  • 用城市替代籠統的風格詞。下次想說「中式風格」,試著換成「北京的飲食空間,搭配當代藝術家 XX 的美學語言」看看效果差多少。
  • SW 值先從 50 開始測。V7 以後風格移轉 SW 預設 100 容易過於華麗,先從 50 試起,再視空間個性往上或往下調。
  • Gemini 打底 + Midjourney 添色的組合。如果你發現 Midjourney 跑出來的圖一直不穩,試試先用 Gemini 生成一張穩定底圖,再讓 Midjourney 用提示詞去豐富它。
  • 暫時不要對 AI 要求「只換這面牆的材質」。目前 Midjourney 無法局部置換材質,強求這件事會讓你很挫折。接受它的限制,改用整體風格移轉的思路來工作。

「先找到媽媽那一張,然後就可以啪啦啪啦啪啦全部把所有的風格一律生出來到一個完整的提案。這就是 Midjourney 不錯的地方」—Morris
電子報

還有更多設計師的 AI 實驗

演算法常常將我淹沒,若想收到我的訊息,記得按下訂閱,讓下一篇電子報直接送到你的信箱。

免費訂閱