15/03/2026
別再怪 Nano Banana 2 畫出來的圖很醜,是你根本不會用。
Google 官方終於親自下場教你怎麼用 Nano Banana 2。
如果你還在寫一串長得連 AI 也看不懂的提示,馬上停下來。
一起了解如何用 Nano Banana 生圖:
1. 用哪個模型好?
現在Nano Banana 有 3 個模型: ( 在 AI Studio )
- Nano banana 1
- Nano Banana 2
- Nano Banana Pro
如果 1 滿足到你,就繼續用 1 。 不需要轉,因為它仍然是最快最便宜的選擇。
不過,它沒有思考模型。 如果你的圖很單純地只是把文字變圖,可以繼續用。
但是,如果你需要更多細微差別、要更大幅度地讓 AI 遵循指,Nano Banana 2 絕對值得稍微增加的價格。( 生成infographic 、細節度高的圖片)
2. Nano Banana Pro:
很多人面臨的問題是: 2 還是 Pro 好?
在這裡,官方說:
「可以把 Nano Banana 2(Gemini-3.1-Flash)看作是以一小部分成本提供了 Pro 約 95% 的能力。對於幾乎所有新項目,Nano Banana 2 應該是你的首選默認選項。」
也就是說,如果你在生成某些圖片,發現 2 生成不了或效果不理想,就轉回用 Pro。
就像你發現Gemini 3.1 Flash 的回應很一般,就轉去用 Gemini 3.1 Pro 一樣。
3. 圖象定位 (Image Grounding)
「當你需要表現特定地點、紀念碑或高度特定的生物物種時,這個功能非常強大。」
當你要用Nano Banana 2 生成現實世界圖片時,這個功能很強大。 它會在互聯網中搜尋真實的圖片片作為參考。
當你要找地點或自然環境時,這個功能可以幫到你。
提示詞例子:( 官方用法 ,在圖片前加上: Specific Location Grounding )
Specific Location Grounding: "Generate a cinematic, golden-hour photograph of Southmead Hospital in Bristol, England. Ensure the architectural details, particularly the modern curved glass facade of the Brunel building, the main entrance plaza, and the surrounding environment, are accurate to reality."
4. 極端大小
Nano Banana 2 有 2 個新的比例: 1:8 和 1:4,有垂直和水平的格式。
例如,如果你想環生成 4 格漫畫,可以這樣:
Horizontal Comic Strip: "Create a 4-panel horizontal comic strip (aspect ratio 4:1). The story follows a mischievous cat trying to steal a fish from a kitchen counter that ends with a twist. Use a vibrant, Franco-Belgian comic book style. Keep the cat's design consistent across all panels."
你可以直接地根據你的需要,生成漫畫風格圖片。
5. 思考模式
Nano Banana 2 有了一個思考模式。
你可以選擇是否打開。 ( 在 AI Studio 中,打開後價格會高一點 )
你不一定要每次都打開。 對於一般圖片,關掉可以省錢省時間。
什麼時候要用到?
- 生成圖片時需要一些推理
- 你的資訊圖片很複雜
- 圖片有一些複雜的事情要達到
6. 提示詞例子
看到這裡,大家都可能會問一個問題:「 怎樣用 Nano Banana 2 才可以生成想要的圖片?」
在文章中,作者 Giom 分享了一些他喜愛的例子,雖然不是什麼具體教學。 但是,從中我們可以參考到他是怎樣寫提示詞的。
我這裡參考了他的提示,再用了我自己的圖片作為示範。( 我翻譯成繁體中文了 )
第一張: 生成卡通版的自己。
嚴格根據上傳的參考圖像,創建一個寫實場景,畫面中包含真實人物與其巨大 3D 動畫風格化版本並肩而立。兩者必須具備完全相同的面部構造、服裝與姿勢。真實人物自然微笑,並將手搭在 3D 角色的肩膀上。
3D 版本比例更大,解剖結構與真人一致但經過風格化處理,擁有生動的眼神和俏皮的微笑。背景為簡潔的灰藍色攝影棚,採用電影感燈光與清晰的紋理。(註:此提示詞需要搭配上傳圖片使用)。
Isaac 建議: 在使用此提示詞時,您可以根據想要的效果微調「3D 風格」的具體描述,例如:若想要更像皮克斯(Pixar)風格,可以加入:"Pixar-style 3D render"。
例子2 :地圖上的歷史
這個有趣,就是讓Nano Banana 2 生成歷史事件,讓你好像身處在其中。
為了幫助大家了解,我把原提示詞從英文翻譯成中文了。
「生成一張西元 800 年 12 月 25 日查理曼大帝加冕典禮的超寫實影像,完美模擬 Google 地圖街景(Street View)的拍攝畫面。
畫面呈現教宗利奧三世在舊聖伯多祿大殿內,將帝國皇冠戴在跪下的查理曼頭上。包含 123 度廣角桶形失真、半透明的 Google 地圖 UI 介面疊加(導航指北針、2D 地圖縮圖、懸浮在石地板上的白色導航 V 型箭頭),以及「© Google 800」浮水印。基於隱私保護,查理曼、教宗及周圍中世紀貴族的臉部需自動模糊。光源使用大殿內昏暗溫暖的火炬與燭光,帶有戲劇性的陰影,以及 360 度全景相機在低光源室內拍攝時常見的高 ISO 數位雜訊。」
在這裏,大家可以看到圖片就像是我們平時在Google Maps時看到的一些參考圖一樣。
例子 3 :
動畫變真實
上傳一張動畫的圖片,然後利用AI幫你變成一張真實的攝影圖片。( 你可以幻想就是把一些動畫真人化)
提示:
將這個上傳的動畫靜止畫面轉換為超現實、電影般的、完全逼真的場景。將動畫角色轉換為真實的人類,同時完美保留他們的原始身份、面部結構、服裝、表情和整體相似性。(注意:需要上傳圖像)。
7. 如何像 Google 工程師一樣寫提示詞?
參考了一堆提示詞後,這是我個人的想法:
7.1 物理規律與「技術參數」的精確控制
不要只說「高畫質」,給出具體的攝影參數來模擬特定的視覺質感。
例如:
鏡頭感與畸變:
在「地圖上的歷史」中,使用了 「123 度廣角桶形失真」(123-degree wide angle barrel distortion)。這不是隨機的詞,而是為了精準模擬 Google 街景那種特有的魚眼效果。
7.2 光學瑕疵:
為了真實,他們會主動要求「缺點」。
例如:「高 ISO 數字噪點」(high ISO digital noise) 模擬低光拍攝,或 「蠟質污跡」(waxy smudges) 模擬幼兒園作品。
7.3 強調一致性與邏輯關係
在處理「圖生圖」或「風格轉錄」時,專家會反覆強調身份的保留,以防止 AI 跑題。
他們會使用 「相同的面部結構」(same facial structure)、「解剖學上相同」(anatomically identical) 這樣的詞彙。
這是在告訴 AI:你可以改變皮膚質感,但骨骼不能動。
7.4 元元素 (Meta Elements)置入
高手會要求 AI 生成原本不屬於「現實世界」但屬於「畫面載體」的元素。
7.4.1 UI 覆蓋層:
在地圖示例中,要求加入 「導航指南針、2D 地圖縮略圖、白色方向箭頭」。這些元素讓圖像看起來不像是一張畫,而是一個「螢幕截圖」。
7.4.2 水印與版權:
加入「© Google 800」水印,這是一種極致的細節控,用來欺騙大腦的視覺慣性,增加沉浸感。
7.4.3 隱私邏輯:甚至考慮到 「自動模糊面孔以保護隱私」。
這讓生成的圖像具備了某種「功能性」偽裝。
下次當你想要寫一個提示詞時,可以嘗試這套 「三層構建法」:
底層: 它是什麼?(主體 + 動作)
中層: 它在哪裡看?(攝影參數 + 光線 + 環境)
頂層: 它有什麼特殊印記?(UI、水印、特定的藝術瑕疵)
基於這則教學,我建立了一個Gemini Gem,幫助大家快速生成Nano Banana 提示。
留言gem1,我立刻傳給你。