Google日前正式推出代號「Nano Banana」的全新圖像生成與編輯模型,並更名為Gemini 2.5 Flash Image,納入Gemini應用程式之中。新一代模型上線後隨即在社群引發熱烈討論,不少台灣網友搶先體驗,紛紛利用此功能打造面試照、形象照,甚至將真實照片公仔化,生成擬真度極高的公仔成品照。
Gemini 2.5 Flash Image的特色在於用戶操作門檻低,只需在手機或網頁版 Gemini開啟新對話並點選「圖像」按鈕,即可輸入指令完成照片編輯或合成。與過去AI圖像模型相比,此版本在主題辨識與內容生成的精準度上顯著提升,能針對上傳素材進行風格變換、顏色修改、背景替換,甚至細節調整。例如用戶可快速嘗試不同造型風格,或將兩張照片中的元素結合,生成融合效果。不僅如此,新功能還支援 3D 公仔與模型生成,由於成品細節精緻、逼真,被網友譽為「最強圖片生成引擎」。
除了生成品質的突破,Gemini 2.5 Flash Image也展現高一致性、真實感、可控性與運算效率。AI專家指出,只要提示語清楚並提供合適素材,系統通常能輸出穩定結果。更吸引用戶的是,Google本次免費開放此功能,降低嘗試門檻,也進一步擴大用戶黏著度。
iKala愛卡拉共同創辦人暨執行長程世嘉分析,這項技術背後反映Google在生態系競爭中的策略。對Google與 Meta這類依賴廣告營收的科技巨頭而言,強化廣告業務「護城河」的關鍵在於讓廣告主投放更便捷、更自動化。若AI能即時生成素材並完成優化,企業投放廣告的摩擦成本將大幅降低。因此,Google將 Nano Banana技術轉化為免費服務,不僅是提升Gemini體驗,也是一種廣告生態布局。
程世嘉進一步指出,Google與Meta的發展方向已相當明確,未來廣告投放流程將全面自動化,從素材製作到優化皆可交由生成式AI處理。對一般用戶而言,這意味著便利與效率;但對其他AI新創公司來說,當巨頭免費釋出技術並逐步完善生態,將構成極大挑戰,甚至可能壓縮創新的生存空間。
總體而言,Gemini 2.5 Flash Image不只是單純的圖片生成工具,而是 Google在 AI與廣告戰略上的重要一棋。從一般用戶的形象照、公仔照,到廣告產業的自動化應用,此次更新都象徵著生成式AI正逐步滲透日常生活與商業模式,也揭示未來產業競爭的新局面。
- Google最新AI圖像編輯工具正式上線,免費開放使用,引發全球討論。(截圖自/ Google AI Studio)