![]()
期待已久的 Nano Banana 終于揭開了它神秘的面紗,正式發布了!
它有個正式的名字叫做:Gemini-25-flash-image,之前很多人的猜想得到了驗證,這個強大的圖像生成模型來自于 Google。
不出所料,它立馬躋身圖片編輯模型第一:
![]()
上周阿里發布的 Qwen-Image-Edit 已經讓人震驚,它很好的解決了圖像一致性以及文字的問題,僅僅一周又被 Google 顛覆了,不僅如此,它勢必開啟一個新的時代。
且聽我慢慢道來。
Gemini-25-flash-image最為人稱道的強大之處就在于:保持圖像的一致性。
也就是說,通過這個模型編輯之后的圖片仍然和原圖片形象保持一致,比如你只是換個發型、換件衣服、戴個墨鏡甚至換個角度、換個場景,不管怎么換,你還是你,不會變成一個其他人。
比如一張原圖如下:(素材來自網絡)
![]()
現在我讓她穿上一件羽絨服:
![]()
會得到一張非常完美的圖, 原圖的人物形象、姿勢、背景完全一致:
![]()
做為對比gpt-img 和 Qwen-image-Edit 都不夠完美:
![]()
![]()
按住圖片可左右滑動
這就把試穿這個事情完美的解決了
![]()
提示詞:THE WOMAN IS HOLDING THE PINK NIKE PUFFER JACKET FROM THE REFERENCE IMAGE. POSITION THE JACKET IN FRONT OF HER
再比如戴上一個指定的太陽鏡,看看效果:
![]()
![]()
形象是非常一致了,但仔細看仍然有些瑕疵,是不是以后商家都不用找模特、不用找圖片設計師了?
有了這樣的能力,我們可以非常方便的把自己打扮成不同年代、不同風格的形象:(分別為中國風、運動、80s 風格)
![]()
![]()
![]()
按住圖片可左右滑動
類似的換個發型啥的就不用提了,太 easy 了。有人甚至已經用這個功能來做公司的胸牌了:(下圖來自官方案例)
![]()
可以說,有了這種高度的一致性保持,換風格、虛擬試穿已經發揮到淋漓盡致了,就連 Google 大佬都出來玩梗了。(下圖來自 X)
![]()
但,就這?那就太小看這個逆天的模型了,真正硬核的還在后面。
Gemini-25-flash-image另一個強大功能是:多圖像的完美融合。
![]()
更絕的是,即便是很多張,甚至指定場景也能完美合成:
![]()
![]()
好的,真的非常逆天,你就說吧,PS 學多久才能有這種技能??
可以說,如果之前的 AI 圖片工具還停留在簡單的圖片生成、圖片修改,那么 Gemini-25-flash-image真正打開了圖像合成的潘多拉盒子。
![]()
![]()
不得不說,這效果令人驚嘆??
但真正驚掉下巴的是下面這個功能,它能直接生成一個完整的故事!
![]()
圖:來自官方案例
我試了試,如下:(多圖左右滾動)
![]()
![]()
![]()
![]()
按住圖片可左右滑動
不過,不知道為什么 Gemini 里面不能使用這個功能:
![]()
在 Google AI Studio 里面卻可以使用,但它是一次一張的進行生成,可以不斷的繼續,直到所有的(比如 12 張)都完成。
可以想象,在保持完美一致性的同時,還能生成多張不同場景的、甚至是故事片,如果在將這些圖片轉成視頻,那么真正的 AI 電影時刻即將來臨!
之前AI 視頻之所以只能做點搞笑片,最大的一個卡點之一就是沒法保持很好的一致性,鏡頭和鏡頭之間不能連貫,現在這個卡點似乎撤掉給消除了。
除了保持圖像的一致性以及神奇的圖像合成功能這些很宏觀的操作,新的模型也支持非常細微的局部編輯。
比如讓這個狗子把嘴巴閉上:
![]()
得到……
![]()
提示詞:the dog's mouth is closed,no laugh
它甚至可以直接給黑白照片上色喲
![]()
只需要說:把這照片變成彩色的
![]()
當然,這個模型也不是完美的,在文字方面就很拉跨,比如我想給照片右側加上小的豎體文字:攝影 1901 年 8 月 10 日,會得到:
![]()
漢字完全是亂的,這方面 Qwen 仍然是王者。
總體來說, Gemini-25-flash-image非常強大,它強大的一致性功能不僅徹底解鎖了 AI圖像合成,而且勢必打開 AI 視頻的全新局面。
還等什么,趕緊去試試。
【注:本文中所有圖片除注明來自官方案例等,均由筆者生成,原素材均來自網絡】
本文由「AI 范兒」出品
我每天都在更新,如果你覺得這些內容對你有用,
那我們就加個關注、交個朋友。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.