Warning: mkdir(): No space left on device in /www/wwwroot/New.4.com/func.php on line 127

Warning: file_put_contents(./cachefile_yuan/tsxingyuan.com/cache/8a/3503f/e4bcc.html): failed to open stream: No such file or directory in /www/wwwroot/New.4.com/func.php on line 115
穀歌的一根“香蕉”火了!“用嘴P圖”效果炸裂,國產同款能打嗎?
穀歌的一根“香蕉”火了!“用嘴P圖”效果炸裂,國產同款能打嗎?






国产AV蜜桃网站,蜜桃成人无码区免费视频网站,水蜜桃黄片亚洲,国产精品福利免费无码蜜桃

2025-09-14 21:02:11
來源:掉三寸舌網

穀歌的一根“香蕉”火了!“用嘴P圖”效果炸裂,國產同款能打嗎?

字體:

這幾天,又一個現象級人工智能(AI)工具登場了——代號為“納米香蕉”(Nano Banana)的圖像模型,憑借實測中的驚豔效果迅速躥紅。

社交媒體上,科技粉、設計師、內容創作者都在瘋狂刷屏,連接不斷發表各自的使用心得、實用教程、玩法合集,眾多網友嚐鮮後更直接封其為“掌管P圖的神”“AI生圖新王”“上手最強圖像模型”……

這根出圈的“香蕉”其實就是穀歌推出的新一代AI圖像生成與編輯模型Gemini 2.5 Flash Image,不僅能融合多張圖片拚接出全新畫麵,還能理解地理、建築與物理結構,將二維地圖轉化為三維景觀。穀歌方麵透露,“納米香蕉”上線一周內,已累計完成超2億次圖像編輯。

這根“香蕉”究竟有多好玩

記者發現,網友用起“納米香蕉”來都是腦洞大開,各種玩法層出不窮。有的喜歡毫無違和感的跨時空合影,有的樂於給自己換各種發型,也有的用地圖生成三維景觀……當然,最高頻的還是用照片定製手辦模型,無論是真人、二次元角色,還是小寵物,主打一個“萬物皆可手辦”,大批網友玩得不亦樂乎。

AI生成手辦

蔡小姐是個AI狂熱粉,大模型一有風吹草動,她都會第一時間上手實測。連續玩了幾天“納米香蕉”後,她感到最興奮的有兩點:一是可以“用嘴P圖”,不需要很複雜的提示詞,直接和AI對話,它就能出色地完成P圖任務。“比如,我給了它一張背景是冬天的人像照片,人的表情本來很憂鬱。我告訴AI,讓照片中的人笑一笑,很快它就生成了一張陽光燦爛的笑臉人像,而且畫麵非常自然,感覺AI模型讀懂照片的能力提升了不少。”二是很多網友“瘋狂打Call”的照片生成手辦功能。蔡小姐嚐試把一張自己穿著拉丁舞服的照片上傳後,分分鍾就生成手辦模型圖,整條裙子上各種複雜的細節還原得很逼真,三維效果也非常出色,讓她立馬就想擁有這款手辦。

出圈背後藏著哪些AI能力

很多人都好奇的是,這根火出圈的“香蕉”裏到底藏著哪些AI能力的提升?

如果說去年一夜刷屏的文生視頻模型Sora是用人類已有的“零件”拚裝出一輛汽車,那麽,“納米香蕉”就是讓它變成一輛性能炸裂的超級跑車。“納米香蕉”擁有斷檔領先的圖像一致性。提供一張人物照片,讓它生成8種表情,或者變化角度、背景,甚至轉成三維圖像,人物都不會變形。在連續20次編輯操作中,字符一致性準確率保持在95%以上。

在上海人工智能研究院技術總監方帥看來,“納米香蕉”超多驚豔表現,都來自於理解能力的提升。穀歌團隊在介紹自己的產品時,也提到當模型在圖像理解能力上變得更強時,其中一部分能力可以遷移到圖像生成上來。

“納米香蕉”利用穀歌Gemini大模型的知識儲備來生成和編輯圖像。一年前的Sora被人詬病最多的就是在對物理規則的理解上。比如,在老奶奶吹蠟燭的視頻中,蠟燭並沒有隨風熄滅;在玻璃杯從空中墜落的視頻中,玻璃還沒有碎,裏麵的水已流出來了。但在“納米香蕉”中輸入氣球飄向仙人掌的圖像,並要求它預測下一幅畫麵,它會顯示氣球炸裂,而仙人掌完好無損。

“納米香蕉”理解物理世界規則,知道氣球碰到仙人掌會炸裂。

更為重要的是,“納米香蕉”的交互模式高度符合人們想象中AI應用該有的樣子,它能夠精確解析自然語言指令中的編輯需求,支持超過100種語言的提示詞,識別準確率達到92%。比如,輸入一張人物圖像,說“給他戴上帽子”,模型就會輸出一張戴帽子的人物照。還有一個爆火的“火柴人”玩法,輸入若幹張照片後,用火柴人畫出動作,模型就能生成邏輯自洽的動作圖,如一人踢腿進攻,一人蹲下防守。

還會有什麽顛覆式AI應用

現象級應用總能引發人們對AI未來的更多想象,而由此帶來的改變正悄然加速。

在小紅書上,已有網友將自己的創意腦洞轉化成娃衣、飾品、手機殼、明信片等實體商品,通過軟件自帶的店鋪完成銷售閉環。這一以往隻有設計師才能完成的工作,現在任何普通人都能參與,以成本15元、售價68元的藝術插畫手機殼為例,月銷100件即可創造不菲利潤。AI也帶來生產和銷售模式的變化,設計師們往往會先輸出海量的圖片,用流量判斷哪個受歡迎,再生產實體產品。

用語音讓Step1X-Edit模型將改變女孩外貌。小紅書AI大法師視頻截圖

“‘納米香蕉’圖片轉手辦的玩法非常有意思,但單靠它,目前還不能真正拿來做手辦。”二次元手辦企業APEX-toy創始人馬力告訴記者,主要原因是手辦有很多細節,當下二次元手辦的平均配件數量在150個左右,有的甚至超過300個,AI還無法精細還原,“不過潮玩設計可能會用得上”。

事實上,中國“AI天團”在圖像生成和編輯領域的布局步伐並不慢。階躍星辰副總裁李璟表示,早在今年5月,階躍星辰的開源圖像編輯大模型Step1X-Edit已具備“納米香蕉”的同類能力,在語義精準解析、身份一致性保持、高精度區域級控製上表現驚豔,“實際演示中,国产AV蜜桃网站看到隻需要對話就可以任意修改圖片中的元素,比如改發型、改衣服顏色,將盒子裏的粽子改成月餅,甚至讓人物變老30歲,都不在話下”。

Step1X-Edit用語音讓大模型將盒子中的月餅換成包子。 小紅書AI大法師視頻截圖

李璟還透露,Step1X-Edit與“納米香蕉”技術路線的追求不謀而合。但針對視頻、圖像類的交互產品,其背後的多模態大模型還將有大量的技術迭代。接下來的應用核心是智能終端智能體,如用於汽車、手機以及電腦桌麵的工作助手智能體。階躍星辰正全力尋求“理解生成一體化”的架構式突破,或將帶來更顛覆式的AI應用。

先做產品還是先做架構,目前還沒有答案,唯一肯定的是,每個人都看到了機會,競爭變得異常激烈。“納米香蕉”團隊坦言:其目標不僅是提升視覺質量,更要追求聰明和事實準確性;希望打造一個能理解用戶深層意圖的AI,甚至比人做得更好。

【糾錯】【責任編輯:Bachelor戒掉惡習】