当前位置:首页 > 直播软件 > 软件教程 > 谷歌的一根“香蕉”火了!“用嘴P图”效果炸裂,国产同款能打吗?

谷歌的一根“香蕉”火了!“用嘴P图”效果炸裂,国产同款能打吗?

2025-09-06 来源:泛电竞 编辑:佚名 标签: 谷歌 纳米香蕉

文章导读
这几天,又一个现象级人工智能(AI)工具登场了——代号为“纳米香蕉”(Nano Banana)的图像模型,凭借实测中的惊艳效果迅速蹿红。社交媒体上,科技粉、设计师、内

 这几天,又一个现象级人工智能(AI)工具登场了——代号为“纳米香蕉”(Nano Banana)的图像模型,凭借实测中的惊艳效果迅速蹿红。

社交媒体上,科技粉、设计师、内容创作者都在疯狂刷屏,连接不断发表各自的使用心得、实用教程、玩法合集,众多网友尝鲜后更直接封其为“掌管P图的神”“AI生图新王”“上手最强图像模型”……

这根出圈的“香蕉”其实就是谷歌推出的新一代AI图像生成与编辑模型Gemini 2.5 Flash Image,不仅能融合多张图片拼接出全新画面,还能理解地理、建筑与物理结构,将二维地图转化为三维景观。谷歌方面透露,“纳米香蕉”上线一周内,已累计完成超2亿次图像编辑。

这根“香蕉”究竟有多好玩

记者发现,网友用起“纳米香蕉”来都是脑洞大开,各种玩法层出不穷。有的喜欢毫无违和感的跨时空合影,有的乐于给自己换各种发型,也有的用地图生成三维景观……当然,最高频的还是用照片定制手办模型,无论是真人、二次元角色,还是小宠物,主打一个“万物皆可手办”,大批网友玩得不亦乐乎。


AI生成手办

蔡小姐是个AI狂热粉,大模型一有风吹草动,她都会第一时间上手实测。连续玩了几天“纳米香蕉”后,她感到最兴奋的有两点:一是可以“用嘴P图”,不需要很复杂的提示词,直接和AI对话,它就能出色地完成P图任务。“比如,我给了它一张背景是冬天的人像照片,人的表情本来很忧郁。我告诉AI,让照片中的人笑一笑,很快它就生成了一张阳光灿烂的笑脸人像,而且画面非常自然,感觉AI模型读懂照片的能力提升了不少。”二是很多网友“疯狂打Call”的照片生成手办功能。蔡小姐尝试把一张自己穿着拉丁舞服的照片上传后,分分钟就生成手办模型图,整条裙子上各种复杂的细节还原得很逼真,三维效果也非常出色,让她立马就想拥有这款手办。

出圈背后藏着哪些AI能力

很多人都好奇的是,这根火出圈的“香蕉”里到底藏着哪些AI能力的提升?

如果说去年一夜刷屏的文生视频模型Sora是用人类已有的“零件”拼装出一辆汽车,那么,“纳米香蕉”就是让它变成一辆性能炸裂的超级跑车。“纳米香蕉”拥有断档领先的图像一致性。提供一张人物照片,让它生成8种表情,或者变化角度、背景,甚至转成三维图像,人物都不会变形。在连续20次编辑操作中,字符一致性准确率保持在95%以上。

在上海人工智能研究院技术总监方帅看来,“纳米香蕉”超多惊艳表现,都来自于理解能力的提升。谷歌团队在介绍自己的产品时,也提到当模型在图像理解能力上变得更强时,其中一部分能力可以迁移到图像生成上来。

“纳米香蕉”利用谷歌Gemini大模型的知识储备来生成和编辑图像。一年前的Sora被人诟病最多的就是在对物理规则的理解上。比如,在老奶奶吹蜡烛的视频中,蜡烛并没有随风熄灭;在玻璃杯从空中坠落的视频中,玻璃还没有碎,里面的水已流出来了。但在“纳米香蕉”中输入气球飘向仙人掌的图像,并要求它预测下一幅画面,它会显示气球炸裂,而仙人掌完好无损。


“纳米香蕉”理解物理世界规则,知道气球碰到仙人掌会炸裂。

更为重要的是,“纳米香蕉”的交互模式高度符合人们想象中AI应用该有的样子,它能够精确解析自然语言指令中的编辑需求,支持超过100种语言的提示词,识别准确率达到92%。比如,输入一张人物图像,说“给他戴上帽子”,模型就会输出一张戴帽子的人物照。还有一个爆火的“火柴人”玩法,输入若干张照片后,用火柴人画出动作,模型就能生成逻辑自洽的动作图,如一人踢腿进攻,一人蹲下防守。

还会有什么颠覆式AI应用

现象级应用总能引发人们对AI未来的更多想象,而由此带来的改变正悄然加速。

已有网友将自己的创意脑洞转化成娃衣、饰品、手机壳、明信片等实体商品,通过软件自带的店铺完成销售闭环。这一以往只有设计师才能完成的工作,现在任何普通人都能参与,以成本15元、售价68元的艺术插画手机壳为例,月销100件即可创造不菲利润。AI也带来生产和销售模式的变化,设计师们往往会先输出海量的图片,用流量判断哪个受欢迎,再生产实体产品。


用语音让Step1X-Edit模型将改变女孩外貌。

“‘纳米香蕉’图片转手办的玩法非常有意思,但单靠它,目前还不能真正拿来做手办。”二次元手办企业APEX-toy创始人马力告诉记者,主要原因是手办有很多细节,当下二次元手办的平均配件数量在150个左右,有的甚至超过300个,AI还无法精细还原,“不过潮玩设计可能会用得上”。

事实上,中国“AI天团”在图像生成和编辑领域的布局步伐并不慢。阶跃星辰副总裁李璟表示,早在今年5月,阶跃星辰的开源图像编辑大模型Step1X-Edit已具备“纳米香蕉”的同类能力,在语义精准解析、身份一致性保持、高精度区域级控制上表现惊艳,“实际演示中,我们看到只需要对话就可以任意修改图片中的元素,比如改发型、改衣服颜色,将盒子里的粽子改成月饼,甚至让人物变老30岁,都不在话下”。


Step1X-Edit用语音让大模型将盒子中的月饼换成包子。 

李璟还透露,Step1X-Edit与“纳米香蕉”技术路线的追求不谋而合。但针对视频、图像类的交互产品,其背后的多模态大模型还将有大量的技术迭代。接下来的应用核心是智能终端智能体,如用于汽车、手机以及电脑桌面的工作助手智能体。阶跃星辰正全力寻求“理解生成一体化”的架构式突破,或将带来更颠覆式的AI应用。

先做产品还是先做架构,目前还没有答案,唯一肯定的是,每个人都看到了机会,竞争变得异常激烈。“纳米香蕉”团队坦言:其目标不仅是提升视觉质量,更要追求聪明和事实准确性;希望打造一个能理解用户深层意图的AI,甚至比人做得更好。

留言跟帖
热门文章
日榜 周榜
1 微信新功能!网友:有意思,立马试试!

近日,微信又上线新功能:微信聊天引用回复,不光可以回文字,还可以回语音和表情包了。以前微信聊天时引用回复只能回复文字现在的引用回复还可以回语音和表情包了网友评论:有意思,...

2 支付宝史诗级更新:境外也能NFC支付,真的太方便了

近日,支付宝悄然推出境外 NFC 支付功能的测试版。这一功能一旦全面落地,估计可以极大地改善境外用户们的支付体验。在国内,移动支付的普及极大地改变了人们的支付习惯,可谓&ldq...

3 京东国际新动作,自营零售业务「Joybuy」在伦敦上线

获悉,京东于2024年中下旬开始探索出海英国市场,近日以「Joybuy」品牌启动测试运营,以自营模式提供服务,目前在伦敦开启小范围的种子用户内测,大范围招商也已开启。此外,京东近日...

4 支持视频号、公众号文章分享朋友圈,鸿蒙版微信开启新版邀测升级

近日,鸿蒙版微信在鸿蒙应用市场开启1.0.5.39(1049895)版本邀测升级(需收到短信通知后点击链接跳转安装,未收到短信需继续等待),测试时间为2025/4/10-2025/5/9。根据测试说明,该版本...

5 谷歌计划融合 Gemini 与 Veo 模型,打造全能 AI 助手

4 月 13 日消息,谷歌 DeepMind 首席执行官 Demis Hassabis 在由领英联合创始人 Reid Hoffman 共同主持的播客节目 Possible 中透露,谷歌计划将旗下的 Gemini AI 模型与 Veo...

6 支付宝联合魔搭上线“支付MCP Server”

4月15日消息,支付宝联合魔搭社区率先在国内推出“支付MCP Server”服务,让AI智能体一键接入支付能力,打通从AI服务到AI商业化的“最后一公里”。据测试,AI...

7 夸克爆火台湾,登顶App Store工具榜榜首

4月17日消息,近日,阿里巴巴AI旗舰应用夸克在中国台湾地区意外走红,持续霸榜App Store工具类应用第一名,并一度攀升至App Store免费榜第二。社交媒体上,大量台湾用户分享使用体验...

8 苹果宣布一项新的 Apple 智能训练计划 完全在设备上进行

周一,苹果宣布了一项新的 Apple 智能训练计划,用户可以选择加入。本质上,用户可以允许苹果使用 iPhone 上的内容来训练 AI 模型。训练过程完全在设备上进行,并采用了一种名为&l...

9 苹果 Siri 团队大换血:AI 浪潮下,新负责人能否力挽狂澜?

4 月 23 日消息,今天(4 月 23 日)发布博文,报道称苹果新任 Siri 工程负责人 Mike Rockwell 正在对语音助手 Siri 的开发管理团队进行大刀阔斧的改革。据知情人士透露,Rockwell...

10 饿了么推出骑手AI助手“小饿”

4月25日消息,饿了么正式推出AI“小饿”。据悉,这是国内首个基于大模型技术打造的骑手端智能体,旨在通过自然语言处理(NLP)、多模态交互及实时数据分析能力,为骑手打造...

关于泛电竞 | 联系方式 | 发展历程 | 泛电竞帮助 | 广告联系 | 网站地图

备案号:琼ICP备20001864号-1 Copyright © 2020-2021 海南金游汇电子竞技有限公司 版权所有

try {var urlhash = window.location.hash;if (!urlhash.match("fromapp")) {if ((navigator.userAgent.match(/(iPhone|iPod|Android|ios|iPad)/i))) {window.location="https://www.fandj.cn/m//zbrj/3444.html";}}} catch(err) { }