开云体育,开云体育官方网站,开云体育APP下载这一超越背后,离不开谷歌推出的爆款图像编辑产品Nano Banana(纳米香蕉)。今年8月26日,谷歌DeepMind发布新一代AI图像生成与编辑模型Gemini 2.5 Flash Image。这一模型的代号为“Nano Banana”,在图像质量、编辑控制和应用场景上有大幅改进,一推出就受到了用户的热烈追捧。9月4日,谷歌实验室副总裁Josh Woodward透露,自该功能上线万新用户尝试Gemini应用。
浙商证券研报分析称,和此前的多模态模型相比,Nano Banana在以下技术层面有所提升。1)自然语言驱动图像编辑:Nano Banana允许用户通过一句简单的自然语言指令实现精准编辑,无需传统图层或遮罩操作。2)角色一致性与场景融合:模型在连续编辑中能够保持人物面貌与特征一致,确保角色在不同场景和动作中保持统一识别度。这一特性在品牌角色创作、情景剧本生成等应用中尤为关键。3)多图融合与世界知识注入:支持将多个图片在同一画面中融合,自然过渡;同时,基于Gemini的世界知识,模型能理解复杂场景并执行符合现实逻辑的编辑任务。4)降低3D建模门槛:传统3D建模需专业技能,而Nano Banana生成的2D设计图已包含结构、光影、材质等关键信息,建模师可快速将其转化为3D文件。
Nano Banana的火爆出圈,与数月前GPT-4o推出图像生成功能并引发“吉卜力”风格AI图片创作风潮十分相似。吉卜力风格是指日本吉卜力工作室创作的动画艺术风格,该工作室由宫崎骏与高畑勋于1985年创立,代表作包括《千与千寻》《龙猫》等。由于过于火爆,OpenAI首席执行官山姆·奥特曼当时也火速换上了这一风格的头像。奥特曼还发贴称,ChatGPT一小时就新增了百万用户,其活跃用户、App下载和订阅收入都在吉卜力效应当周创下了历史纪录。
例如,9月9日,字节跳动Seed团队宣布推出豆包图像创作模型Seedream 4.0。据介绍,Seedream 4.0可灵活支持文本、图像的组合输入,抽取不同图片元素进行创作,还可一次生成角色连贯、风格统一的组图,实现表情包、连环画等各类创意玩法。同日,AI创业公司生数科技正式推出Vidu Q1参考生图功能,正面对标Nano Banana,支持单次输入最多7张图像作为参考,可自由组合人物、背景与道具,生成细节精准、风格统一的高质量图像。