行业热点

Google enhances Gemini AI\'s image processing capabilities in the latest round of attacks against ChatGPT

发布日期:2025-09-07 07:23
Chain Icon
欧易OKX
OKX是全球十大虚拟货币交易所之一,支持90多个国家地区的法币充值服务,是法币入场和提现的重要通道之一。

谷歌本周二发布了新款产品“双子座2.5 Flash Image”,该产品引入了全新的人工智能模型,能够比以往更精准、更一致地生成和编辑图像,旨在缩小与OpenAI的ChatGPT之间的差距。这一新技术将为用户带来更高质量的图像处理体验。

Google enhances Gemini AI\

这家科技巨头正在努力将先进的图像编辑技术融入Gemini这反映出人工智能平台正在更广泛地推动将图像生成作为必备功能。这款新工具现已在 Gemini 应用和平台上线,用户可以使用自然语言编辑视觉效果,处理诸如姿势变化或多图像融合等复杂任务,且不会扭曲面部或场景。

在博客中邮政谷歌表示,该模型允许用户“将同一个角色放入不同的环境中,从多个角度展示单个产品……同时保留主题。”

该模型最初以“nano-banana”的化名出现在众包测试网站LMArena上,因其无缝编辑功能而备受关注。谷歌周二证实,该工具是其开发者。

谷歌表示,该系统可以融合多幅图像,保持故事叙述或品牌推广的角色一致性,并整合“世界知识”来解释图表或组合参考资料——所有这些都在一个提示中完成。

该模型在谷歌云上的售价为每百万个输出令牌 30 美元,约合每张图片 4 美分。它也通过 OpenRouter 和 fal.ai 进行分发。

OpenAI 于 2024 年 5 月推出了 GPT-4o 模型,并在2025年3月这有助于 ChatGPT 的周活跃用户数突破 7 亿。谷歌报告称,2025 年 8 月,Gemini 的月活跃用户数将达到 4 亿,这意味着其周活跃用户数将远远落后于 OpenAI。

谷歌表示,所有输出都将包含一个不可见的 SynthID 水印和元数据标签,以将其标记为 AI 生成的,以解决对滥用和真实性的担忧。

Chain Icon
欧易OKX
OKX是全球十大虚拟货币交易所之一,支持90多个国家地区的法币充值服务,是法币入场和提现的重要通道之一。
分享到: