Google I/O年度开发者大会于今日登场,发表新一代AI模型Gemini 3.5系列,在一般用户与企业应用两大市场迎战OpenAI与Anthropic。Google强调,这一系列专为运行「代理任务」而优化。第一款模型3.5 Flash自今日起开放给全球用户使用。这意味着一般用户使用Gemini App及Google搜索的AI模式时,3.5 Flash将作为背后的缺省模型。 Google也发表可被视为视频版Nano Banana的多模态视频生成与编辑模型Gemini Omni。 ● 3.5 Flash今起开放 3.5 Pro预计6月推出 针对今年I/O内核方向,Google首席执行官皮查伊(Sundar Pichai)强调,人工智能(AI)发展进入一个快速推进的阶段,比起技术展示,用户现在更加重视AI在产品当中的实际价值。 新一代3.5 Flash模型结合了「前沿智能」与「行动能力」。后者是「AI代理」的关键内核。 除了一般用户,开发者可通过Google开发平台Antigravity,以及Google AI Studio、Android Studio的Gemini API使用。另外,3.5 Pro已在Google内部使用,预计6月对外推出。 3.5 Flash具备速度和成本优势;Google表示,以每秒输出的词元(Token)数量计算,它的速度比其他前沿模型快约4倍;成本不到前沿模型一半,在某些情况下甚至可以降到约三分之一。 另外,在几乎各类型评测中,3.5 Flash的表现都超越上一代旗舰模型Gemini 3.1 Pro。 ● Omni多模态生成模型 想法可变电影感视频 除了主力模型,Google在今年I/O大会上还发表了Gemini Omni多模态生成模型,并指出可以把Omni想成图像模型Nano Banana,只是它主要是用来制作视频。 现阶段,Google先聚焦在视频生成编辑,最终,希望将Omni打造成一个世界模型,能够接收图片、声音、视频与文本,并运用理解与推理能力,产生包含视频在内的多种输出格式。 Gemini Omni系列首款模型Omni Flash即日起通过Gemini App与Google Flow,开放给全球Google AI Plus、Pro和Ultra订阅用户使用;同时也将从本周起,免费提供给YouTube Shorts与YouTube Create App用户。至于下一款高端版本Omni Pro,预计在不久之后推出。 Google并强调,通过Omni生成或编辑的内容,都会自动加入SynthID数字浮水印,让用户能清楚辨识哪些是AI生成或经过AI工具编辑的内容,强化整体内容的透明度与安全性。