谷歌昨晚放出两个"小模型",比GPT-5还快4倍,看完我想换AI了
北京时间5月20日凌晨,Google I/O 2026开场就扔了两颗核弹:Gemini 3.5 Flash——输出速度是GPT-5的4倍;Gemini Omni——任意输入、任意输出,还能直接生成视频。谷歌用一晚证明了一件事:大模型竞赛,参数多不如跑得快。

Gemini 3.5 Flash:轻量旗舰如何做到比GPT-5快4倍?
你可能以为"Flash"就是阉割版。但这次谷歌玩的是反向逻辑——不是砍功能求快,而是用新架构让小模型跑出大模型的水平。
Gemini 3.5 Flash的核心参数:
| 指标 | Gemini 3.5 Flash | 对比 |
|---|---|---|
| 输出速度 | 比GPT-5/Claude快4倍 | 实时对话无延迟 |
| 推理能力 | 与全尺寸Gemini持平 | 小体积≠低智能 |
| 上下文窗口 | 100万Token | 能塞进10本书 |
| 多模态输入 | 文本/图片/音频/视频 | 全格式支持 |
四个字总结:又快又强。
Gemini Omni:视频都能直接输出的AI来了
如果说3.5 Flash是"快",那Omni就是"全能"。
Omni的定义:任意输入→任意输出。 你给它一段文字,它可以回你一段语音。你给它一张图,它可以回你一段视频。你给它一个PDF,它可以回你一个填好的表格。
最炸裂的一个能力:视频输出。
"生成一个15秒的教程视频,教用户怎么用Google Lens翻译菜单"——Omni直接生成带字幕、带配音的完整视频。
这意味着AI创作从"图文时代"跨进了"视频时代"。短视频创作者的竞争对手又多了一个——它不需要睡觉。
9亿月活背后的信号:AI用户量级正在跨越临界点
谷歌同时披露了Gemini用户数据:
- 月活突破9亿——相当于微信海外版用户量
- 付费订阅增长300%
- 企业客户接入速度翻倍
这个数据的意义不亚于两个新模型的发布。它说明AI已经从一个"尝鲜工具"变成了"日常基础设施"。当一个产品的月活达到9亿,它就不再是小众实验,而是全民标配。
为什么说这是谷歌的反击战?
过去半年,AI圈的热度集中在OpenAI(GPT-5.5)和Anthropic(Claude Code)身上。谷歌虽然手握Gemini,但存在感一直被压着打。
Google I/O 2026释放的信号很清晰:
我不跟你在Benchmark上卷精度,我跟你卷"谁跑得快、谁更全能、谁更多人用"。
这三个维度——速度、模态覆盖、用户规模——恰恰是谷歌的天然优势。搜索有流量入口,Android有设备入口,YouTube有内容入口。把AI塞进每个入口,就是谷歌的"降维打击"。
对普通用户的直接影响
利好1:免费用户待遇提升了
Gemini Flash级别的模型对所有人免费——不像某些友商把好模型锁在付费墙后面。
利好2:AI交互门槛继续降低
Omni的"任意输入→任意输出"意味着你不再需要学Prompt技巧——给它一张图、一个语音、一个文件,它自己就懂你要什么。
利好3:AI"用得起"成为现实
Flash系列的核心逻辑是"轻量但够用"——用更少的算力成本实现可用的AI能力。这跟铠盒A1的逻辑完全一致:不是越贵越好,而是够用就好。
一句话总结:Google I/O 2026不是发布了一个更好的模型,是发布了一个"更快、更全、更多人能用"的AI范式。速度比精度更重要——因为没人愿意等AI想5秒再回答。
AI前沿栏目持续追踪全球大模型动态。关注我们,第一时间看懂每一次AI浪潮的方向。