探索Gemini3的无限可能

迄今为止最智能的AI模型,带来前所未有的推理能力和创造力

Gemini3 Pro是Google DeepMind推出的最新一代人工智能模型,代表了AI技术的重大突破。目前Gemin Pro账号已全面接入Gemini3模型。凭借先进的推理能力和多模态理解,Gemini3能够帮助您以前所未有的方式学习、构建和规划项目。无论是复杂的编程任务、创意设计还是知识探索,Gemini3都能成为您最得力的AI助手。

立即试用 国内无法访问?

Gemini3的核心特性

Gemini3代理编程能力

代理编程

Gemini3 Pro在Terminal-Bench 2.0测试中取得54.2%的成绩,证明了其通过终端操作计算机的强大工具使用能力。开发者正在通过Google Antigravity、Gemini CLI、Android Studio等平台体验这一革命性能力。

Gemini3氛围编程

氛围编程

Gemini3解锁了"氛围编程"的真正潜力,自然语言成为唯一需要的语法。在WebDev Arena排行榜上,Gemini3 Pro以1487分的Elo评分高居榜首,能够通过单个提示将高层次创意转化为完整的交互式应用。

Gemini3多模态理解

多模态理解

Gemini3是世界上处理复杂多模态理解的最佳模型。在MMMU-Pro复杂图像推理和Video-MMMU视频理解测试中创下新高。结合100万token的上下文窗口,为开发者带来显著改进。

代理编程:AI辅助开发的新时代

终端级操作能力

开发者正在越来越多地与AI协同创建软件。基于Gemini 2.5 Pro的反馈和改进,Gemini3 Pro为代理编程模型树立了新的智能基准。

Terminal-Bench 2.0成绩:54.2%

该基准测试评估模型通过终端操作计算机的工具使用能力,Gemini3 Pro在此项测试中表现出色。

Google Antigravity:代理开发平台

为了推动模型与IDE的协同工作,Google推出了Google Antigravity,这是一个展示Gemini3潜力的代理开发平台。它让开发者能够在任务导向的更高层次上操作,通过管理跨工作空间的代理,同时保留熟悉的AI IDE核心体验。

Antigravity的核心优势:

  • 更快的开发速度:您作为架构师,与智能代理协作,代理可在编辑器、终端和浏览器之间自主操作
  • 自主任务执行:代理规划并执行复杂的软件任务,通过详细的工件与用户沟通工作进展
  • 全方位提升:从功能构建、UI迭代、bug修复到研究和报告生成,各个开发环节都得到提升
  • 跨平台支持:现已推出公开预览版,支持MacOS、Windows和Linux,完全免费

行业评价

"Cline正在使用Gemini3为开发者的IDE提供自主代码生成……Gemini3 Pro能够处理跨整个代码库的复杂、长期任务,在多文件重构、调试会话和功能实现中保持上下文。它比Gemini 2.5 Pro更有效地使用长上下文,并解决了其他领先模型无法解决的问题。"

—— Nik Pash,Cline AI负责人

氛围编程:自然语言就是代码

WebDev Arena排行榜冠军

Gemini3 Pro解锁了"氛围编程"(Vibe Coding)的真正潜力,自然语言成为您唯一需要的语法。通过显著改进复杂指令遵循和深度工具使用,该模型可以将高层次创意通过单个提示转化为完整的交互式应用。

WebDev Arena Elo评分:1487分

Gemini3 Pro在WebDev Arena排行榜上以令人印象深刻的1487分Elo评分高居榜首。

Google AI Studio:从提示到应用的最快路径

无论是用单个提示构建游戏、从非结构化语音笔记创建交互式落地页,还是从餐巾纸草图制作完整应用,开发者都可以用Gemini3将创意变为现实。

零样本游戏开发

Gemini3 Pro在Google AI Studio中可以创建复古游戏等应用,无需任何示例即可实现。我们将单提示生成能力推向了前所未有的高度,这意味着您可以从创意到AI驱动的应用只需一个提示。

Build模式:更快添加AI功能

Google AI Studio的Build模式让您能够比以往更快地添加AI功能,自动配置正确的模型和API。注释功能支持快速直观的迭代。您今天就可以开始使用Gemini3 Pro进行构建。

行业反馈

"Gemini3卓越的提示遵循能力为Emergent的全栈应用开发平台提供了强大动力,特别是在UI/前端工作流程中。当我们将Gemini3的多步骤工具调用整合到我们的代理代码开发设置中时,效果令人难以置信。"

—— Madhav Jha,Emergent联合创始人兼CTO

多模态理解:处理复杂视觉信息

Gemini3是世界上处理复杂多模态理解的最佳模型,在MMMU-Pro复杂图像推理和Video-MMMU视频理解方面创下新高。结合其智能和100万token的上下文窗口,开发者在构建关键多模态用例时可以看到显著改进。

视觉推理

超越OCR的文档理解

Gemini3 Pro在文档理解方面达到世界领先水平,远超简单的OCR(光学字符识别),能够智能处理复杂的文档理解和推理任务。

图像转交互体验

在Google AI Studio的演示应用中,您可以看到模型的视觉理解、推理和编码能力如何将任何创意变为现实。仅凭一张图片,Gemini3 Pro就能利用其视觉理解、推理和编码能力将其转化为交互式Web体验。

空间推理

解锁具身智能应用

该模型改进的空间理解能力在具身推理任务(如指向、轨迹预测和任务进展)中表现出色,为自动驾驶汽车、XR设备和机器人技术解锁了新的应用场景。

智能屏幕理解:

  • 桌面和移动端理解:空间推理还支持对桌面、移动和操作系统屏幕的智能理解
  • 计算机使用代理:为计算机使用代理提供显著的性能改进
  • 意图识别:基于鼠标移动和屏幕注释理解用户操作的意图
  • Visual Computer演示:模型不仅能理解用户手绘的指令,还能根据对屏幕及其元素的理解智能地执行操作

视频推理

高帧率理解与长上下文回忆

Gemini3 Pro通过高帧率理解捕捉快速动作,确保开发者不会错过快速移动场景中的关键时刻。除了速度之外,长上下文回忆能力允许在数小时的连续素材中合成叙述和精确定位特定细节。

"在我们的视频代理推理和工具调用方面,Gemini3在三个关键方面为Agent Opus提供了价值:速度,相比我们当前的实现提升了超过32%;精确度,展现了遵循复杂指令和准确完成结构化解码的卓越能力;可靠性,管理长上下文推理并调用细粒度工具,没有常见的幻觉陷阱。"

—— Jay Wu,OpusClip联合创始人兼CTO

可配置的视觉处理

为了让您更好地控制延迟和成本,现在可以在Gemini API中根据应用所需的视觉保真度,以更精细的粒度配置多模态视觉处理。

Gemini3的卓越性能

Gemini3在广泛的基准测试中达到了业界领先水平,树立了AI模型性能的新标杆。

学术推理能力

在"人类最后的考试"(Humanity's Last Exam)基准测试中,Gemini3 Pro达到了37.5%的准确率,使用搜索和代码执行工具后更是高达45.8%,远超其他竞争模型。

数学问题求解

Gemini3在AIME 2025数学竞赛中达到95%的准确率,使用代码执行后更是达到100%的完美表现,展现了强大的数学推理能力。

科学知识掌握

在GPQA Diamond科学知识测试中,Gemini3取得了91.9%的优异成绩,证明了其在科学领域的深厚知识储备。

代码编程能力

在LiveCodeBench Pro竞争性编程测试中,Gemini3的Elo评分达到2439分,在SWE-Bench Verified代理编程测试中达到76.2%的成功率。

多模态理解

Gemini3在MMMU-Pro多模态理解和推理测试中达到81.0%的准确率,在Video-MMMU视频知识获取测试中达到87.6%,展现了强大的多模态处理能力。

长上下文处理

Gemini3支持高达100万个输入token和64k输出token,在长上下文性能测试中表现优异,能够处理大规模复杂信息。

立即开始使用Gemini3

Gemini3 Pro现已集成到众多开发者产品和工具中,无缝融入您现有的工作流程,并解锁全新的编程方式。

通过Gemini API构建

您可以通过Google AI Studio和Vertex AI for Enterprise立即将Gemini3 Pro集成到您的应用程序中。为了支持模型更深层次的推理能力,我们在API中引入了新的思考级别和更精细的媒体分辨率参数,以及更严格的思考签名验证。

  • 定价:预览版定价为$2/百万输入tokens,$12/百万输出tokens(200k tokens或更少的提示)
  • 免费使用:在Google AI Studio中提供限速的免费访问
  • 开发者指南:查看技术细节和详细文档
  • 提示策略:学习如何使用Gemini3 Pro构建应用

体验代理能力

无论您是为Android应用添加AI原生功能、通过Gemini CLI自动化工作流程,还是在Google Antigravity中管理自主代理群,Gemini3 Pro都能为复杂的代理架构提供所需的可靠性。

可用平台:

  • Google Antigravity(MacOS、Windows、Linux)
  • Gemini CLI
  • Android Studio
  • Cursor、GitHub、JetBrains、Manus、Cline等IDE

使用Gemini3 Pro进行氛围编程

Google AI Studio是将任何创意变为现实的最快路径。在Build模式下开始,用单个提示生成功能完整的应用。如果您需要一点灵感,点击"手气不错"按钮,让Gemini3 Pro同时处理创意火花和代码实现。

Bash工具与结构化输出

Gemini3发布了客户端bash工具,使模型能够在代理工作流程中提出shell命令,用于导航本地文件系统、驱动开发流程和自动化系统操作。同时配备了托管的服务器端bash工具,用于多语言代码生成和安全原型设计。

组合工具:Google搜索基础和URL上下文托管工具现在可以与结构化输出结合使用,这对于构建涉及获取和提取数据然后以特定格式输出的代理用例特别强大。

软件开发的新篇章

软件领域正在发生转变。随着AI改变了谁在构建以及如何构建,我们致力于在您需要的地方与您会合——为您提供突破可能性边界的工具。

这仅仅是Gemini3时代的开始,我们迫不及待想看到您用Gemini3 Pro构建什么!

Gemini3模型信息

模型名称

Gemini3 Pro

输入类型

文本、图像、视频、音频、PDF

输出类型

文本

输入令牌

100万

输出令牌

64k

知识截止日期

2025年1月

工具使用

函数调用、结构化输出、搜索工具、代码执行

最适用于

代理任务、高级编程、长上下文理解、多模态理解、算法开发

开始使用Gemini3

立即体验最智能的AI模型,开启您的创新之旅