Gemini3 Pro在Terminal-Bench 2.0测试中取得54.2%的成绩,证明了其通过终端操作计算机的强大工具使用能力。开发者正在通过Google Antigravity、Gemini CLI、Android Studio等平台体验这一革命性能力。
Gemini3解锁了"氛围编程"的真正潜力,自然语言成为唯一需要的语法。在WebDev Arena排行榜上,Gemini3 Pro以1487分的Elo评分高居榜首,能够通过单个提示将高层次创意转化为完整的交互式应用。
Gemini3是世界上处理复杂多模态理解的最佳模型。在MMMU-Pro复杂图像推理和Video-MMMU视频理解测试中创下新高。结合100万token的上下文窗口,为开发者带来显著改进。
开发者正在越来越多地与AI协同创建软件。基于Gemini 2.5 Pro的反馈和改进,Gemini3 Pro为代理编程模型树立了新的智能基准。
Terminal-Bench 2.0成绩:54.2%
该基准测试评估模型通过终端操作计算机的工具使用能力,Gemini3 Pro在此项测试中表现出色。
为了推动模型与IDE的协同工作,Google推出了Google Antigravity,这是一个展示Gemini3潜力的代理开发平台。它让开发者能够在任务导向的更高层次上操作,通过管理跨工作空间的代理,同时保留熟悉的AI IDE核心体验。
"Cline正在使用Gemini3为开发者的IDE提供自主代码生成……Gemini3 Pro能够处理跨整个代码库的复杂、长期任务,在多文件重构、调试会话和功能实现中保持上下文。它比Gemini 2.5 Pro更有效地使用长上下文,并解决了其他领先模型无法解决的问题。"
—— Nik Pash,Cline AI负责人
Gemini3 Pro解锁了"氛围编程"(Vibe Coding)的真正潜力,自然语言成为您唯一需要的语法。通过显著改进复杂指令遵循和深度工具使用,该模型可以将高层次创意通过单个提示转化为完整的交互式应用。
WebDev Arena Elo评分:1487分
Gemini3 Pro在WebDev Arena排行榜上以令人印象深刻的1487分Elo评分高居榜首。
无论是用单个提示构建游戏、从非结构化语音笔记创建交互式落地页,还是从餐巾纸草图制作完整应用,开发者都可以用Gemini3将创意变为现实。
Gemini3 Pro在Google AI Studio中可以创建复古游戏等应用,无需任何示例即可实现。我们将单提示生成能力推向了前所未有的高度,这意味着您可以从创意到AI驱动的应用只需一个提示。
Google AI Studio的Build模式让您能够比以往更快地添加AI功能,自动配置正确的模型和API。注释功能支持快速直观的迭代。您今天就可以开始使用Gemini3 Pro进行构建。
"Gemini3卓越的提示遵循能力为Emergent的全栈应用开发平台提供了强大动力,特别是在UI/前端工作流程中。当我们将Gemini3的多步骤工具调用整合到我们的代理代码开发设置中时,效果令人难以置信。"
—— Madhav Jha,Emergent联合创始人兼CTO
Gemini3是世界上处理复杂多模态理解的最佳模型,在MMMU-Pro复杂图像推理和Video-MMMU视频理解方面创下新高。结合其智能和100万token的上下文窗口,开发者在构建关键多模态用例时可以看到显著改进。
Gemini3 Pro在文档理解方面达到世界领先水平,远超简单的OCR(光学字符识别),能够智能处理复杂的文档理解和推理任务。
图像转交互体验
在Google AI Studio的演示应用中,您可以看到模型的视觉理解、推理和编码能力如何将任何创意变为现实。仅凭一张图片,Gemini3 Pro就能利用其视觉理解、推理和编码能力将其转化为交互式Web体验。
该模型改进的空间理解能力在具身推理任务(如指向、轨迹预测和任务进展)中表现出色,为自动驾驶汽车、XR设备和机器人技术解锁了新的应用场景。
Gemini3 Pro通过高帧率理解捕捉快速动作,确保开发者不会错过快速移动场景中的关键时刻。除了速度之外,长上下文回忆能力允许在数小时的连续素材中合成叙述和精确定位特定细节。
"在我们的视频代理推理和工具调用方面,Gemini3在三个关键方面为Agent Opus提供了价值:速度,相比我们当前的实现提升了超过32%;精确度,展现了遵循复杂指令和准确完成结构化解码的卓越能力;可靠性,管理长上下文推理并调用细粒度工具,没有常见的幻觉陷阱。"
—— Jay Wu,OpusClip联合创始人兼CTO
为了让您更好地控制延迟和成本,现在可以在Gemini API中根据应用所需的视觉保真度,以更精细的粒度配置多模态视觉处理。
Gemini3在广泛的基准测试中达到了业界领先水平,树立了AI模型性能的新标杆。
在"人类最后的考试"(Humanity's Last Exam)基准测试中,Gemini3 Pro达到了37.5%的准确率,使用搜索和代码执行工具后更是高达45.8%,远超其他竞争模型。
Gemini3在AIME 2025数学竞赛中达到95%的准确率,使用代码执行后更是达到100%的完美表现,展现了强大的数学推理能力。
在GPQA Diamond科学知识测试中,Gemini3取得了91.9%的优异成绩,证明了其在科学领域的深厚知识储备。
在LiveCodeBench Pro竞争性编程测试中,Gemini3的Elo评分达到2439分,在SWE-Bench Verified代理编程测试中达到76.2%的成功率。
Gemini3在MMMU-Pro多模态理解和推理测试中达到81.0%的准确率,在Video-MMMU视频知识获取测试中达到87.6%,展现了强大的多模态处理能力。
Gemini3支持高达100万个输入token和64k输出token,在长上下文性能测试中表现优异,能够处理大规模复杂信息。
Gemini3 Pro现已集成到众多开发者产品和工具中,无缝融入您现有的工作流程,并解锁全新的编程方式。
您可以通过Google AI Studio和Vertex AI for Enterprise立即将Gemini3 Pro集成到您的应用程序中。为了支持模型更深层次的推理能力,我们在API中引入了新的思考级别和更精细的媒体分辨率参数,以及更严格的思考签名验证。
无论您是为Android应用添加AI原生功能、通过Gemini CLI自动化工作流程,还是在Google Antigravity中管理自主代理群,Gemini3 Pro都能为复杂的代理架构提供所需的可靠性。
Google AI Studio是将任何创意变为现实的最快路径。在Build模式下开始,用单个提示生成功能完整的应用。如果您需要一点灵感,点击"手气不错"按钮,让Gemini3 Pro同时处理创意火花和代码实现。
Gemini3发布了客户端bash工具,使模型能够在代理工作流程中提出shell命令,用于导航本地文件系统、驱动开发流程和自动化系统操作。同时配备了托管的服务器端bash工具,用于多语言代码生成和安全原型设计。
组合工具:Google搜索基础和URL上下文托管工具现在可以与结构化输出结合使用,这对于构建涉及获取和提取数据然后以特定格式输出的代理用例特别强大。
Gemini3 Pro
文本、图像、视频、音频、PDF
文本
100万
64k
2025年1月
函数调用、结构化输出、搜索工具、代码执行
代理任务、高级编程、长上下文理解、多模态理解、算法开发
立即体验最智能的AI模型,开启您的创新之旅