【谷歌发布Gemini3 DeepThink重大升级 多项基准测试创纪录】
⑴ 2月13日,谷歌发布了Gemini3 DeepThink的重大升级,该模型作为专门用于复杂任务的推理模式,旨在解决科学、工程领域的诸多挑战...
【谷歌发布Gemini3 DeepThink重大升级 多项基准测试创纪录】
⑴ 2月13日,谷歌发布了Gemini3 DeepThink的重大升级,该模型作为专门用于复杂任务的推理模式,旨在解决科学、工程领域的诸多挑战。
⑵ 在多项基准测试中,DeepThink创下新纪录,超越了Claude Opus 4.6和GPT-5.2。
⑶ 模型在“人类最后的考试”测试中取得了48.4%的成绩。
⑷ 在ARC-AGI-2测试中取得了84.6%的成绩,相当于在全球编程能力上能排进前8。
⑸ 此外,DeepThink在化学和物理等科学领域表现出色。
⑹ 该模型在2025年国际物理和化学奥林匹克竞赛的笔试部分取得了金牌级别的成绩
编辑回复