【阿里千问3.5旗舰预览版亮相，登顶LMArena榜单位列中国第一】 (1) 全球知名的大模型盲测榜单LMArena更新了新一期排名，阿里巴巴千问最新旗舰模型预览版Qwen3.5-Max-Preview首度亮相，斩获1464分，超越了GPT5.4、Grok4.1等海外模型，以及豆包2.0、GLM5、Kimi2.5等全部国产模型。有消息称，Qwen3.5-Max正式版或将于近期发布，能力还将继续进化升级。 (2) LMArena是由国际开源研究机构LMSYS组织的第三方大模型评测平台，采用模型两两匿名对战、由全球开发者进行盲测投票的方式形成模型分数与排名，由于采用开放式对战与人工评估相结合的方式，该榜单被业界视为当前最具参考价值的大模型性能评测之一。 (3) 在本次评测中，Qwen3.5-Max-Preview在没有风格控制的绝对胜率比拼中整体性能排名全球第六，在细分任务层面，该模型的数学能力排名全球第五，专家级文本处理能力排名全球第十。此次亮相是千问3.5系列首次以旗舰级模型身份参与国际第三方评测。 (4) 此外，LMArena基于各公司最强模型对全球大模型机构进行排名，5家中国公司闯入前十，阿里位列全球前五、中国第一，字节、智谱、月之暗面、百度等也闯入全球前十。

2026-03-20 10:17:16

汇通财经APP讯——【阿里千问3.5旗舰预览版亮相，登顶LMArena榜单位列中国第一】
(1) 全球知名的大模型盲测榜单LMArena更新了新一期排名，阿里巴巴千问最新旗舰模型预览版Qwen3.5-Max-Preview首度亮相，斩获1464分，超越了GPT5.4、Grok4.1等海外模型，以及豆包2.0、GLM5、Kimi2.5等全部国产模型。有消息称，Qwen3.5-Max正式版或将于近期发布，能力还将继续进化升级。
(2) LMArena是由国际开源研究机构LMSYS组织的第三方大模型评测平台，采用模型两两匿名对战、由全球开发者进行盲测投票的方式形成模型分数与排名，由于采用开放式对战与人工评估相结合的方式，该榜单被业界视为当前最具参考价值的大模型性能评测之一。
(3) 在本次评测中，Qwen3.5-Max-Preview在没有风格控制的绝对胜率比拼中整体性能排名全球第六，在细分任务层面，该模型的数学能力排名全球第五，专家级文本处理能力排名全球第十。此次亮相是千问3.5系列首次以旗舰级模型身份参与国际第三方评测。
(4) 此外，LMArena基于各公司最强模型对全球大模型机构进行排名，5家中国公司闯入前十，阿里位列全球前五、中国第一，字节、智谱、月之暗面、百度等也闯入全球前十。

下载汇通财经APP，全球资讯一手掌握