【阿里千问3.5旗舰预览版亮相,登顶LMArena榜单位列中国第一】
(1) 全球知名的大模型盲测榜单LMArena更新了新一期排名,阿里巴巴千问最新旗舰模型预览版Qwen3.5-Max-Preview首度亮相,斩获1...
【阿里千问3.5旗舰预览版亮相,登顶LMArena榜单位列中国第一】
(1) 全球知名的大模型盲测榜单LMArena更新了新一期排名,阿里巴巴千问最新旗舰模型预览版Qwen3.5-Max-Preview首度亮相,斩获1464分,超越了GPT5.4、Grok4.1等海外模型,以及豆包2.0、GLM5、Kimi2.5等全部国产模型。有消息称,Qwen3.5-Max正式版或将于近期发布,能力还将继续进化升级。
(2) LMArena是由国际开源研究机构LMSYS组织的第三方大模型评测平台,采用模型两两匿名对战、由全球开发者进行盲测投票的方式形成模型分数与排名,由于采用开放式对战与人工评估相结合的方式,该榜单被业界视为当前最具参考价值的大模型性能评测之一。
(3) 在本次评测中,Qwen3.5-Max-Preview在没有风格控制的绝对胜率比拼中整体性能排名全球第六,在细分任务层面,该模型的数学能力排名全球第五,专家级文本处理能力排名全球第十。此次亮相是千问3.5系列首次以旗舰级模型身份参与国际第三方评测。
(4) 此外,LMArena基于各公司最强模型对全球大模型机构进行排名,5家中国公司闯入前十,阿里位列全球前五、中国第一,字节、智谱、月之暗面、百度等也闯入全球前十。
编辑回复