2026-03-20 10:17:16
汇通财经APP讯——【阿里千问3.5旗舰预览版亮相,登顶LMArena榜单位列中国第一】
(1) 全球知名的大模型盲测榜单LMArena更新了新一期排名,阿里巴巴千问最新旗舰模型预览版Qwen3.5-Max-Preview首度亮相,斩获1464分,超越了GPT5.4、Grok4.1等海外模型,以及豆包2.0、GLM5、Kimi2.5等全部国产模型。有消息称,Qwen3.5-Max正式版或将于近期发布,能力还将继续进化升级。
(2) LMArena是由国际开源研究机构LMSYS组织的第三方大模型评测平台,采用模型两两匿名对战、由全球开发者进行盲测投票的方式形成模型分数与排名,由于采用开放式对战与人工评估相结合的方式,该榜单被业界视为当前最具参考价值的大模型性能评测之一。
(3) 在本次评测中,Qwen3.5-Max-Preview在没有风格控制的绝对胜率比拼中整体性能排名全球第六,在细分任务层面,该模型的数学能力排名全球第五,专家级文本处理能力排名全球第十。此次亮相是千问3.5系列首次以旗舰级模型身份参与国际第三方评测。
(4) 此外,LMArena基于各公司最强模型对全球大模型机构进行排名,5家中国公司闯入前十,阿里位列全球前五、中国第一,字节、智谱、月之暗面、百度等也闯入全球前十。
(1) 全球知名的大模型盲测榜单LMArena更新了新一期排名,阿里巴巴千问最新旗舰模型预览版Qwen3.5-Max-Preview首度亮相,斩获1464分,超越了GPT5.4、Grok4.1等海外模型,以及豆包2.0、GLM5、Kimi2.5等全部国产模型。有消息称,Qwen3.5-Max正式版或将于近期发布,能力还将继续进化升级。
(2) LMArena是由国际开源研究机构LMSYS组织的第三方大模型评测平台,采用模型两两匿名对战、由全球开发者进行盲测投票的方式形成模型分数与排名,由于采用开放式对战与人工评估相结合的方式,该榜单被业界视为当前最具参考价值的大模型性能评测之一。
(3) 在本次评测中,Qwen3.5-Max-Preview在没有风格控制的绝对胜率比拼中整体性能排名全球第六,在细分任务层面,该模型的数学能力排名全球第五,专家级文本处理能力排名全球第十。此次亮相是千问3.5系列首次以旗舰级模型身份参与国际第三方评测。
(4) 此外,LMArena基于各公司最强模型对全球大模型机构进行排名,5家中国公司闯入前十,阿里位列全球前五、中国第一,字节、智谱、月之暗面、百度等也闯入全球前十。
-
沐涵
巴菲特不是你爷爷,会真心传授你武功秘籍的永远是你亲爷爷,常在市场混,别忘记回归常识。
篇数: 71099 粉丝: 285
行情
| 美元指数 | 99.52 | 0.33 | 0.33% |
| 欧元美元 | 1.1555 | -0.0034 | -0.29% |
| 英镑美元 | 1.3366 | -0.0064 | -0.47% |
| 美元日元 | 158.87 | 1.18 | 0.75% |
| 美元人民币 | 6.8987 | -0.0042 | -0.06% |
点击排行 48小时
- 黄金交易提醒:金价暴跌近4%!伊朗大战升级+美联储“鹰”味浓厚,避险神话崩塌?
- 黄金回调不要紧?机构仍看好多头?华尔街与市场对赌开始
- 美联储维持利率不变:点阵图上调通胀与长期利率预期,首次明确提及中东冲突
- 3月19日财经早餐:美联储维稳利率,金价下挫决战4800关口,供应中断风险急剧升级,油价上涨近3%
- 黄金急跌是陷阱还是机会?四大核心逻辑揭示“打折”时刻已至
- 黄金交易提醒:金价狂泻3.5%录七连阴!中东石油战火点燃全球通胀猛兽,黄金多头紧急大逃亡?
- 战火未熄,金、油价却跪了,市场在交易通胀还是自发恐慌
- 美国紧急划红线 伊朗给台阶 金油或酝酿反弹
- 黄金狂吐6%!为啥?避险逻辑遭双杀
- 美国通胀数据超预期飙升,黄金和白银价格大幅下跌







沪公网安备 31010702001056号