2025-04-11 04:33:47
汇通财经APP讯——今日凌晨 2 点 OpenAI 开源了用于智能体浏览器功能测试的基准 BrowseComp,该测试基准难度很大,OpenAI 自家的 GPT-4o、GPT-4.5 准确率仅 0.6%和 0.9%近乎为 0,即便是带浏览器功能的 GPT-4o 也仅 1.9%,但 OpenAI 最新发布的 Agent 模型 Deep Research 准确率达 51.5%,在自主搜索、信息整合、准确性校准方面表现非常优秀(AIGC 开放社区)。

下载汇通财经APP,全球资讯一手掌握

下载易汇通电脑版行情软件

精选文章

行情

美元指数 99.46 0.24 0.24%
欧元美元 1.1363 -0.0022 -0.2%
英镑美元 1.3361 -0.0046 -0.34%
美元日元 143.09 0.76 0.54%
美元人民币 7.2660 -0.0055 -0.08%
现货黄金 3275.61 -41.45 -1.25%
现货白银 32.201 -0.704 -2.14%
美原油 59.89 -0.53 -0.88%
澳元美元 0.6390 0.0007 0.11%
美元加元 1.3835 0.0004 0.03%
恒生指数 22119.4 111.3 0.51%
日经225 36045.38 205.39 0.57%
英国FT 8478.90 15.44 0.18%
德国DAX 22570.46 144.63 0.64%
标普500 5560.82 32.07 0.58%
}