PandaPRO主题 PandaPRO主题
  • 首页
  • 行情
    • 币种
    • 平台
  • 文章
    • 区块链
    • web3
    • NFT
    • 元宇宙
  • 快讯
  • 专题
  • 问答
  • 百科
首页 › 快讯 › OpenAI发布高难度基准测试BrowseComp,AI上网搜索能力迎战新挑战

OpenAI发布高难度基准测试BrowseComp,AI上网搜索能力迎战新挑战

2025-04-11 07:51:21

本站 4月11日消息,OpenAI已开源全新基准测试BrowseComp,用于评估AI代理在互联网上查找难以获取信息的能力。该测试包含1266个极具挑战性的题目,设计初衷为模拟AI在复杂信息网络中的“在线寻宝”,强调答案难找但易验证。测试中问题涵盖影视、科技、历史等多个领域,难度显著高于现有如SimpleQA等测试。

据AIGC开放社区称,这个测试基准非常有难度,连OpenAI自己的GPT-4o、GPT-4.5准确率只有0.6%和0.9%几乎为0,即便使用带浏览器功能的GPT-4o也只有1.9%。但OpenAI最新发布的Agent模型Deep Research准确率高达51.5%。

Coinbase正式上线Wayfinder(PROMPT)代币
上一篇
美股三大股指全线重挫,特斯拉暴跌逾7%拖累市场
下一篇

推荐标签

Facebook
  • Copyright © 2023 币视界. 京ICP备11000001号
免责声明:本网站提供的所有内容均来自第三方平台和用户,对于网站内容不进行任何保证。所提供的区块链数据和其他资料仅供用户学习和研究使用,不构成投资或法律建议。用户和其他平台发布的内容由个人负责,与本网站无关。使用本网站信息需谨慎,自行承担风险。建议您对内容进行研究、审查和验证。
小伙伴们: 币视界 血液透析管理系统 bitget
  • 首页
  • 行情
    • 币种
    • 平台
  • 文章
    • 区块链
    • web3
    • NFT
    • 元宇宙
  • 快讯
  • 专题
  • 问答
  • 百科