BrowseComp: a benchmark for browsing agents

OpenAI Blog · Apr 10, 2025

OpenAI releases BrowseComp benchmark for evaluating AI agents' performance on complex multi-step web browsing tasks.

Categories: Research

Excerpt

BrowseComp: a benchmark for browsing agents.

Read at source: https://openai.com/index/browsecomp