您的位置: 首页 > 基线 >

OpenAI宣布推出AI Agent评测基准PaperBench

【OpenAI宣布推出AI Agent评测基准PaperBench】财联社4月3日电,美国开放人工智能研究中心(OpenAI)当地时间4月2日宣布推出PaperBench——一个评估AI智能体复现前沿AI研究能力的基准。智能体需从零开始复现20篇ICML 2024 Spotlight和Oral论文,