OpenAI推出GDPval基准测试:GPT-5与Claude已接近人类专业水准

据悉,OpenAI近日发布了一项名为GDPval的新型基准测试,用于评估其AI模型在各行各业与人类专业人士的工作表现差距。这一测试被视为衡量AI距离实现通用人工