WGSR-Bench
Search models,datasets
Home
Datasets
assessment centre
中 EN
WGSR-Bench: Wargame-based Game-theoretic Strategic
Reasoning Benchmarkfor Large Language Models
MM-SA-Bench
PGG-Bench
PsyR-OM-Bench
人机综合表现对比分析
📊 综合排名对比
排名
参与者
类型
综合得分
非合作博弈
不完全信息
序贯博弈
联盟合作
各维度能力雷达图
六大核心能力表现
人类与AI在不同分析复杂度上的表现差异