WGSR-Bench
Search models,datasets
Home Datasets assessment centre 中   EN
WGSR-Bench: Wargame-based Game-theoretic Strategic
Reasoning Benchmarkfor Large Language Models

人机综合表现对比分析

📊 综合排名对比

排名 参与者 类型 综合得分 风险回报识别 策略倾向预测
高风险 低风险 长期回报 短期回报 高风险 低风险 长期回报 短期回报

各维度能力雷达图

细分能力表现

人类与AI在不同分析复杂度上的表现差异