WGSR-Bench
Search models,datasets
Home
Datasets
assessment centre
中 EN
WGSR-Bench: Wargame-based Game-theoretic Strategic
Reasoning Benchmarkfor Large Language Models
MM-SA-Bench
PGG-Bench
PsyR-OM-Bench
人机综合表现对比分析
📊 综合排名对比
排名
参与者
类型
综合得分
风险回报识别
策略倾向预测
高风险
低风险
长期回报
短期回报
高风险
低风险
长期回报
短期回报
各维度能力雷达图
细分能力表现
人类与AI在不同分析复杂度上的表现差异