当前位置:首页 >
  • 大模型实时打《街霸》捉对PK,GPT-4居然不敌3.5,新型Benchmark

    梦晨 发自 凹非寺量子位 | 公众号 QbitAI让大模型直接操纵格斗游戏《街霸》里的角色,捉对PK,谁更能打?GitHub上一种你没有见过的船新Benchmark火了。与llmsys大模型竞技场中,两个大模型分别输出答案,再由人类评分不同——街霸Bench引入了两个AI之间的交互,且由游戏引擎中

    admin 发布时间:2024-09-20 00:50:58