游戏百科

AI玩王者荣耀锻炼思考决策大模型开始打王者荣耀让大语言模型（LLM）玩《王者荣耀

2025-09-02 12:12:07 量子位看科技科技

AI玩王者荣耀锻炼思考决策大模型开始打王者荣耀

让大语言模型（LLM）玩《王者荣耀》，能训练AI思考和决策能力？

训练输入是一段JSON格式的游戏状态，输出是一条“宏操作”（比如推塔、防守），再附一句解释。

就是靠着这种“边玩边学”的训练方式，让仅14B参数的Qwen-3-14B，超越了671B的Deepseek-R1，动作精准度高达90.91%！

阅读：1 点赞：0