363050.com

IM电竞官网分类

IM电竞官网

电竞博彩

当前位置：首页 > IM电竞官网 > 电竞博彩

IM电竞官网 - 专业电竞投注平台注册登录送体验金这个赛车AI不再只图一时爽学会了考虑长远策略发布日期：2026-02-24 浏览次数：

　　IM电竞,IM电竞官网,IM电竞注册,电竞投注平台,电竞博彩,英雄联盟竞猜

IM电竞官网 - 专业电竞投注平台注册登录送体验金这个赛车AI不再只图一时爽学会了考虑长远策略

　　比如这位只擅长转弯的“偏科”选手，面对急弯我重拳出击，惊险漂移，面对直线我唯唯诺诺，摇晃不停：

　　训练赛道来自一款叫做《赛道狂飙》（Trackmania）的游戏，以可深度定制的赛道编辑器闻名于玩家群体。

　　为了更大程度上激发赛车AI的潜力，开发者自制了这样一张九曲十八弯的魔鬼地图：

　　模型包含了16个输入，包括如汽车当前速度、加速度、路段位置等等，再通过神经网络对输入参数进行分析，最终输出6种动作中的一种：

　　通过多次迭代，不同AI的神经网络会出现细微的差别，结果最好的AI将最终脱颖而出。

　　这次，时隔两年后的赛车AI，不仅学会了从长远出发制定策略（比如在急弯时对速度作出调整），还大幅提高了对新地图的适应性。

　　这种方法的核心概念是“奖励”，即通过选择带来更多奖励的行为，来不断优化最终效果。

　　在训练赛车游戏中的AI时，yoshtm定义的奖励很常规：速度越快奖励越多，走错路或掉下赛道就会惩罚。

　　Deep Q Learning会通过深度网络参数的学习不断提高Q值预测的准确性，也就是说，能够使AI在赛车游戏中预测每个可能的行动的预期累积奖励，从而“具备一种长远的策略目光”。

　　yoshtm的思路是，AI会先通过随机探索来尽可能多地收集地图数据，他将这一行为称之为探索。

　　探索的比例越高，随机性也就越强，而随着比例降低，AI则会更加专注于赢取上述设置的奖励，也即专注于跑图。

　　由于前期经历了多个弯道的跑图，所以AI出现了过拟合现象，面对长直线跑道这种新的赛道类型，一度车身不稳，摇摇晃晃，最终甚至选择了“自杀”：

　　每次开始训练时，AI的出发点都将在地图上的一个随机位置生成，同时速度和方向也会随机。

　　接下来就是进行不断训练，最终，开发者yoshtm和AI比了一场，AI在这次跑到了最好成绩：6分20秒。

　　本文为澎湃号作者或机构在澎湃新闻上传并发布，仅代表该作者或机构观点，不代表澎湃新闻的观点或立场，澎湃新闻仅提供信息发布平台。申请澎湃号请用电脑访问。