詹皇比肩乔丹!如何防住他?这是 AI 给出的回答

编者按:本文来自于微信公众号 “量子位”(微信公众号:QbitAI), 动点科技经授权发布。

“詹皇32+13+7比肩乔丹”。

这是腾讯体育给出的评价。今天上午,依靠詹姆斯关键时刻的发挥,NBA季后赛骑士104-100险胜步行者,将总比分扳成2-2平。

图片引自新浪体育

此战之后,詹姆斯职业生涯季后赛30+得分来到了100次,排名NBA历史第二位,仅次于迈克尔-乔丹的109次。

这可是詹皇的第15个赛季了。

没人能想到,33岁的老詹在这一赛季依旧强势打出众多巅峰数据。

不仅拿下了该赛季最高得分2251分,傲视全联盟。还发挥出了近8赛季以来最高场均得分27.5,打破了科比创下职业生涯30000分的年龄记录。逆生长的他体能也爆表,场均上场时间36.9分钟均雄踞全联盟榜首。

面对进攻力Almost Max的詹皇,连联盟防守第一的凯尔特人都瑟瑟发抖。

2月11号,节末的波士顿下起了三分雨。即使是在凯尔特人的主场,也无法阻挡骑士疯狂的进攻。单防,是防不住詹皇的,但包夹的结果也并不好看。

第一节7:54,出现老詹单场最燃的强攻。对位昔日战友欧文,老詹在快速带球突破欧文后,居然面临绿军4!人!协!防!但,就这样的阵仗,都还是没有封住詹皇。

34s 漏防;3:09 犯规;6:45 协防到位依旧失分

“詹姆斯的进攻能力越来越强了。我觉得,怎么提高我们的防守水平是一个需要我们好好思考的问题。”绿军主帅坦言。

凯尔特人教练 Brad Stevens 有点方

如何提高?那夹守策略的研究可以指望AI吗?

可以。

Maybe强化学习可以

近期MIT斯隆体育分析大会上,密歇根大学的研究团队研究了一下如何用强化学习建个模型来寻找最佳包夹战略。

于是就有了介篇论文↓

作者声称:这是史上第一篇用强化学习研究NBA防守策略的论文。

论文里采用的训练集是近三季以来的NBA录像,用到了64万多个持球片段。按道理说,只要反复撸那些包夹表现完美的片段,理论上可以总结一套最佳的包夹战略:)嗯对,理论上。

看看具体咋操作的呗。

告诉机器啥是包夹

首先,把NBA的录像分割成可分析的持球片段:从所有的球员都过了半场那一刻开始,到进攻时限重新开始计算截止。

再把这些持球片段按秒切开,每一秒防守方都要考虑什么时候包夹、留哪个空位风险最低、以及根据场上局势迅速预判包夹的收益有多大。

然后用一个简单的分类器系统,判断上述切分好的片段中是否存在包夹行为。

若持球人的附近,即一定距离的半径范围内有两个人防守(图2.a),且这个状态持续至少两秒以上,那么初步判定为包夹。

不过,要是有一个防守的人同时出现在两个进攻队员有效的防守半径内,那这种情况就不算是包夹(图2b)。

从图2c可以看出,这个自动判断包夹的分类模型还算靠谱,效果比人类标注员的分歧要少得多。

经统计,64万个持球录像片段中,只有4.8%被判定为包夹。把这4.8%挑出来,再按结果分个类。

按得失分类

包夹最好的结果是能遏制对方进球抢断后得分,但不是每次都能表现如此完美。根据包夹后的得分(or 失分)情况,可分成6类:得/失2分,得/失3分,犯规,失误。

分析之后发现,进攻力很强的球员被包夹之后,进球难度加大,2分/3分的得分率都降低了一丢丢,这说明包夹可以起到一定的压制效果。

但2分失分率、犯规率明显升高,都是防守方选择包夹是要面临的风险。不仅会更容易犯规,也给了对方空位投篮的机会。

预处理数据,给包夹效果打分

机器筛出表现不错的包夹片段后,进一步数据按秒切好。然后转成直观的运动轨迹(Court Image)⤵

一秒内所有球员 + 球的移动轨迹

除了运动轨迹信息,判断要不要包夹某个球员的必要信息还有对方的身高、体重啥的,所以输入的数据还需要其他非空间的特征值(flat features)。

可视化的球员运动轨迹交给卷积网络(ConvNet)去提取视觉上的特征,至于非空间特征值则交给全连接网络(FC Net)处理,最后输出Q值,相当于是给包夹效果打个分。

Q值仅为每种实际状态下对可能的行为打分。

而这整个强化学习的网络,叫Nothing But Net,简称NBNet。

控制变量训练RL模型

为了尽可能客观地还原不同防守策略的效果,要控制进攻方这个变量。

因此,进攻方的数据选了进攻力接近Max的老詹所在的球队,骑士。从中翻出那些对家防得还不错的瞬间,总结一下。

骑士的2万多个持球片段,总共分三部分:70%训练用,10%做验证,最后留20%待评估。经训练后的RL模型会对待测片段作出是否应该进行包夹的预测。

等到NBNet模型训练得差不多了——预测包夹的结果(29.29%)比较接近真实情况(33.92%)时,研究团队就让模型进入实战,分析之前筛好的包夹片段。

结果发现,模型输出的Q值越大,被包夹的一方得分越低,这说明该轮防守效果越好。

那么问题来了:在所有对战骑士的球队里,哪个球队的Q值最大?

防骑士,公牛No.1

马尔卡宁还抢断过詹皇,芬兰小哥哥大有前途

NBNet按各球队以往数据打分,发现Q值最大的是公牛队。今年常规赛上公牛防骑士的表现也可圈可点。

包夹,还是不包夹?

除了最强防守队,NBNet分析完一圈骑士的数据后,还给了个的夹防建议:

最不该包夹的人就素詹皇(捂住脸.gif)。

上图里的蓝柱,指的是实际比赛中某球员被包夹的比例,而橙柱是模型建议的比例。红框的数据显示,詹皇持球时,对家包夹的比例接近25%,由此可见防守方内心的焦灼。不过模型建议,夹防的比例得降至15%,否则得不偿失。

除了詹皇,像进攻力很强的明星球员欧文、汤普森也最好少夹,漏防反而给对方空位投球的机会(哎,模型宝宝都不知道欧文不在骑士了,sad)。

此外,NBNet还给了最违反直觉的建议:夹防时,最好不要漏防弱侧底线。不然到时空位一旦拿球补防完全来不及。

橙点是持球人,墨蓝区为空位

相反,可以优先考虑留空上图右边那两坨墨蓝区的人,这样协防起来相对没那么费力。

OMT

虽然詹皇势如破竹,但这季常规赛骑士打得十分艰难,今年屈以东部第四攻进季后赛。这可是詹皇回归骑士第4年来获得最差的常规赛排名。

防守端无太多层次,进攻端又严重依赖詹皇。骑士能在季后赛走多远,还真不好说。

詹皇打得好辛苦>_<

最后,附论文:

https://arxiv.org/abs/1803.02940

及代码:

https://github.com/igfox/AdvantageOfDoubling