TED日本語 - ラジブ・マヒシュワラン: バスケットボールの激しい動きの背後にある数学


TED Talks(英語 日本語字幕付き動画)

TED日本語 - ラジブ・マヒシュワラン: バスケットボールの激しい動きの背後にある数学

TED Talks


The math behind basketball's wildest moves


Rajiv Maheswaran




My colleagues and I are fascinated by the science of moving dots. So what are these dots? Well, it's all of us. And we're moving in our homes, in our offices, as we shop and travel throughout our cities and around the world. And wouldn't it be great if we could understand all this movement? If we could find patterns and meaning and insight in it. And luckily for us, we live in a time where we're incredibly good at capturing information about ourselves. So whether it's through sensors or videos, or apps, we can track our movement with incredibly fine detail.

So it turns out one of the places where we have the best data about movement is sports. So whether it's basketball or baseball, or football or the other football, we're instrumenting our stadiums and our players to track their movements every fraction of a second. So what we're doing is turning our athletes into -- you probably guessed it -- moving dots.

So we've got mountains of moving dots and like most raw data, it's hard to deal with and not that interesting. But there are things that, for example, basketball coaches want to know. And the problem is they can't know them because they'd have to watch every second of every game, remember it and process it. And a person can't do that, but a machine can. The problem is a machine can't see the game with the eye of a coach. At least they couldn't until now. So what have we taught the machine to see?

So, we started simply. We taught it things like passes, shots and rebounds. Things that most casual fans would know. And then we moved on to things slightly more complicated. Events like post-ups, and pick-and-rolls, and isolations. And if you don't know them, that's okay. Most casual players probably do. Now, we've gotten to a point where today, the machine understands complex events like down screens and wide pins. Basically things only professionals know. So we have taught a machine to see with the eyes of a coach.

So how have we been able to do this? If I asked a coach to describe something like a pick-and-roll, they would give me a description, and if I encoded that as an algorithm, it would be terrible. The pick-and-roll happens to be this dance in basketball between four players,two on offense and two on defense. And here's kind of how it goes. So there's the guy on offense without the ball the ball and he goes next to the guy guarding the guy with the ball, and he kind of stays there and they both move and stuff happens, and ta-da, it's a pick-and-roll.


So that is also an example of a terrible algorithm. So, if the player who's the interferer -- he's called the screener -- goes close by, but he doesn't stop, it's probably not a pick-and-roll. Or if he does stop, but he doesn't stop close enough, it's probably not a pick-and-roll. Or, if he does go close by and he does stop but they do it under the basket, it's probably not a pick-and-roll. Or I could be wrong, they could all be pick-and-rolls. It really depends on the exact timing, the distances, the locations, and that's what makes it hard. So, luckily, with machine learning, we can go beyond our own ability to describe the things we know.

So how does this work? Well, it's by example. So we go to the machine and say, "Good morning, machine. Here are some pick-and-rolls, and here are some things that are not. Please find a way to tell the difference." And the key to all of this is to find features that enable it to separate. So if I was going to teach it the difference between an apple and orange, I might say, "Why don't you use color or shape?" And the problem that we're solving is, what are those things? What are the key features that let a computer navigate the world of moving dots? So figuring out all these relationships with relative and absolute location, distance, timing, velocities -- that's really the key to the science of moving dots, or as we like to call it, spatiotemporal pattern recognition, in academic vernacular. Because the first thing is, you have to make it sound hard -- because it is.

The key thing is, for NBA coaches, it's not that they want to know whether a pick-and-roll happened or not. It's that they want to know how it happened. And why is it so important to them? So here's a little insight. It turns out in modern basketball, this pick-and-roll is perhaps the most important play. And knowing how to run it, and knowing how to defend it, is basically a key to winning and losing most games. So it turns out that this dance has a great many variations and identifying the variations is really the thing that matters, and that's why we need this to be really, really good.

So, here's an example. There are two offensive and two defensive players, getting ready to do the pick-and-roll dance. So the guy with ball can either take, or he can reject. His teammate can either roll or pop. The guy guarding the ball can either go over or under. His teammate can either show or play up to touch, or play soft and together they can either switch or blitz and I didn't know most of these things when I started and it would be lovely if everybody moved according to those arrows. It would make our lives a lot easier, but it turns out movement is very messy. People wiggle a lot and getting these variations identified with very high accuracy, both in precision and recall, is tough because that's what it takes to get a professional coach to believe in you. And despite all the difficulties with the right spatiotemporal features we have been able to do that.

Coaches trust our ability of our machine to identify these variations. We're at the point where almost every single contender for an NBA championship this year is using our software, which is built on a machine that understands the moving dots of basketball. So not only that, we have given advice that has changed strategies that have helped teams win very important games, and it's very exciting because you have coaches who've been in the league for 30 years that are willing to take advice from a machine. And it's very exciting, it's much more than the pick-and-roll. Our computer started out with simple things and learned more and more complex things and now it knows so many things. Frankly, I don't understand much of what it does, and while it's not that special to be smarter than me, we were wondering, can a machine know more than a coach? Can it know more than person could know? And it turns out the answer is yes.

The coaches want players to take good shots. So if I'm standing near the basket and there's nobody near me, it's a good shot. If I'm standing far away surrounded by defenders, that's generally a bad shot. But we never knew how good "good" was, or how bad "bad" was quantitatively. Until now.

So what we can do, again, using spatiotemporal features, we looked at every shot. We can see: Where is the shot? What's the angle to the basket? Where are the defenders standing? What are their distances? What are their angles? For multiple defenders, we can look at how the player's moving and predict the shot type. We can look at all their velocities and we can build a model that predicts what is the likelihood that this shot would go in under these circumstances? So why is this important? We can take something that was shooting, which was one thing before, and turn it into two things: the quality of the shot and the quality of the shooter. So here's a bubble chart, because what's TED without a bubble chart?


Those are NBA players. The size is the size of the player and the color is the position. On the x-axis, we have the shot probability. People on the left take difficult shots, on the right, they take easy shots. On the [ y-axis ] is their shooting ability. People who are good are at the top, bad at the bottom. So for example, if there was a player who generally made 47 percent of their shots, that's all you knew before. But today, I can tell you that player takes shots that an average NBA player would make 49 percent of the time, and they are two percent worse. And the reason that's important is that there are lots of 47s out there. And so it's really important to know if the 47 that you're considering giving 100 million dollars to is a good shooter who takes bad shots or a bad shooter who takes good shots. Machine understanding doesn't just change how we look at players, it changes how we look at the game.

So there was this very exciting game a couple of years ago, in the NBA finals. Miami was down by three, there was 20 seconds left. They were about to lose the championship. A gentleman named LeBron James came up and he took a three to tie. He missed. His teammate Chris Bosh got a rebound, passed it to another teammate named Ray Allen. He sank a three. It went into overtime. They won the game. They won the championship. It was one of the most exciting games in basketball. And our ability to know the shot probability for every player at every second, and the likelihood of them getting a rebound at every second can illuminate this moment in a way that we never could before. Now unfortunately, I can't show you that video. But for you, we recreated that moment at our weekly basketball game about 3 weeks ago.


And we recreated the tracking that led to the insights. So, here is us. This is Chinatown in Los Angeles, a park we play at every week, and that's us recreating the Ray Allen moment and all the tracking that's associated with it. So, here's the shot. I'm going to show you that moment and all the insights of that moment. The only difference is, instead of the professional players, it's us, and instead of a professional announcer, it's me. So, bear with me.

Miami. Down three. Twenty seconds left. Jeff brings up the ball. Josh catches, puts up a three!

[ Calculating shot probability ]

[ Shot quality ]

[ Rebound probability ]

Won't go!

[ Rebound probability ]

Rebound, Noel. Back to Daria.

[ Shot quality ]

Her three-pointer -- bang! Tie game with five seconds left. The crowd goes wild.


That's roughly how it happened.



(Applause) That moment had about a nine percent chance of happening in the NBA and we know that and a great many other things. I'm not going to tell you how many times it took us to make that happen.


Okay, I will! It was four.


Way to go, Daria.

But the important thing about that video and the insights we have for every second of every NBA game -- it's not that. It's the fact you don't have to be a professional team to track movement. You do not have to be a professional player to get insights about movement.

In fact, it doesn't even have to be about sports because we're moving everywhere. We're moving in our homes, in our offices, as we shop and we travel throughout our cities and around our world. What will we know? What will we learn? Perhaps, instead of identifying pick-and-rolls, a machine can identify the moment and let me know when my daughter takes her first steps. Which could literally be happening any second now.

Perhaps we can learn to better use our buildings, better plan our cities. I believe that with the development of the science of moving dots, we will move better, we will move smarter, we will move forward.

Thank you very much.


私と研究仲間は 動く点の科学に魅せられています これらの点は何でしょう? 全て我々自身です 我々は家の中 事務所の中を動き回り 街や世界中で 買物や旅行をしています こんな動きを全て理解できたら 素晴らしいと思いませんか? ここにパターン、意味を見出し 洞察することができたら? 幸運なことにも 我々は 自分達自身の情報を実に上手く 取得できる時代に生きています それがセンサー、ビデオ または アプリであろうとも 見事なほど詳細に 動きを追跡することができます

そんな動きを得るのに最適なのが スポーツです バスケ、野球、サッカーやフットサルであれ 競技場に装置を取り付け 選手の動きを1秒にも満たない間隔で 撮影し追跡します そう 我々がやっていることは スポーツ選手を ― 皆さんがご想像されるとおり ― 動く点へと変換することです

他の生データと同様に 膨大な数の動く点を取得します 取り扱いは面倒で 面白い作業ではありません でも選手の動きには 例えばバスケのコーチが 知りたいものが含まれています 問題はコーチが 各ゲームを逐次観察し それを記憶し分析することが 不可能であるということです 1人の人間には不可能であっても 機械になら出来ます 問題は機械がコーチの様な視点を持って ゲームを見ることができないことです いや 少なくとも今までは不可能でした では我々は機械に 何を学習させたのでしょう?

単純な方法で始めました パス、シュートやリバウンドを 教えました バスケファンならご存知ですよね? 次にもう少しだけ複雑なことに 取り組みました ポストアップ、ピックアンドロールや アイソレーションなどです 選手なら大抵知っていることですが ご存じなくても問題ありません そして 今では機械はダウン・スクリーンや ワイド・ピンといったプレイも 把握できるようになりました 基本的に プロだけが知っているプレイです 機械にはコーチの視点で見るように 学習させました

どうやって出来たのでしょう? コーチにピックアンドロールについて 説明を求めれば 解説してくれたことでしょうが それをアルゴリズムに組込むのは 至難の業です ピックアンドロールとは 4人で行う2対2の攻防戦での こういったダンスのような動きです このように動いていきます スクリナー(ディフェンスをガードする選手)が ボールマンのディフェンスの横に行き ずっとガードするのです そして2人が動き こうなります ジャーン! これがピックアンドロールです


アルゴリズム化が困難な例です スクリナーが邪魔をするのですが 近づいても 停止しなければ おそらくピックアンドロールでは ありません 逆に 停止しても 十分に近づかなければ ピックアンドロールとは ならないでしょう 近づいて停止しても リングの下では ピックアンドロールにはならないでしょう 私の間違いで何れも ピックアンドロールかもしれません 正確なタイミング、距離と場所に依存するので 判断を難しくしています 幸いにも機械学習では 我々が知っていることの記述を 我々の限界以上にこなします

どのように? 例をお見せしましょう 機械に向かって言います 「おはよう 機械君 ここにピックアンドロールと そうでないものが あるんだ 違いを見分けてごらん」 この問題を解く鍵は 判別を可能とする特徴を捉えることです りんごとみかんの違いを 学習させるならば 「色と形に注目してみたら?」 と言うことでしょう 我々が解決すべき問題は 違いが何かということです コンピューターが 動く点を追跡する時に 鍵となる特徴とは何でしょうか? 相対的 絶対的な位置、距離、タイミング それに速度といった 全ての情報を把握すること それこそが 動く点の科学の神髄です 「時空パターン認識」という専門用語を 使うのが適切です 初めての言葉ですから 舌を噛むかもしれません こんな言葉ですから

ポイントはNBAのコーチにとっての関心は ピックアンドロールが あったかどうかでは無く どのようにして そのプレイが起きたかということです なぜ 重要なのでしょう? 少し掘り下げてみましょう 現代のバスケットボールでは ピックアンドロールは おそらく最も重要なプレイです どうやって仕掛け これをどうディフェンスするのかで 基本的に多くのゲームで勝敗を左右します だから この動きには 様々なバリエーションがあり バリエーションを理解することが とても重要です ですから この装置がとても重宝します

例をお見せします 2対2の攻防戦で ピックアンドロールをしようとしています ボールマンの動きには テイクとリジェクトがあり スクリナーには ロールとポップがあります 一方ボールマンのディフェンスは オーバーかアンダーをし スクリナーのディフェンスは ショウかアップツータッチかソフトをします またディフェンスが一緒になって スイッチやブリッズをします 始めの頃は こういったことについて 知りませんでした このような矢印通りに動いてくれれば簡単で 理解しやすいことでしょう でも実際の動きはとても複雑です 選手はくねくねと複雑に動くので プレイのバリエーションを 正確に把握すること ― 精度良く プレイを再現することは困難です だから コーチは人間の判断力を 信用することになります 時空パターン認識には このような困難がありますが 我々は解析に成功しました

コーチたちは我々の機械の プレイ認識能力を信頼しています 今年に至っては NBAリーグの ほぼ全てのチームが バスケットボールの動く点を 追跡する機械に搭載された ソフトを利用しています それだけでなく とても大切な試合に勝利するための 戦略変更を 我々はアドバイスすることができました これはとてもワクワクすることです 30年もの間 リーグに在籍してきた コーチたちが 機械による アドバイスを受け入れるのですから ピックアンドロールを超えたことも 素晴らしことです コンピューターは 簡単なことから始め もっともっと複雑なことを学習し 今や多くの事を把握しています 正直言えば 私自身は 学習内容を殆ど理解していませんが 私より賢いなんて 特別なことではありません こう思ったことがあります 機械はコーチを超えられるか? 人間以上に知り得るか? 今や その答えは「イエス」です

コーチはシュートを上手く放つ 選手を欲しがります 私がゴールの近くにいて 近くに誰もいなければ シュートを決めやすく 逆に ゴールから遠く 敵に囲まれていれば シュートを決めるのが難しくなります しかし シュートの良し悪しの程度を 定量的に判断できませんでした 今までは です

ここで時空パターン認識の 再登場です 各シュートを分析しました 調べることは「シュートの場所は? リングとの角度は? ディフェンスの位置は? その距離は? 立っている角度は?」などです 複数のディフェンダーがいる時も 選手の動きを追って シュートのタイプを予測できます 選手の速度から このような状況下で どのようなシュートが放たれるかという 予測モデルを構築できます なぜ これが重要なのでしょう? シュートについて解析してみます かつては一元的なものでしたが 今は2つの因子に分解します シュートの質と シューターの質です このバブル・チャートをご覧ください TEDには不可欠ですよね?


各点はNBAの選手です 点の大きさは選手の大きさ 色はポジションを表しています 横軸は シュートの成功可能性で 左に行けば難易度が上がり 右に行けば難易度が下がります 縦軸は 選手のシュート能力です 上に行くほど良い選手で 下の方は その逆です 例えば 通常47%の確率で シュートを成功させる選手がいるとします 以前なら これが情報の全てです でも今なら NBAの平均的な選手なら 49%の確率で成功させるシュートを この選手は2%低くさせると いうことができます 47%といっても様々な組み合わせが あることが重要です 47%の数字をたたき出す 100億円プレイヤーの獲得を 考えるのならば 難しいシュートを成功させる選手なのか シュートの質は低くても チャンスの高いシュートを放つ 選手なのかは重要な要素です 機械学習では 選手の見方は変わりませんが 試合の見方が変わります

数年前NBAのファイナルで 大いに盛り上がった試合がありました 3点を追うマイアミ 後り時間は20秒 シリーズの敗北が目前でした レブロン・ジェームズという選手が 同点となる3点シュートを放つも 外れました クリス・ボッシュ選手が リバウンドに入り レイ・アレン選手にパス そのアレン選手が 3点シュートを沈め 延長戦に入りました 結局試合に勝利し ファイナルを制しました 史上 もっともエキサイティングな 試合の1つでした 各選手の 各瞬間における シュート成功率や 各瞬間にリバウンドを取る確率が分かると この場面を まったく新しい見方で 捉えられます 残念ながらその時のビデオを お見せできませんが 3週間ほど前に 我々がプレイしている週例の試合の時に 皆さんのために そのプレイを再現しました


分析を行った選手の動きを再現しました これは私たちです ここは毎週プレイしているロスアンジェルスの チャイナタウンにある公園です レイ・アランのあのプレイを 再現しています 全てが あのプレイの 追跡データのとおりです そしてシュート その瞬間と解析結果を お見せします 違いは プロの選手ではなく 私たちであり アナウンスもプロでなく私がしますので 我慢してお付き合いください

3点を追うマイアミ 残り20秒 ジェフのドリブル ジョシュにパスを回し 3点シュート

[ シュート成功率を計算中 ]

[ シュートの質 ]

[ リバウンドの確率 ]


[ リバウンドの確率 ]

ノエルがリバウンドし ダリアにパス

[ シュートの質 ]

3点シュートが決まった! 残り5秒で同点に 観衆は大興奮





(拍手) NBAだったら あれが成功する確率は 9%程度です そういったことを知ることができます このプレイの再現に 何回費やしたかは秘密です


いいですよ お教えます! 4回でした


ダリア お見事!

しかし こんなビデオ映像や NBAの各試合の 各瞬間の分析そのものが 重要だというのではなく 動きを追跡するのに 専門家チームが必要ではなく 動作を解析するのに 専門家である必要がないという事実です

さらには スポーツに限る必要はありません 我々はいつでも どこでも動いています 家の中でも 動いています オフィスでも 買物したり 旅行したり 街の中 世界中を動き回っています 何を知り 何を学べるでしょう? ピックアンドロールの代わりに 機械はおそらく 私の娘が最初の一歩を歩み出すときに 動きを捉え 私に知らせてくれることでしょう 文字通り いつにでも起こりうることです

建物や街のデザインを良くするのにも 利用できるでしょう 動く点の科学を進歩させることによって より良いスマートな動きができるようになり 進歩するものと信じています



― もっと見る ―
― 折りたたむ ―


  • 主語
  • 動詞
  • 助動詞
  • 準動詞
  • 関係詞等