野球の見方が変わる?セイバーメトリクスとは?
はじめまして、とらです。
五黄の寅年生まれなので、「とら」と名乗ってます。
※タイガースファンではないので、悪しからず。
このブログは雑記ブログなので色々なことを書きますが、 その中で野球についても書こうかと思います。
特にセイバーメトリクスと言われる、データで見る野球について、 自分の勉強も含めて書いていきます。
セイバーメトリクスとは何か?
では早速、本題です。以下はwikipediaより。
セイバーメトリクスとは、野球ライターで野球史研究家・野球統計の専門家でもあるビル・ジェームズによって1970年代に提唱されたもので、アメリカ野球学会の略称SABR(Society for American Baseball Research) と測定基準 (metrics)を組み合わせた造語である。
ジム・アルバート、ジェイ・ベネットが著した『メジャーリーグの数理科学(原題Curve > Ball)』はセイバーメトリクスについてわかりやすく解説している。
セイバーメトリクスとは、簡単に言うと「野球統計学」のことです。
ただ、「セイバー」=「アメリカ野球学会」の略称と知っている人は少ないんじゃないでしょうか。
※僕も初耳でした(汗)
そして、このアメリカ野球学会というのは「野球オタク」の集まりのようなものだったそうですが、
今となってはその野球オタクのおかげで、新しい野球の見方が生まれています。
というのも、セイバーメトリクスではこれまでとは異なる価値観を提供します。
例えば、僕は昔「良いバッター=3割バッター」みたいな考えでしたが、
セイバーメトリクスでは、「打率よりも出塁率のほうが得点との相関が高い」という統計があるそうです。
つまり、「打率3割・出塁率3割のバッターよりも打率2割5分・出塁率3割5分のバッターの方がチームとしては価値が高いと考えられる。」ということです。
「3割バッターよりも選球眼の良い2割バッターの方が重宝される」可能性があるというのは面白いですね。
ただ、やっぱり従来の価値観とは異なりすぎて受け入れてもらえない風潮もあるようです。
よく使われる指標
セイバーメトリクスではたくさんの指標がありますが、その中でもよく使われる指標をまとめます。
得点への貢献度を表すOPS
以下、wikipediaより。
OPS(オプス、オーピーエス)は On-base plus sluggingの略であり、野球において打者を評価する指標の1つ。出塁率と長打率とを足し合わせた値である。
つまり、このような式で計算されます。
OPS=出塁率+長打率
野球に興味がある方でしたら、「たしかに得点に貢献してそうだな」とイメージつきそうです。
このOPSは、打率よりも得点への相関が高いことが知られています。
再びwikipediaより。
2000年から2004年のMLBのデータを基にすると、各指標の得点との相関係数は打率が0.849、出塁率が0.910、長打率が0.913なのに対し、OPSは0.955にも達する。日本でも1980年から2010年のデータで得点と打率との相関係数が0.776なのに対し、OPSとの相関係数は0.941に達している。
メジャーよりも日本の方が打率とOPSの相関係数の差が大きいようですね。
今シーズンのOPSランキングはどうなっているんでしょうか?
得点創出能力を表すwRC+
OPSはチームの得点にどれだけ貢献しているか?と表しますが、
こちらの指標はそのバッターがどれだけ得点を産み出しているか?を表します。
以下、wikipediaより。
wRC+ (Weighted Runs Created Plus)は打者が打席あたりに産み出した得点の傑出度であり、平均的な打者に対する得点力の大きさをパーセンテージで表している
打席あたりのwRCをリーグの平均的な得点力で割った形をしている。
この指標によって、時代を問わず一律の条件でバッターを比較できると言われています。
(王貞治と松井はどっちがすごかったのか?とか?)
どれだけ得点を産み出しているか?なので、やはりホームランバッターが上位のイメージです。
ベーブルースとかバリーボンズが上位に来ます。
今シーズンのNPBだと、G坂本勇人やYs山田哲人あたりが上位に来るんでしょうか?
守備力を評価するUZR
ここまでは攻撃力を評価する指標でしたが、3つめのUZRは守備力を評価する指標です。
野球で守備力ってあまり考えてこなかったです。(エラー数とか?)
ちなみにUZRはUltimate Zone Ratingの略です。(名前強そう)
以下、wikipediaより。
レンジファクター(RF)の欠点を補正するために考案されたゾーンレーティング(ZR)を発展させたもので、「リーグにおける同じ守備位置の平均的な選手が守る場合に比べて、守備でどれだけの失点を防いだか」を表す。
H今宮とL源田はどちらの守備力が高いのか。気になります。
走力を評価するwSBとUBR
「打って」・「守って」と来れば、最後は「走る」ですね。
走力に関する指標です。2つあります。
以下、wikipediaより。
wSB (Weighted Stolen Base Runs)は、野球における平均的な走者と比較して盗塁をする事によって、何得点相当チームに貢献したか、あるいはチームに損失を与えたかを推定するセイバーメトリクス指標である。
アルティメット・ベースランニング(UBR: Ultimate Base Running)は、野球における平均的な走者と比較して盗塁を除く走塁によって、何得点相当チームに貢献したか、あるいはチームに損失を与えたかを推定するセイバーメトリクス指標である。
wSBは盗塁について、UBRは盗塁を除くベースランニングについてを評価します。
スタート遅くても、中盤ぐらいから加速してくる人もいますもんね。
UBRは足の速さ以外にも判断の良さとかも反映されそうなイメージです。
足にスランプは無いと言われるので、大体同じ選手がランクインしてそうですね。
先発投手を評価するQS
ここまでは野手指標でしたが、ここからは投手の指標です。
ひとつ目はメジャーの日本人投手のニュースでよく聞く指標ですね。
以下、wikipediaより。
クオリティ・スタート(Quality Start、QS、「良好な先発」)とは、野球における投手の成績評価項目の1つ。
先発投手が6イニング以上を投げ、かつ3自責点以内に抑えた時に記録される。
NPBだとあまり聞かないのですが、ランキングにすると各チームのエースが並ぶんでしょうか?
G菅野、H千賀?あたりでしょうか。
相対的防御率を表すtRA
ふたつ目は計算式が複雑なのですが、守備力が平均な場合に打球の種類まで加味して計算する公平な防御率といったものでしょうか。
以下、wikipediaより。
グラハム・マカリーは今までDIPSで排除されていたインプレーの打球について、ゴロやフライ等の打球別に分類して評価に加えたtRA (True Runs Allowed)を考案した。
まずLinear Weightsによって各打球の得点価値とアウト期待値を算出し、打球の発生数と掛け合わせる事で平均的な守備力のチームで投げた場合の仮想的な失点とアウト数を計算する。この2つを用いてtRAは以下の式で表される。
tRA=仮想的な失点÷(仮想的なアウト数×27)
=[Σ(各要素の得点価値×各要素の数)]÷[奪三振+Σ(各打球のアウト期待値×各打球の数)]÷27
tRAの計算に含まれる要素は奪三振、与四死球、被本塁打、打球(ゴロ、内野フライ、外野フライ、ライナー)である。 個人的に防御率1点台はゲームの世界だと思っています。
勝利の貢献度を表すWAR
最後の指標は選手の中で、最も勝利に貢献した選手を示す指標です。
以下、wikipediaより。
WARは、Wins Above Replacementという正式名称が示す通り、「そのポジションの代替可能選手(Replacement)に比べてどれだけ勝利数を上積みしたか」を表す指標である[2]。
代替可能選手とは、「平均以下(below average)の実力で、容易に獲得できる(easily obtainable)選手」、すなわち3Aから昇格させたり、ウェーバー経由や後日指名選手(PTBNL)で獲得できる控えレベルの選手を指す。
打者も投手もひっくるめて、良い選手は誰だ?という指標です。
ただし、注意点がある指標です。
wikipediaにもありますが、平均的な野手・先発投手が1年間出場した場合、WARは2.0、 リリーフ投手の場合、WARは0.3程度のようで、実は役割によって不利な選手が出てしまうという点です。
最優秀救援投手賞があるのも、なんだか納得しました。
今シーズンはどうなっているんでしょうか?
有名書籍
最後は野球のデータ分析に関して、勉強になりそうな本についてです。
これから読んでいこうと思っています。
ちなみに、下記のブログを参考にさせてもらっています。
野球好きが統計学を覚える為の学習フローを作ってみました〜解説を添えて
3冊ほど読もうかと検討中です!
まずはじめに:マネーボール
ブラッド・ピット主演で映画にもなりました。 が、見てないので、ちゃんと見ようと思います。(Netflixで見れそう)
その次に:[プロ野球でわかる! ]はじめての統計学
統計の勉強もしてみたいと思っているので、せっかくなら野球のデータではじめたい!
さらにもう一歩:野球×統計は最強のバッテリーである – セイバーメトリクスとトラッキングの世
帯の「ストレートは、全部変化球だった?!」がすでに気になります。。。
まとめ
今後は今シーズンのデータを使いながら、セイバーメトリクスに少しずつ触れていこうと思います。