セイバーメトリクスがもたらしたもの、そして「もたらせていないもの」について

このブログを始めて3か月以上たってから、ブログを始めた理由を述べるのはいささか気が引けるが、自分なりのセイバーメトリクスに対する見方と併せて申し述べることにしたい。

やっぱり野球が好き

ブログを始めたきっかけは、新型コロナウィルスの感染拡大に伴い、NPBMLBも開幕が遅れ、高校野球の甲子園大会も中止になるなど、野球ロスになったことである。野球がない日々の中で、改めて野球に対する自分なりの思いや価値観を整理してみようと思い至った。

野球場やテレビの前で声を枯らして応援するのも野球の見方だし、「ど○ばやし選手や、もり○た投手ってイケメンだよね」というカープ女子的な目線も立派な応援の仕方だと思う。ただ、そういう熱量の籠ったトークは、野球場や居酒屋で交すのが楽しいのであって、ブログのような文字情報でその熱感を誰かに伝えるだけの文章表現力は、自分にはない。そこで、データで野球を見つめ直すことを通じ、自分自身の野球観の偏りに最低限のブレーキをかけると同時に、客観性を装いながらカープへの期待と魅力を訴求できないかと思った次第である。

野球はデータ分析に馴染むスポーツ

さて、データ分析を始めると、野球が改めてデータ分析に馴染む競技であることを強く感じる。昔どこかで聞いたことがある話なのだが、データ分析に馴染む要素は、①試合数の多さ(サンプルを多く得られるため)、②ある程度の得点数(統計的分析は特に、どのプレーがどの程度得失点と結びついているか、という相関関係をみる上で有効なため)、③セットプレーの多さ(サンプルを特定しやすくなるため)の3点だそうで、野球はこの3要素をいずれも満たしている

データ分析の日米格差

また、米国人がいかに統計分析好きかという思いも新たにした。MLBの方が、MLB公式ウェブサイトに加え在野のデータ分析業者(baseball referenceなど)による統計が充実しており、テレビ中継でも米国の方が、セイバーメトリクス指標が紹介される頻度が高いように思う。

ただ、こうしたセイバーメトリクスの普及度にかかる日米格差は、ファンの統計分析に対する好悪だけが理由ではないと思っている。セイバーメトリクスが最も馴染むのはトレードやFAなどでの戦力補強や選手の年俸査定などの領域であり、例えば、セイバーメトリクスを有名にした映画「マネーボール」の主人公もアスレチックスのGMであった。これに対し、監督の采配(試合ごとの具体的な作戦立案)に関していうと、斉藤隆さんが指摘されているように、また、後から述べるとおり、セイバーメトリクスの有用性には限りがある

筆者を含むファンの多くは、野球場や居酒屋にいくと、いつしか勝手に監督かGMの気分になって、「ここは、こういう作戦でいくべきではないか」とか「このポジションをもっと補強すべきではないか」と語るのを楽しんでいる部分がある。しかるに、NPBの場合、MLBに比べ、FAやトレードなどの選手の「流通市場」が限定的なため、ファンが「GM気分」になることは難しいし、本当のGMもデータ分析の果実を戦力編成に役立てられる余地がある程度限られてしまっている。

それでもセイバーメトリクスは、多くのものを日本球界にもたらしてくれたし、有用だと考える。

セイバーメトリクスがもたらしたもの

セイバーメトリクスは、得失点に繋がり易いプレースタイルの解明に大きく貢献した。打者であれば打率もさることながら、四球を含む出塁率の高さと、そして何より長打力の高さの重要性を明確化した。それに、判で押したような送りバントが無意味であることを発見した。ゴロ打球よりライナー(などのフライ)打球の方が安打になり易いことも解明した。盗塁は6~7割以上の成功率がないと損であることを明らかにした。アウトカウントが多く塁を次打者の打率が低いケースを除き、敬遠の効用に限りがあることも説明した。投手については、奪三振率の高さと被本塁打率・与四死球率の低さが最も重要であることを打ち出した。

また、得失点と勝利数との関係性についても傾向を導き出した。特に日本では「野球は投手中心」という観念が必要以上に強いが、ピタゴラス勝率に表されているように、得点力が勝利に寄与する度合いが相当に高いことを明らかにした。リーグ戦を通じ「10得点をとること(ないし10失点を防ぐこと)で1勝」という、得失点と勝利との一般的な関係性を示すことにも成功した。

・・なんと、多くの発見をもたらしてくれたことか!

そもそも野球の伝統的な指標は、百年以上前に、しかも野球の黎明期に開発されたものが多いため、得失点への寄与度の高さを正確に表している保証などどこにもない。思い込みを排除して、どのようなプレーがどの程度の確率で得失点に繋がるか、現代的、客観的に説明できるようになったことは、ファンにとっても、選手や球団のフロントにとっても有用な科学の進歩に他ならない。

セイバーメトリクスがもたらせていないもの

とはいえ、セイバーメトリクスは万能ではない。セイバーメトリクスが「もたらしたもの」については、多くの書籍やウェブサイトで説明されているが、「もたらせていないもの」については、あまり論じられることがない。この点、筆者の思うところを述べると、以下のとおりである。

(1)局面ごとの個別の状況に即した采配・プレー判断には馴染まない。また、選手の心理面への影響も捨象されているセイバーメトリクスはどこまでいっても統計分析なので、対戦チームの心理面への影響や、心理的揺さぶりが奏功した場合の守備体制や打撃姿勢への影響など、データ化されない、ないし個別性が強過ぎてデータ処理に馴染まない要素は捨象されている。また、相手チームの選手の心理だけでなく、自チームの選手についても「四番打者を任されることの重圧や矜持」や「この場面で起用される(ないし交代させられる)ことの選手のモチベーションへの影響」といった定量化困難な要素は一切勘案されない。

時々勘違いされているように思うが、セイバーメトリクスの「送りバントの有効性は低い」という評価は、一般的な傾向を述べているに過ぎず、状況次第で有効な場合があることまでは否定していない。つまり、セイバーメトリクスは一般的傾向として成功確率の高い作戦を導くことは(ある程度)できるが、個別の状況ごとに最適の作戦が何か、については何も語ってくれない

(2)(1)の言い換えに過ぎないかもしれないが、監督やコーチなど首脳陣の評価には使えない。監督の役割は、大きく①チームを束ねるマネジャーとしての側面と、②選手の起用や采配などの作戦立案を行うコマンダーとしての側面があるが、このうち①については、選手の皆に対し「監督への求心力があるか」と尋ね回りでもしない限り、外部の人間には分からないことだ。また、②の作戦立案についても、上述(1)のとおり、セイバーメトリクスで個別の采配の巧拙を語ることは難しい。もとより、作戦の成否について、采配の良し悪しと選手のプレーの巧拙のいずれの寄与度が大きいのか、データだけから客観的に判別することは難しいとも言える。

(3)レベルや質の異なるリーグ間での比較には使えない。例えば、外国人選手のNPBでの成績と米マイナーリーグでの成績の相関は多くの指標において低いNPBの中でも、ファームでの成績と一軍昇格後の成績の相関はあまり高くない。そのため、ファームの選手のうち誰を優先して一軍に昇格させるかは、データ化されていない経験や勘に拠るところが大きいと思われる。外国人選手の獲得についてはいつも各球団首脳の悩みどころだろう。実際、以前の記事で述べたとおり、せっかく獲得してもNPBで十分な活躍ができずに終わる選手は少なくない。

(4)あと、あまり言われないことだが、セイバーメトリクスの最大の得意領域は「プレーと得失点との相関」であり、本来、究極の目的関数であるべき「プレーと勝利との相関」について、「プレーと得失点」⇔「得失点と勝利」という具合に「得失点」をかませることで論理構成せざるを得ないところに構造的な弱さがあるとみている。

その帰結として、例えば、序盤と終盤、試合の流れの中での勝負所など、場面による「1点の重み」の違いが十分に反映されていないおそれがある。この弱点が最も先鋭的に表れているのが、先発投手と救援投手との評価バランスではないか(以前の記事で紹介した「小松式ドネーション」は、この点に対するある種の問題提起だと思う)。近年、登板場面の難易度の指標化も進んでいるが、精緻化するほどにパラメータの設定者の主観が介在し易くなるなど、この評価バランスのあるべき姿について十分なコンセンサスが得られているとは思えない。

セイバーメトリクスは無用でも万能でもない

上記の「もたらせていないもの」は、新指標の開発や指標の精緻化によって根本解決できる問題ではなく、セイバーメトリクスの本質的な限界に由来していると考えている。セイバーメトリクスは有用だが、その馴染む領域と馴染まない領域の使い分けが重要なのではないか。筆者自身は、統計処理を基本としたセイバーメトリクスは、リーグ全体の一般的な傾向を分析したり、こうした一般的な傾向との対比において、各選手・チームの相対的なパフォーマンス水準を評価するのに適していると考えている。こうした考え方に基づき、このブログでは、野球の歴史の中での投打バランスや作戦思想の変遷など「野球の質」の変化や、チームの戦力分析などを中心に据えている。

私はセイバー厨ではない、むしろアンチでさえある

本日の結論として申し上げておきたいことは「私はデータ分析が好きだが、セイバー厨ではない」ということだ。特に、近年セイバーメトリクスの「学術」研究が、各選手のピュアな能力度(得点や失点防御に対する他の選手の貢献度をいかに統計処理的に取り除いて評価するか)の追究に走り過ぎているのではないか、と憂慮している。1年単位でしか有効でないパラメータを設定したり、業者ごとにブラックボックス化されたアルゴリズムを構築してみたり、という発展の仕方をみるにつけ、それって「誰得?」と思ったりする。特にNPBにおいては選手の移籍市場が限られているし、選手の業績評価(年俸交渉)も、入団時とFA権取得時に有望な(ないし有能な)選手に対する需給バランスが強く働く(ややいびつな)構造になっている。こうした中で、これ以上、ひたすら計算方式の精緻化を追究することが、球団のフロントの戦術という意味でも、各選手の納得度の向上という意味でも、どの程度の限界効用を期待できるのか、疑わしいセイバーメトリクスは、限られたセイバー厨のためのものではなく、裾野の広い野球文化の発展に寄与するものであるべきで、そのためには、いったん立ち止まって、データ分析に馴染む領域、馴染まない領域――セイバーメトリクスという学術的道具の有効領域の外縁――を模索することが大きな課題となっているのではないか。

長い年数をかけて野球の質がどのように変化してっているのかみたり、カープの戦力の強み弱みについて、ファンとしての思いを数値で示したりすることは、ファンとして「かねがね何となく思っていたこと」を定量化・明確化できるすっきり感が得られて楽しい。ただ、そういう確率論を知った上で本当に嬉しいのは、それを超えたところにあるスポーツの意外性であり、カープの選手の躍動である。

文系人間の筆者が綴るこのブログでは、統計分析はせいぜい高校数学レベルだが、分析手法の高度化よりも、どちらかというとデータ分析に馴染む領域、馴染まない領域の境界線をぼんやりと描いていくことを主眼に、可能なデータ分析を提供していきたいと思う。