すき間ベイスターズ

他の人が拾わないすき間ネタを求めていった結果、経済系プロ野球ブログの色が濃くなっています。 スポーツナビ+から引っ越して来ました。

伊藤光登録抹消の説明に、ラミレス監督は捕手別防御率という数字を持ち出した。データ重視を公言する割には、データの基本的な取扱いに疑問を感じる。

ラミレス監督は試合後、故障の可能性について否定し「きょう捕手を1人抹消しないといけなかったので、マスクをかぶったときの防御率などを見て、残念ながら彼という決断をした」と抹消理由を説明した。


そこで、バッテリー別防御率を調べて以下のツイートをした。

ラミレス監督に限らず報道でも、「データ」として、球場別や対戦相手別などの数字が挙げられることは多い。しかし、そのような数字の精度にあまりにも無頓着なのが現状だ。

たとえば、エース今永が先発する試合のスタメン捕手は、最近3試合連続で戸柱。というのも、受ける捕手別の成績を見ると、戸柱の時が3戦全勝、防御率2.41。伊藤光の時が4試合1勝2敗、2.52。嶺井の時は1勝0敗、6.00となっているのだ。
正捕手1人は時代遅れ? DeNAラミレス監督は「捕手別投手成績」で徹底使い分け,宮脇広久,フルカウント,2020/08/12

戸柱の2.41と伊藤光の2.52は、差と呼べるようなものではないにも関わらず、そのことにはまったく触れず、ただ数字を並べるだけである。

以前、守備指標UZRの精度と扱いに疑問を持ち、「UZRの信頼区間を試算してみた」を書いた。その中で、
ただ、打率は見慣れているので、信頼区間を求めなくても混乱はほとんどない。

と記し、言及しなかったが防御率も打率同様に多くの人が経験的に精度を理解しているだろうと考えてきた。それを覆す記事を発見し、残念でならない。

残念な記事をこれ以上読みたくないので、防御率の信頼区間の求め方をお伝えする。ざっと検索した限りでは日本語でヒットするものはなかったので、本邦初かもしれない。

まず、扱う数字の性質によって、母平均の推定、あるいは母比率の推定のいずれかを選ぶ必要がある。
防御率式
自責点は投球回の一部ではない。よって、防御率は比率ではない。また、日によって点を取られたりゼロに抑えたりをならした数字が防御率である。平均といってもいいだろう。もう少しいうと、得られるデータによっては加重平均なのだが、深入りしない。

なぜなら、こちらの道には大きな障壁が存在する。投手は1アウトも取れずに降板することがある。分母に0が来てはお手上げである。前後の別のイニングに点を付け替えるなど検討したが、それはもはやデータの改ざんであり、抜本的な解決にはならない。

先ほど日本語でヒットしなかったと書いた通り、英語で検索したらやはり似たようなことを考えた人はいた。

In the end, I decided the simplest solution would be not to find the reliability of ERA, but of runs and earned runs allowed per batter.
訳:
最後に、私は最も単純な方法に行き着いた。防御率の信頼性を求めるのでなく、打者当たりの得点や自責点の信頼性を求めることにした。
A Long-Needed Update on Reliability,Jonah Pemstein,FanGraphs,2016/9/19
つまり、
打者当たり自責点式

こうなると、計算もはるかに簡単になる。先ほど防御率は加重平均であると述べたが、こちらは比率である。対戦した打者のうち、投手責任の走者として生還したものが自責点となる。素直に統計の教科書通りに信頼区間の幅を求め、最後に9イニングあたりに換算すればよい。

防御率信頼区間式


実際に計算してみよう。2019年セ・リーグ防御率ランキングに95%信頼区間を追加した。先発投手で1年間フル稼働しても、±0.5~0.6点くらいの精度にしかならないことがわかる。この範囲内の成績の変動なら、特段に選手の能力に変化がなくても十分に起こり得る。

打者 自責 防御率 95%信頼区間
1:大野 雄大 177 2/3 696 51 2.58 2.01 3.15
2:ジョンソン 156 2/3 650 45 2.59 1.96 3.21
3:今永 昇太 170    684 55 2.91 2.32 3.50
4:山口 俊 170    705 55 2.91 2.31 3.51
5:西 勇輝 172 1/3 702 56 2.92 2.33 3.52
6:青柳 晃洋 143 1/3 601 50 3.14 2.48 3.80
7:大瀬良 大地 173 1/3 712 68 3.53 2.94 4.12
8:柳 裕也 170 2/3 703 67 3.53 2.94 4.13
9:小川 泰弘 159 2/3 686 81 4.57 3.94 5.20

信頼区間の幅は 1/√n に比例する。つまり、サンプル数が4倍になると幅が半分になり、サンプル数が少なくなれば、幅は広くなる。先ほどの記事で紹介された今永・伊藤光バッテリーの防御率の95%信頼区間は、0.86 ~ 4.28 である。何かと比較できるような数字ではない。

データが意味をなすには相応のサンプル数が必要という当然のことを、球団の雇っているデータ分析の専門家が知らないはずはない。それでいて、ラミレスが知らないとすれば、ガバナンスに問題ありだし、知っているならば、取材記者をなめて煙に巻いていることになる。知っていて追及しない記者は転職した方がいい。今まで知らなかった記者がやることは、もう明らかだろうから言わない。


続きを読む
このエントリーをはてなブックマークに追加

多すぎる必須入力項目

前回記事「私がステッカーを辞退した理由」で説明した通り、突撃ヤスアキマイクの質問採用の記念品は辞退した。その検討の過程で申し込みの入力フォームを開いたところ、不可解な点を発見した。

ヤスアキマイク入力フォーム (2)



なぜ記念品を送るために、性別・生年月日の入力が必須なのだろうか。配達トラブルの際に住所以外の連絡先が必要なのはわかるが、最悪twitterアカウントに問い合わせれば済むことで、任意で十分だ。

当然、質問をした。

非常に興味深い反応が返ってきた。ベイスターズ事務局は、個別の入力項目の利用目的の説明を拒み、プライバシーポリシーを読めと言ってきた。以下は利用目的の引用である。
[当社の個人情報利用目的]
当社は、お客様の個人情報を、以下の目的で取得し、利用するものとします。
(1) 会員向けチケット販売、グッズ販売
(2) 会員向けサービス・商品の案内、提供、管理
(3) インターネットを通じた情報提供等のオンラインサービスの提供
(4) 上記1から3に付帯・関連する全ての業務
(5) 球団のサービス・商品等に関するアンケートの実施
(6) 新たなサービス・商品の開発
(7) 各種イベント、キャンペーンの案内及び各種情報の提供
(8) 球団のサービス・商品提供に関する連絡
(9) 球団のスポンサーに関するサービス・商品提供に関する連絡
(10) 問い合わせ、依頼等への対応
(11) ログ情報の収集



私は入力項目の利用目的を尋ねたのだが、なぜか会社全体の個人情報利用目的しか教えてもらえない。無理やりに解釈すれば、本当にここに挙げたことすべてに個人情報を使いまわすのか、そもそも何に利用するか決めてないので会社の業務すべてを包括する目的を挙げてある、こんなところだろうか。当初思っていた記念品発送という単純事務ではなかったらしい。

直接的な回答がもらえていないので、私の理解をぶつけて再確認することにした。

残念ながら、こちらの問いかけとかみ合わない空虚な返事が返ってきた。これ以上質問を重ねても得るものはないだろう。とりあえず、事務局のスタンスは把握できた。


合法といえるのか?

DeNAはITの会社と一般に見なされているし、南場オーナーも突撃ヤスアキマイクでそう語っている。その傘下のベイスターズが、個人情報の取り扱いに無頓着であっていいはずはない。今回の件は、2つの法律に反している疑いがある。一つはもちろん個人情報保護法、もう一つは独占禁止法である。

個人情報保護法の穴
個人情報の保護に関する法律

<<略>>

第十五条 個人情報取扱事業者は、個人情報を取り扱うに当たっては、その利用の目的(以下「利用目的」という。)をできる限り特定しなければならない。


「できる限り」とは、
最終的にどのような事業の用に供され、どのような目的で個人情報を利用されるのかが、本人にとって一般的かつ合理的に想定できる程度に具体的に特定することが望ましい

個人情報保護法ガイドライン(通則編),2018/12/25,個人情報保護委員会

ベイスターズ事務局は、個別の入力項目の利用目的の説明を拒み、プライバシーポリシーを振りかざしてきた。彼らの方向性は目的の特定ではなく、希薄化に向いている。目的外利用で訴えられるのを避けるため、あらゆる目的を場面構わず提示しているに過ぎない。どう考えても、ガイドラインのいう望ましい状態に達していない。

ただ、15条そのものがあいまいで、何がアウトなのか、ガイドラインを読んでもはっきりしない。現状ではこれ単体の違反を責めても、逃げられてしまうだろう。


優越的地位の濫用

第二条

<<略>>

○9 この法律において「不公正な取引方法」とは、次の各号のいずれかに該当する行為をいう。

<<略>>

五 自己の取引上の地位が相手方に優越していることを利用して、正常な商慣習に照らして不当に、次のいずれかに該当する行為をすること。

<<略>>

ハ 取引の相手方からの取引に係る商品の受領を拒み、取引の相手方から取引に係る商品を受領した後当該商品を当該取引の相手方に引き取らせ、取引の相手方に対して取引の対価の支払を遅らせ、若しくはその額を減じ、その他取引の相手方に不利益となるように取引の条件を設定し、若しくは変更し、又は取引を実施すること。


オリジナルステッカーは球団からしか手に入らない、つまり代替手段がない。球団が優越的地位にあることは明らかである。

そして、その受け取りに不要な個人情報の入力を必須項目とし、あいまいな利用目的への同意を迫るのは、独占禁止法第二条第9項の第5号のいう「自己の取引上の地位が相手方に優越していることを利用」した「不公正な取引方法」に他ならない。

公正取引委員会も、「優越的地位の濫用となる行為類型」の一つとして「利用目的の達成に必要な範囲を超えて,消費者の意に反して個人情報を取得すること」を示し、さらに、注で用いた例は今回の件とほとんど一致する。
氏名と紐付いて取得される消費者の性別や職業等といった利用目的の達成に必 
要な範囲を超える個人情報であっても,消費者本人の明示的な同意を得て 
取得する場合は,通常,問題とならない。ただし,消費者が,サービスを 
利用せざるを得ないことから,利用目的の達成に必要な範囲を超える個人 
情報の取得にやむを得ず同意した場合には,当該同意は消費者の意に反す 
るものと判断される場合がある。

(別紙1)デジタル・プラットフォーム事業者と個人情報等を提供する消費者との取引における優越的地位の濫用に関する独占禁止法上の考え方(PDF:46KB),2019/12/17,公正取引委員会

違法行為判定のカギを握るのは同意の有無である。同意すると「通常,」問題とならない。ただし、「やむを得ず」同意した場合は違法と判断される「場合がある」
今回私は同意する前に抗議をしたので、違法行為の立証には十分だろう。


問題の根深さ

今回、こちらの指摘を事務局がまともに受け止めることはなかった。個人情報の取り扱いに何の疑問も持たない様子だった。恐らく、彼らからするとこれが業界の標準であり、特段おかしなことをしている自覚もないのだろう。

また、 私とて利用したいサービスで個人情報を要求されれば、たいていは深く考えることなく応じてきた。たまたま、記念品の受け取りという単純な取引に遭遇したから疑問に思ったに過ぎない。大半の消費者は問題があることすら認識していないだろう。

さらに、疑問を感じたところで消費者側が起こせる行動は限られる。サービスを諦めるか、不本意な取引に同意するかの外れしかない二択である。

そして、ここで同意すれば、サービス提供者には自発的な同意と見なされる。トラブルになっても、彼らは同意を盾にして問題解決に応じないだろう。司法の場に持ち込めば消費者が勝てる「かもしれない」が、消費者が行動を起こすことは滅多にないことを彼らは知っている。

私はステッカーを受け取るつもりがないので、今回の件に関してこれ以上ベイスターズに要求する交渉材料がない。しかし、ベイスターズ公式サイトで個人情報を入力する他の場面でも、同様の問題が潜む可能性は高い。今後も注視していきたい。

このエントリーをはてなブックマークに追加

突撃ヤスアキマイクに質問が採用されたことで、記念品としてオリジナルステッカー贈呈の申し出があった。

 

結論は辞退だ。採用されただけで十分満足であるし、元来物に興味が薄い。とはいえ、ステッカー1枚だが、いろいろ考えさせられた。

 

まず「利益供与」に当たらないか? 私にとってベイスターズはファンとして愛でる対象であると同時に取材対象である。何かを貰うには、慎重さが必要だ。ただでさえ贔屓目という重荷を背負っているのに、この上利益供与という足枷まではめられたら、まともなものは書けなくなってしまう。

 

ステッカーは恐らく高価なものではないし、転売して大金を得られるとか、スーツ仕立て券が同封されているとかしない限り、利益供与にはならないだろう。

 

検討の末、第一の壁、「利益供与」はクリアーしたのだが、次に「匿名」の壁が行く手を阻んだ。

 

「すき間ベイスターズ」は、ここまで匿名で活動してきた。しかし、ステッカーを受け取るには、身元を球団に明かす必要がある。送り先に第三者を指定する手もあるが、他人を煩わせるほどのことでもない。

 

個人情報は目的外に使用しないことになってはいるが、情報があればうっかり漏れるのが世の常である。匿名でないとできない取材方法はとったことがないつもりだが、一回しか切れないカードである。今ではない。


続きを読む
このエントリーをはてなブックマークに追加

↑このページのトップヘ