分析用のJリーグのデータを収集する
スポンサードリンク
Jリーグの試合に関する分析データ
実際に分析をする為には、まずはデータが必要です。
Jリーグの公式サイトには、1992年から全ての試合のデータが閲覧可能となっており、誰でも参照することが出来ます。
対戦相手やスコア、出場選手といった情報はもちろんですが、入場者数に影響しそうなキックオフ時刻や天気・温度といった情報も掲載されています。
今後、経営に関する情報や地域情報なども考慮した分析をしてみたいと思いますが、ずは、このデータを利用して分析を始めてみたいと思います。
データの収集にはRPAのツールを使用しました。
RPAの選び方や使い方についても、今後更新していきます。
対象データ
分析対象は、以下のデータとしました。
- 対象データ:J1/J2/J3のリーグ戦
- 対象期間:2010年~2020年
この11年間で、合計10,074試合も開催されました。
J1は、11年間、毎年306試合の開催されています。
J2は、2010年,2011年にチーム数が増え、2012年以降は毎年462試合の開催です。
J3は、2014年からのスタート。今年が7年目でした。
天気の種類
どんな天気が多かったでしょうか?
みなさんは、Jリーグの試合を見に行く時、晴れているイメージですか?
それとも雨ですか?
Jリーグの記録は、細かくて「雨のち曇のち晴れ」といった記述もあったりします。
10年間の天気を全て挙げてみました。
全部で76パターンになります。雨時々霧一時雷雨なんて、選手も観客も大変です。
これは、2017年10月29日の「沼津 - C大阪23」の試合でした。
全てのパターンで分類すると数が多いので、簡略化する為に「のち~」を全部取って、最初の文字で試合数を集計しました。
例)晴のち雪のち雨 → 「雨」として集計
晴のち曇一時雨 → 「晴」として集計
簡略版にすると、晴と曇りが圧倒的に多いです。
「曇のち雪」のような天気は、曇りに集約してしまったからかもしれませんが、雪が降っていた試合は意外に少ないです。
Jリーグでは、度々論争になりますが、春秋制の恩恵ですね。
屋内は札幌ドームだけでなく、J3にも出てきました。
これは、大分の大銀ドームでしす。
大分は、一度J3までの降格を味わいましたが、今やJ1で戦うチームです。
暑かった試合と寒かった試合
10年間で1番暑い日に行われたのは、2019/7/20にいわぎんスタジアムで開催された「岩手 - 群馬」の試合でした。気温は36.2℃です。
意外だと思いましたか?
実は、開催時間が15:03です。岩手といえども、夏は暑いですね。
岩手は照明設備がなかった為、夏でも昼間の開催でしたが、2021年2月に照明が設置される予定です。。
逆に1番寒い日に行われた試合が、2020/12/16にアルウィンで開催された「松本 東京V」でした。
気温は-3.3℃コロナの影響で平日夜開催でした。雪も降っていました。
DAZNからも寒さが伝わってきたのを覚えています。
暑いのも大変ですが、氷点下もサッカーをするには過酷な環境です。
と、こんなデータを使って、まずはザックリとリーグ全体の分析を始めてみたいと思います。
分析のツールは、統計の分野でよく使われるフリーのソフト「R」を使用しています。
次回は、入場者数の「平均」について考えてみたいと思います。