【異常混雑予報】データの仕組みについてご紹介ー前編

いつもYahoo!乗換案内アプリをご利用いただきありがとうございます。
2/19に新たに登場した異常混雑予報はもうお使いいただけましたでしょうか。(ご紹介ページはこちら
異常混雑を予報する仕組みについて、2回にわたって解説いたします。

異常混雑ってなに?

一般的に「混雑」といえば車両に対して乗車率100%を超える状態を思い浮かべますが、異常混雑では「普段と比べてどれくらい利用者が増えるか」を想定しています。

今回の機能は、「普段は乗車数が少ない時間帯だけれど、今週の金曜はアーティストのライブが開催されるため多くの人が乗車して混雑する」といった突発的に発生する混雑を予報するものになります。
ライブのほかにも、以下のような場合に異常混雑が発生しやすいことが分かっています。

  • 入試
  • 花火大会
  • 野球やサッカーの大会
  • 大規模な講演、セミナー など

混雑検知の仕組み

ではどのように異常混雑を検知しているのか、その仕組を説明します。

前述でも少し触れましたが、異常混雑は普段の状態との比較を行うことで検知しています。
そのために必要なものは以下となります。

  • 普段の検索数(検索ログ)
  • 異常混雑の有無を検知したい日の検索数

Yahoo!乗換案内は多くのお客様に日々ご利用頂いているおかげで、大量のルート検索ログが蓄積されています。(※1)
その検索ログと、大学の研究室と連携して開発された予測モデル(※2)を利用することで上記の検索数を取得しています。

検索ログについて

Yahoo!乗換案内では、未来の日付を指定して検索することができます。
例えば、3日後にライブがあるため、あらかじめ電車の時間を調べて計画を立てておきたいといった場合、3日後のライブが始まる前の時間を到着時間に指定してルートを検索されることでしょう。
そういった「未来の日付を指定して検索した情報」を集め、どの路線、どの方面、どの駅で、何時に何件の検索がされたかを日々集計し蓄積しています。

日時2/1時点2/2時点
2/1 07:00 200
2/1 07:10 410
2/1 07:20 300
2/2 07:00 150 200
2/2 07:10 200 250
2/2 07:20 250 300
2/3 07:00 100 130
2/3 07:10 150 130
2/3 07:20 100 200

この集計は上の例のように10分単位で行っています。

時刻表に合わせるため1分単位で行うこともできますが、時刻表の変更があった場合にすぐ比較ができなくなってしまうため、10分単位で区切っています。

こうすることで、各路線、方面、駅、時間帯で過去何人くらい検索されたのか、また未来の日付を指定して何人が検索を行っているかが判明し、具体的にいつどこで検索数が増えているのかが分かるようになります。

しかし、ここで出て来る集計値は当然ながらばらつきがあり、普段の検索数はわかりません。また未来の日時の検索数は、実際の検索数とはかけ離れている状態です。

そこでこの集計データを予測モデルの学習データとしてかけあわせ、普段の検索数と異常混雑の有無を検知したい日の検索数の予測値を算出します。

後編にて、予測モデルについてご紹介いたします。

(※1)個人情報が紐づく形では保存していません
(※2)東京大学 下坂正倫先生(講師)、同研究室所属 小西達也さん(両名とも2015年当時の所属で記載) http://www.miubiq.cs.titech.ac.jp/ja/cityprophet-ja/