第175話|災害の予測は難しいが、対処では活きるデータ分析・活用(データサイエンス)

第175話|災害の予測は難しいが、対処では活きるデータ分析・活用(データサイエンス)

データを使った災害予測は非常に難しいです。特に、自然現象が相手の天災は、データが揃わないという理由で、非常に難しいです。

ここ数カ月の新型コロナウイルスがそれに該当することでしょう。

例えば、1年前にこのような新型コロナウイルスが猛威を振ることを予測するのは、難しいということです。

しかし、今回の天災を含めた災害時の対処で、データ分析・活用(データサイエンス)は非常に有効です。

今回は、「災害の予測は難しいが、対処では活きるデータ分析・活用(データサイエンス)」というお話しをします。

全国約2万7000人「発熱続く」 厚労省とLINE調査

厚労省とLINEが協力して行った、新型コロナウイルス対策のための全国調査の第1回が、3月末から4月上旬に行われていました。

集計結果を要約すると……

  • 4日以上発熱が続いていると答えた人が全体の0.11%(全国で約2万7000人)
  • 飲食店や外回りの営業など職業グループは、発熱を訴える人の割合が平均の2倍の0.23%
  • 在宅で家事や育児をする人のグループは、発熱を訴える人の割合が平均の半分以下の0.05%

参考:全国約2万7000人「発熱続く」 厚労省とLINE調査(NHK News Web 2020年4月10日)

なぜこのようなデータを集めたのかというと、「クラスターの発生を封じ込めるため」という理由からだそうだ。

クラスターの発生を封じ込めるためには……

  • 発生したクラスターを早期に発見する
  • 当該クラスターに対して十分な対策を講じる

参考:新型コロナウイルス感染症のクラスター対策に資する情報提供に関する協定締結の呼びかけについて(厚生労働省HP 2020年3月27日)

データの質としてはあまりよろしくはない。そこは、データ分析者の腕の見せ所

このLINE調査のデータは、おそらくデータの質はあまりよろしくはない。

例えば、新型コロナウイルスでない人のデータの混じっているし、データがカバーしている人口分布に偏りがあるからです。

しかし、災害時や有事のデータ分析で扱うデータは、「データの質は悪い」のが普通です。

あるデータでどのようなデータ分析をするのかは、データ分析者の腕の見せ所なのです。

データの質がどのように悪いのかを把握した上でデータ分析し、人が解釈をするときにそのことを加味して結果を読み取り、どうなっているのか(もしくは、どうなりそうなのか)を洞察する必要があります。

このとき、「こうあるべきだ」とか「こうなっているべきだ」とか「こうしなければならない」とか、人的な思いを一切排除し、心の平静を保ちデータを分析し解釈し洞察する必要があります。

その昔、プロイセン(現ドイツ)のクラウゼビッツが「戦争論」の書籍の中で語っていることですが……

データ分析は、災害時の対処で活きる

少なくとも先進国では、政府機関の中にデータ分析を専門とするセクションがあると思います。

彼ら・彼女らは、平事の平和なときのデータ分析をするだけではなく、災害時や有事のためのデータ分析もしていることでしょう。

どちらかというと、災害時や有事のためのデータ分析のほうが重要性は高いでしょう。

なぜならば、先行きが不透明だからです。その中で、より適切な選択をし続けたいからです。

先行きが不透明な災害時や有事のときこそ、データ分析が灯すロウソクの明かりが求められるのです。

ベイズ的モデリングとシミュレーション

データ分析は、所詮過去のデータを使います。

先行き不透明な状況下で、過去のデータを使いどのように先を灯すのでしょうか?

古典的には、ベイズ統計学を利用したデータ分析・活用です。

例えば、過去のデータで構築した数理モデルを、直近のデータ(災害後のデータ)で”強く”修正していくのです。

ちょっと、やや話しをします。

その修正された数理モデルを活用し、シミュレーションを行います。

シミュレーションを行うとき、利用する数理モデルの説明変数(Input)を、値を固定する変数と、値を可変にする変数に分けます。

値を固定する変数とは、あらかじめ値を設定する変数で、その値の設定パターンを「シナリオ」といいます。

そのシナリオのもとで、得たい結果を得るためには、何をすべきかを知るためにデータ分析をします。

その手掛かりが、可変にした変数に現れます。

もっと簡単な説明

説明するのが難しかったので、もう少し分かりやすい例で説明します。

あるアパレル店舗のデータ分析例です。

例えば、災害前に比べて、何が売れつづけているのかを分析するのです。

店舗を閉める影響も加味する必要があるので、売上の額ではなく、売上構成比を分析するのもいいでしょう。

例えば、靴下の全体に占める売上構成比が上がった、新作のジャケットの全体に占める売上構成比が悪い、などです。

靴下は生活上必要なので購買し続けるが、値段の高い新作のジャケットは消費を抑えるために買い控えが起こった、などが分かります。

過剰に消費が冷え込み続ければ、靴下の売上の絶対額も減ることでしょう。

PCのECサイトでよくあるオーダーメードサービスを、例えば不足しているマスクで実施するのもいいかもしれません。再利用できる布マスクの形や色、柄、材質などをEC上でオーダーするのです。

そのサービスの状況を、データを使い分析し、より良いものへと適応し続けることができることでしょう。

今回のまとめ

今回は、「災害の予測は難しいが、対処では活きるデータ分析・活用(データサイエンス)」というお話しをしました。

端的に言うと、「データを使った災害予測は非常に難しい」が、「データを使った災害対応は可能」ということです。

少なくとも先進国では、おそらく政府機関の中にデータ分析を専門とするセクションがあり、平事の平和なときのデータ分析をするだけではなく、災害時や有事のためのデータ分析もしていることでしょう。

どちらかというと、災害時や有事のためのデータ分析のほうが重要性は高いでしょう。なぜならば、先行きが不透明だからです。その中で、より適切な選択をし続けたいからです。

先行きが不透明な災害時や有事のときこそ、データ分析が灯すロウソクの明かりが求められるのです。

このようなデータ分析・活用は、「国レベルでないとできない」というデータ分析ではありません。

企業レベルでも、個人レベルでも可能なデータ分析です。

なぜならば、20年前と異なり、データ分析環境が安価になり身近にあるからです。