新型コロナに関するデータが色んなところで公開されており練習がてらJupter Notebook(Python)でデータ分析してみました。政府・自治体・医学界・報道の情報をそのまま信用していいのかわかりませんし。今回は「東洋経済オンライン」にて公開されているオープンデータ(7月15日まで)を確認してみました。
周知の事実も含めて確認できたことは以下のとおりです。個人的に新発見だったのは、人口あたりで見ると北陸地方の新規感染者数が実は多いということでした。あと死者数が減ってる謎データあり。青棒は日々の値。オレンジ線は7日間で移動平均をとり曜日影響を除外したものです。
1. 全国の陽性者数
3月中旬頃〜5月中旬頃にかけて第1波が発生。現在第2波発生中(上:累計,下:新規)。
2. 全国の重症者数
第1波で4月30日の318人がピーク。第2波は発生していないように見える(7月15日時点)。「重症者は増加傾向にない」と言われているが新規重症者数と回復数がデータからわからず見えてないだけかも。
3. 全国の死者数
第1波期間で750人程度に急増。その後ペース落ちるが1,000人に迫っている。
4. 全国の陽性率
同日の新規陽性者/検査数で計算したので正確さはありませんが第1波では10%台程度で第2波では5%程度。PCR検査を行う条件や目的が緩和されている為と考える。
5. 年齢別の陽性者数・死者数
6. 都道府県別の新規陽性者数(絶対数) ヒートマップ
絶対数は東京・大阪が多く、次いで周辺の都道府県・北海道が多い。福岡も多いようです。
7. 都道府県別の新規陽性者数(人工あたり) ヒートマップ
都道府県別の新規陽性者数を人口あたりで見ると北陸地方(福井・石川・富山)で多く発生している。総務省統計局の都道府県別人口データを結合して計算しました。
9. 都道府県別の死者数 ヒートマップ
都道府県別の死者数は上記都道府県で多いように見える。数値上ですが新規死者数マイナスが2件見られた(謎) 。
10. 都道府県別の検査数 ヒートマップ
東京が検査数を第1波の頃より増やしているというのは本当みたい。東京周辺と大阪も。それ以外は同程度。うっすら縦線が見え曜日によって検査数が違うのもわかります。第1波以前にくらべて縦線が少なくなったようにも見えます。
今回確認できたことは以上です。今回のデータでは年齢毎のデータが累計されたものしかなく、「先日まで若者の感染者数が多く、最近高齢者の感染も増えてきた」という情報については確認できませんでした。年齢, 血液型, 性別, 職業, 病床数との差, などなど、もっと細かいオープンデータを探してみようと思います。
0 件のコメント:
コメントを投稿