統計学を欠いた実数比較の限界 下のグラフは、新型コロナの感染死について、恐ろしいことを物語っています。 私の知人で、半導体の開発、生産、品質管理のプロだった企業人で、工学博士号の持ち主の作成です。 現役時代に駆使した統計学の手法で、コロナ感染に伴う死者数の推移を独自にグラフ化してみました。 通常メモリでなく、対数目盛(指数関数グラフ)という統計処理でよく使う手法を用いています。 新聞、テレビがよく使う実数(絶対値)によるグラフでは、読み取れない動きが明瞭に示されています。 知人の指摘です。 「人口100万人当たりの死者数が1を超えると、どの国でも、死者が急増する。 イタリア、イラン、スペイン、フランス、スイス、イギリスがそうで、しかも同じような右肩上がりの線で死者数が増加していきました。 下の方に米国もあります。 よく見ると、やはり1を超えたあたりから死者数が急増しています」。 「1」を超える以前も、院内感染が進行しており、「1」を超えると、医療崩壊が起きているので、どんどん死者の数は増えていくというのです。 「医療崩壊が起きてしまうと、もう死者の増加は止まらない。 その分岐点は1で、ここを境に医療崩壊が起き、病院の治療機能が喪失し、救える患者も救えなくなる。 日本より下方にあったドイツはじわじわと上昇し、日本を追い越し、1を超え、医療崩壊が発生し、死者が急増している」 「日本はまだ1以下でも、じわじわ上昇を続け、医療崩壊の寸前まで来ている。 日本医師会が医療現場が危機的な状況にあるとの宣言をだした。 日本は感染数が少ない国だと、安心していられない」 もっとも、感染が社会全体に拡散し、集団免疫が形成されると、感染が広がらなくなります。 そうすると、グラフのカーブは緩やかになり、最後はフラット(グラフが寝た状態)になるといいます。 中国は集団感染が形成され、だから線がフラットになっているとの見方もあります。 ただし、中国のデータは信用できないので、実態はどうなのか分かりません。 それと、集団免疫が形成されるには、時間がかかり、その間、多くの死者がでる。 そのためにも、医療崩壊を防ぎ、救済できる患者の治療体制を維持していなければならないということでしょう。 /flickr:編集部 テレビ、新聞報道では、主に累積数、日々の感染者数を実数で説明しています。 その致命的な欠点は「実数のグラフだと、低空飛行だったものが、途中で急角度で伸びあがり、過去との比較ができにくい。 対数グラフは極端に幅広い範囲のデータを目で見て分かるように処理してくれる」。 もう一つの致命的欠点は、各国比較ができないことだと指摘します。 「各国は人口、医療制度、社会環境といった国情が皆、違う。 ウイルスの検査方法、検査数にも差がある。 だから実数で比べてはならない。 死者数は操作できないから、人口100万人当たりの死者数に相対化し、対数グラフで比べるべきなのです。 これが上のグラフの意味なのです」 「世界全体で感染者が100万人、死5万人を超えたとかいっているのは、累積数の話だ。 どのような変化が各国で起きているかを知るには、この手法しかない。 統計の専門家はもっと発言してほしい。 政府、自治体は専門家会議に統計学者を加えるべきだ」と、警鐘を鳴らしています。 当面する日本の防止策として、知人はこう主張します。 「死者を減らすことが最重要で、そのためにはあれもこれもでなく、医療崩壊(病院の機能マヒ)を防ぐことに全力を集中すべきだ。 医療崩壊が起きると、各国共通して同じような率の死者がでる。 各国とも右肩上がりで死者が増えていく。 そうなれば日本も例外でなくなる」と。 具体的にはこうです。 「病院を徹底的に守る。 病院の医師、看護士が多数、亡くなっている国がある。 さらに医師や看護師が感染すると、免疫力の弱った病人が犠牲になる」。 そこで「検体を取る作業ができる臨時の資格者を作り、検査に対する医師の負担を減らす。 検体を取るだけならテントでいい」「医師を発症者の治療に専念してもらう。 人工呼吸器は補充できても、医師は補充できない」。 (注)logを使った対数グラフでは、たとえば縦軸で1000人を高さ3㌢、100万人を6㌢、1億人を8㌢というように書く。 2000人は10の3・3乗だから3. 横軸は時間(何月何日)とすると、何日で10倍になったかなどが分かる。 急増する感染者の増加をみるのに適している。 実数を使ったグラフ(均等目盛)だとはみ出してしまい傾向がよくつかめない。 編集部より:このブログは「新聞記者OBが書くニュース物語 中村仁のブログ」2020年4月4日の記事を転載させていただきました。 オリジナル原稿をお読みになりたい方は、をご覧ください。
次の移動平均線を表示 データソースは厚生労働省による都道府県発表の転記。 土日祝日は検査をしていても厚生労働省に報告が行われず検査数「0」となる場合がある。 その際は休日分の検査数が判明すれば過去データを修正し、そうでなければ直近の平日に休日分も含めて検査数が加算される。 6月17日以降の東京都は医療機関における保険適用での検査人数も含む。 6月18日以降の兵庫県、6月21日以降の静岡県は民間検査機関での検査も含む。 その他の定義や注意事項は「全国の状況」のグラフ注釈やを参照。 武漢からの政府チャーター便帰国者、空港検疫、および神奈川県に停泊したクルーズ船の乗客・乗員は除く。 長崎県に停泊したクルーズ船は全国の状況には含むが長崎県のデータには含まない。 移動平均は後方7日移動平均値。 5月8日以降は都道府県の発表ベース、それ以前は厚生労働省が把握した個票を積み上げたもの。 データに更新がなかった場合は前日の数値を使用。 基準変更によって前日との継続性がない日は新規増減を0と見なし、グラフの色を変えている。 「検査陽性者」は原則として「入院治療等を要する者」「退院・療養解除」「死亡者」の合計と一致するが、確認中が含まれるため一致しない場合もある。 厚生労働省が訂正を発表したケース、発表がなくても誤記を訂正したと思われるケースは遡及修正した。 データソース:都道府県別の数字も含めて原則としてより。 ただし東京都のみから遡及修正することがある。 チャート描画:。 マップ描画:。 アイコン:。 更新履歴・ソースコード: よくあるご質問 Q. 年齢別グラフの死亡者・重症者がなくなっているのはなぜですか? A. 年齢別グラフの数字は全国版の数字(都道府県発表を厚生労働省が集計したもの)と異なり、厚生労働省での確認作業(突合作業)が完了したものがベースとなっています。 そのため従来から死亡者・重症者数の把握に遅れが見られていました。 従来は注記にこの旨を記載していましたが、都道府県発表の数字と混同されるケースが多かったため、現在は非表示としています。 途中で大きく累計値が増減しているのはなぜですか? A. データソースが変わったためです。 5月7日までは、都道府県から感染症法第12条に基づいて報告された感染状況を厚生労働省が精査した上で公式発表としていました。 5月8日からは都道府県が独自に発表した数字を積み上げる形で公式発表としています。 この基準変更によって前日との継続性がない日は新規増減を0と見なし、グラフの色を変えています。 また、検査陽性者数、死亡者数、退院者数、PCR検査人数に関してはこの他にも途中で集計範囲が変わったため同様の処理をしています。 具体的な変更内容や日付はグラフの注記をご覧ください。 PCR検査数などが日によって大きく変動しているのはなぜですか? A. 実際に数字が変動しているケースと、報告の遅れが原因であるケースがあります。 後者の場合だと、休日は都道府県や厚生労働省への報告が行われず数字が少なめに出る傾向があります。 休日分は後から訂正される場合と、直近の平日にまとめて報告される場合があります。 こうした曜日による変動要因をならすためにグラフには移動平均(後方7日間=その日を含む直近7日間の平均)を表示できるようにしています。 マイナスになるはずのない項目がマイナスになっていますが? A. 過去分のデータに訂正があった場合に起こります。 厚生労働省からは原則として最新分の累計数字のみが発表されるため、過去の数字に訂正が判明した場合、遡っての修正ではなく最新日のみ修正が行われます。 実効再生産数とは何ですか? A. 「1人の感染者が平均して何人に感染させるか」を示す指標です。 この数字が高いほど感染が急速に拡大していることを意味し、逆に1未満の期間が続けば「感染が収束しつつある」といえます。 平均世代時間は5日、報告間隔は7日と仮定しています。 リアルタイム性を重視して流行動態を把握するため、報告日ベースによる簡易的な計算式を用いています。 精密な計算ではないこと、報告の遅れに影響を受けること、陽性者が少ない都道府県では数人の差で大きく実効再生産数が変動する場合があることにご注意ください。 北海道大学大学院医学研究院・西浦博教授のモデルと監修を基にしています。 計算式の詳細はをご覧ください。 ただし、たとえば直近7日間の新規陽性者が1人でも1万人でも同じ「実効再生産数1」となる場合があります。 現在の感染状況を把握するには、陽性者数など他の指標もあわせてご確認ください。 重症の定義は何ですか? A. 発表数字が厚生労働省ベースだった5月7日以前は人工呼吸器装着または集中治療室(ICU)を重症と表記していました。 それ以降は都道府県の発表ベースであるため定義が異なる場合があります。 データが他社の報道と異なるのは何故ですか? A. 個別のケースによりますが、データソースの違い(厚生労働省か都道府県発表か)、集計締め切り時間の違い、または集計範囲の違い(クルーズ船や空港検疫を含めるか)などが考えられます。 データソースにはどうやってアクセスできますか? A. たとえば5月20日発表のデータはこちらを参照しています。 データやソースコードを自分のSNSやブログで使ってもよいですか? A. 商用・非商用を問わずご自由にお使いください。 著作権表示は「東洋経済オンライン」または「TOYO KEIZAI ONLINE」とします。 その他の具体的な基準はMITライセンスに準拠します。
次の働く世代と高齢者に向け、生活上のポイントをわかりやすくまとめたポスターを、へき地医療を支援する地域医療振興協会(本…• 東京都と北海道で計3人が亡くなったほか、空港検疫で初めての死者が1人出て、死者は計969人…• 空港検疫で感染が確認された人が亡くなるのは初めて。 感染が判明した警察官・警察職員は累計で12都道府県警などの100人に達した。 これまで業務に大きな支障は生じていないが、「治安や…• 新型コロナウイルスの影響で、世界大恐慌以…• 1人はさいたま市が発表した同市立中学校の女子生徒で、県内で確認された感染者は延べ1073人となった。 教室の消毒などのため、さいたま…• 年間で…• 県内での感染者は計152人(うち死者19人)となった。 高崎市によると、市外の私立高校に通う10代の…• 県内での感染確認の発表は5月11日以来44日ぶり。 感染者は再陽性1人を含む延べ26人となっ….
次の