正確・迅速なデータ収集を 統計学と感染症
新型コロナウイルス最新情報

正確・迅速なデータ収集を 統計学と感染症

ポイント

○将来予測と政策立案に数理モデル活用を
○PCRは誤りが起きる確率の確定が重要
○接触確認アプリの精緻化と普及を進めよ

新型コロナウイルス感染の急激な拡大は、大きな社会的なショックを引き起こし、世界を一変させた。見えないものへの恐怖心と、逆にそのような恐怖から逃れたいという心理が働く中で、「感染防止か経済活動か」という二者択一の両極端の議論がなされ、混乱を引き起こしている。

特にソーシャルメディア上では、読者の心理を見越して注目を引くことを狙った発言が多い。また新聞やテレビでも誇張気味の報道が散見される。これは「正しく恐れる」ためのデータが不足していることが原因の一つとして挙げられる。混乱を収めるためには、最新の状況を迅速に反映したデータの収集体制を整備し、データに基づく冷静な議論をおこなうことが必須である。以下では、このような観点から、数理モデルの有効性、PCR検査の精度、接触確認アプリの役割について論じる。

第1の論点は、感染拡大の数理モデルについてである。感染症の数理モデルとは、感染症の発生から拡大、そして感染者がどのように回復するか(あるいは死亡するか)を記述する微分方程式だ。この式を用いると、実効再生産数(1人の感染者が平均何人を感染させるか)や平均潜伏期間など、式のパラメーター(変数)を定めることで、将来の感染者数を予測できる。

数を予測できるだけでなく、パラメーターを変化させたときに、感染者数がどのくらい減るか、あるいは増えるかを分析できる。このため、外出制限や感染者の隔離といった政策の効果をパラメーターに反映させることで、政策の数量的な評価ができるわけだ。これが数理モデルの利点である。新規感染者数のグラフを見てから後付けでおこなう定性的な議論とは、本質的に異なる。

実際には政府からの要請などで人々の行動が変化し、それに伴ってパラメーターは変化していくから、当初の数理モデル予測は外れることとなる。しかし、深刻な予測を実現させないことこそが数理モデルの意味であると言ってよい。

また、数理モデルを感染症対策の事後評価に利用することも重要である。

新型コロナの感染から診断には、潜伏期間の約5日に加え、発症から診断まで約7日を要するため、毎日の新規感染者数は12日くらい前の感染状況を表す。パラメーターが時々刻々と変化することを織り込んだモデルを構築し、新規感染者数からそのパラメーターを推定すれば、人々の接触機会や実効再生産数の過去の変化を数値的に評価することが可能となる。

滋賀大学データサイエンス教育研究センターの山口崇幸助教のモデルによる実効再生産数の推定結果であり、緊急事態宣言の効果が明確に示されている。

このようにモデルのパラメーターはデータから推定されるため、データの信頼性がモデルの有効性の基礎である。感染者情報を保健所や医療機関がオンラインで登録し共有するHER-SYSに関する最近の報道にもあるように、残念ながら日本では重要なデータのタイムリーな収集が遅れており、一刻も早い体制整備が求められる。

第2の論点は、PCR検査の精度、より具体的には同検査の「偽陽性」と「偽陰性」に関してである。偽陽性は「感染していない人が検査で陽性と出てしまう誤り」であり、より日常的な用語を用いれば「誤検出」である。逆に、偽陰性は「感染している人が検査で陰性と出てしまう誤り」であり「見逃し」である。

検査は完璧ではないから誤りは一定の確率で起きる。偽陽性率、偽陰性率は、これらの誤りがおこる確率(割合)である。データサイエンスの観点から興味があるのは、PCR検査の偽陽性率、偽陰性率の実際の値であるが、実は正確にはわかっていないようだ。7月6日の政府の第1回新型コロナウイルス感染症対策分科会の資料では、「偽陰性率は30%、偽陽性率は1%」と「仮定」して、PCR検査の拡大の影響を論じているが、数字の根拠は与えられていない。

PCR検査で注目されるのは、偽陽性率が低い、すなわち誤検出がまれであるという点だ。これは、新型コロナに特徴的な遺伝子を増幅するというPCR検査の原理からも理解される。ただし偽陽性率の実際の値が1%なのか、あるいは0.01%なのかは、PCR検査の拡大の影響を論じる際には重要だ。

もし偽陽性率が1%ならば、陰性の人を1万人調べると100人が陽性と誤判定され、無駄な隔離などの措置が必要となる。日本ではこのことをもってPCR検査の拡大は必ずしも望ましくないという議論がなされているが、偽陽性率が0.01%であれば医療体制への負荷は大きくない。

香港では、12万8千人を検査して陽性が6人だったというデータも発表されており、偽陽性率は1%よりはかなり小さいと考えられる。なお、最近では様々な簡易的な検査が利用されるようになっているが、それらの偽陽性率については、まだ十分なデータが得られていないと思われる。

一方でPCR検査の偽陰性率は30%程度で、見逃しが3割程度あると考えられている。これでは「陰性証明書」の信頼性は低い。実は偽陰性率はウイルス量や感染からの日数によることが観察されており、単一の数字では表せないことがわかっている。今後、さらなるデータと研究成果の蓄積が求められる。

偽陰性率が大きいことへの対処法は、検査の繰り返しが考えられる。実際、厚生労働省の新型コロナ感染症患者の退院基準(6月12日)では、24時間以上の間隔をおいて2回の検査で続けて陰性となることを退院の基準の一つとしている。

第3の論点は、接触確認アプリの役割についてである。感染防止のための有効な手段がなく、感染経路の不明な陽性者が増える中で、デジタル技術を用いて感染を追跡することは重要だ。スマートフォンから得られるデジタルデータの利用により、陽性者の記憶をたどる人海戦術の感染追跡では不可能な情報が得られる。しかし、日本では個人情報の利用に関する懸念が強く、接触確認アプリの利用数がまだまだ少ない。

米グーグル、アップルの仕様の制限もあるが、アプリから得られる情報が少ないことも改善点だ。接触確認アプリでは、感染者との接触情報は「何月何日に接触があった」という形でのみ通知され、正確な時間は通知されない。時間情報があれば、例えば通勤時間に感染したなどの可能性がわかる。現在、「通勤電車の中で感染がおこり得るかどうか」という重要な情報が明確にはわかっていない中で、このような情報の価値は高い。

また「無症状者がどの程度感染を広げているか」についても、無症状者が複数の陽性者と接触していることがわかれば、その人が感染を広げた可能性が示唆される。新型コロナとの共存のためには、正確かつ広範なデジタルデータの活用こそが不可欠なのである。

引用元 : 日本経済新聞 正確・迅速なデータ収集を 統計学と感染症
お申し込みはこちら