「GoTo利用者のコロナ発症確率」論文(未査読)から考えるデータ分析における「他山の石」

割と最近、東大などの研究チームが「GoToトラベル利用者の方が、利用しなかった人より新型コロナウィルス感染を疑わせる症状を経験した」との調査論文を公表したことがマスコミ等で話題となった。筆者には、旅行と感染拡大の相関関係の有無は専門外につき分からないし、このブログにおいて、感染拡大防止と経済活動下支えという2つの社会的要請のバランスのとり方、という政治的テーマを語るつもりはない。ただ、少なくともこの調査論文は、データ分析の手法や論理構成の面で異論があるため、本日は本題から離れてしまうが、データ分析における他山の石として、その点を指摘させて頂く。

くだんの論文における調査手法

この論文では、インターネットを使ったアンケート(楽天インサイト)により、GoToキャンペーンの利用の有無と、新型コロナ感染が疑われる症状(発熱、喉の痛み、咳、頭痛、嗅覚ないし味覚の異常)の発生有無を調査し、その結果を集計している(実施期間は8月25日~9月末。有効回答者は約2.5万人。なお、回答者の性別や年齢、収入、居住地域などの構成については、社会全体の構成と適合するよう調整)。その結果、例えば発熱の症状が表れたとする回答者の割合は、GoToトラベル利用経験者(回答者の約13%)について4.8%なのに対し、非利用者は3.7%であるなど、有意にGoToトラベル利用者の方が高い数値となっている、としている。

そして、この調査結果を踏まえ、GoToトラベルの実施が感染者増加に寄与している可能性があり、政府の経済対策は、感染リスクの高い者のステイホームと低い者の経済活動を促進するものであるべき、と結論付けている。

調査結果のインプリケーションの解釈の過誤

正直、この調査手法には突っ込みどころ満載なのだが、それは後で述べるとして、仮に「GoToトラベル利用者の方が、利用しなかった人より新型コロナウィルス感染を疑わせる症状を経験した」ことが事実だとしても、その発見事実だけから論理的に「GoToトラベルの感染拡大への寄与」というインプリケーションは得られない、というより根本的な問題がある。

なぜなら、もしGoToトラベルが感染拡大の要因になっているのだとすると、旅行者を起点としてやがて地域差や個々人の行動特性の差を問わず遍く感染していくため、GoToトラベル利用者・非利用者の発症率の差はむしろ縮小するはずだからである。これを統計的な表現に言い換えると、感染率の「平均」的水準の上昇を伴いつつ、地域や各人の行動特性による感染率の「バラツキ」の縮小が観察されるはず、ということになる。

確かに旅行者を起点とした感染拡大には一定の期間がかかるため、特に感染率の高い地域への旅行直後には、旅行者の感染率とそれ以外の者の感染率に違いが生じ得るだろう。ただ、このインターネット・アンケートの実施期間(8月25日~9月末)は、GoToトラベル事業の開始(7月中旬)から1か月以上経過後である。もし旅行者を起点とした感染拡大が生じたのであれば、そのことはアンケート結果にも相当程度反映されていなければならない(なお、GoToトラベル事業の開始当初は東京発着が除外されていたが、その解除は10月からなので、東京発着分はアンケート結果に反映されていない)。

にもかかわらず、GoToトラベル利用者と、非利用者の感染率に有意な差がある――感染率の「バラツキ」縮小がみられない――のだとすると、この論文の主旨とは正反対に「GoToトラベル開始から1か月以上経過しても、旅行者を起点とした感染拡大は限定的である(=GoToトラベルを利用した旅行は、必ずしも感染拡大の主因となっていない)」というインプリケーションが導かれてしまう。

GoToトラベルによる感染拡大を説明したいのであれば、むしろ地域などによる感染率のバラツキの縮小(GoToトラベル開始前まで感染率の低かった地域の感染率の上昇など)に着目して分析するべきだったのではないだろうか。

調査結果に対する信頼性にも疑義

こうした批判だけでは、「GoToトラベル利用者の方が感染を疑わせる症状の経験率が高い」のは何故か、という理由については何も語られておらず、論文中では、感染率の高い属性の人たちこそGoToトラベルをよく利用する傾向があることを問題視したがっているわけだが、筆者はこの調査結果の信頼性自体、かなり疑わしいと考えている。なぜなら、ここでいう経験率「症状の経験者数÷アンケート回答者」のうち、①計算式の分子である「経験者」についても、②分母である「回答者」についても、調査手法上の問題があるからである。

まず、①計算式の分子である「症状ありとした回答者」については、「新型コロナ感染が疑われる症状」の回答者数が、実際の新型コロナ感染者数の代理変数として有効なのかどうか検証されていない、という問題がある。発熱や頭痛、味覚異常などの症状は、それ自体、単なる風邪などでも生じ得る。いくら新型コロナ感染が拡大しているといっても発症率は風邪の方が圧倒的に高いだろうから、「症状ありとした回答者」数の違いが、そのまま新型コロナ感染者数の違いと推定するのはいくらなんでも乱暴すぎる。加えて、このご時世、「新型コロナ感染の疑い」というのはかなりのセンシティブ情報なだけに、一般的なインターネット調査と比べても、回答者がどの程度正直に回答しているか定かでない。単なる風邪だと確信している場合には「発症した」と回答することにあまり躊躇しない半面、本当に新型コロナが疑われる症状の場合に正直に回答したくない、という動機が働いても決して不思議でない。さらに、アンケート調査による以上やむを得ないのだろうが、この調査には新型コロナの無症状感染者が反映されていない。このように、論文の記述だけだと、調査結果が実は「旅行をする人は、しない人よりも『風邪』にかかりやすい」ことを示唆している可能性を排除できていないと思われる。実際、そういう可能性の方が、旅の疲れからダウンしてしまった、とか、あるいは薄着で南国に旅したところ、思った以上に寒くて風邪をひいた、とか、まだもっともらしいかもしれない。

次に、②計算式の分母であるアンケート調査対象者についても、「GoToトラベル利用経験者」と「非経験者」とでは、旅行以外の行動特性にも違いがあるとみられるため、発症率の違いが旅行に起因するものかどうか何とも言えない、という問題がある。すなわち、補助金メリットに妙味を感じて旅に出たがる人たちは、そもそも活動的・社交的であり、旅行以外にも会食や各種イベントに繰り出している可能性がある。他方、これだけの政府補助があってもなおキャンペーンを利用しない人たちは、何らかの理由(仕事などで忙しい、インドア派である、感染拡大リスクに対し人並み以上に慎重である、など)から、もとより行動半径を狭くとっている可能性が高い。調査結果にいう感染率の差は、GoToトラベル利用の有無以前に、普段からの行動特性の違いによって決定づけられている可能性がある。論文では、感染率の高い人たちこそGoToトラベルを利用したがる傾向があることを問題視しているわけだが、たとえ活動的・社交的な人たちに旅行を控えさせても、居住地域内での会食・イベント参加を通じ感染拡大をもたらすおそれがあるわけで、「旅行が会食や地域内イベント等と比べ特に感染リスクが高い」といった論考を付加できない限り、ことさらに旅行(GoToトラベル事業)に批判の目を向ける論拠としては不十分というべきだろう。

本来、GoToトラベル事業による感染拡大への影響度を調査したいのであれば、例えば、旅行以外の行動特性も併せて回答させ、比較する母集団の行動特性を揃えておく(地域内の行楽イベントに積極的なグループ同士で、GoToトラベル利用有無による感染者数を比較するなど)必要があったのではなかろうか。

最後に

このように、くだんの論文は、マスコミや国会議論などで散々とり上げられた割には、分析手法や論理構成に甘さが残っており、未査読の段階だとこんなものなのかもしれないが、プロパガンダの域を出ていないと言わざるを得ない。このブログにおいて筆者は、所詮片手間の趣味として、面白おかしくマニアックなエンタメ作品を書いているに過ぎないわけだが、さすがに最低限の理屈がとおったデータ分析でなければ無意味なわけで、これを他山の石としたいと思う。

なお、冒頭にお断りしたことの繰り返しになるが、この論文が論理構成や分析手法が誤っているからといって、直ちにGoToトラベル事業が感染拡大に寄与していないと結論付けることはできず(理由が間違っていても結論が正しいことはあるし、その逆もあり得る)、あしからず筆者は「じゃあ、寄与しているのか、していないのか」という問に対する答を持ち合わせていない。

いうまでもなくコロナ禍は、筆者の本業も含め負の影響が大きいし、医療関係者をはじめ、筆者とは比べ物にならないほど大変な思いをされている方が大勢おられるわけで、経済活性化との両立を図りつつ、一日も早く克服できることを切に願っている。

そのように申し上げた上で、本ブログ全体の主題が野球とカープなので、あえて野球関連の話題に触れると、コロナ禍は各国の球界にも深刻な影響をもたらしている。特にMLBについては2021年シーズンの試合日程に不透明性が残ったままであり、メジャー進出を目指す日本人選手の契約交渉や、逆にNPBの外国人選手スカウトにも影を落としている。また、ファンとしての野球場観戦にも制約がかかったままである。遠からずコロナ禍を克服し、またカツダスタジアムで「宮島さん」を何度も合唱し、7回裏の攻撃前にジェット風船を飛ばせる日が戻ってくることを祈り、筆を置きたい。