研究

選択バイアスって何!?基本から実例まで分かりやすく解説します!!

どーもー!!ナツです!!
今日はどうしたのー?

教授に研究見てもらったらバイアスがどうのこうのって言われて…。
バイアスって何なの?

研究を行っている人にとってバイアスは天敵ですよね。

初めて研究をする人や研究初心者の人でも言葉くらいは聞いたことがあるかもしれません。

指導者に研究経過を報告したり、研究発表する時に「バイアスが取り除けてない」とか「こういうバイアスが入ってるんじゃないの?」とか言われて「バイアスってなんやねん!!」ってなった経験がある人もいるのではないでしょうか。

バイアスは研究にはつきものですが、どんなものがあるのかを正しく理解していないと対処することが難しいものです。

この記事では、バイアスについて正しく理解したい人、バイアスにはどんなものがあるのかを知りたい人にむけて、まずは選択バイアスについて分かりやすく解説していきます。

この記事を読めば、研究で生じる選択バイアスについて正しく理解することができ、バイアスへの対処もできるようになります。

それでは解説していきます。

バイアスとは

バイアスは系統誤差とも呼ばれ、研究の過程で生じる偶然ではない誤差であり、その誤差を生じさせる要因のことです。
 
反対に偶然的に生じる誤差は偶然誤差と呼ばれ、これに関してはどうしようもないので、無視して良いと思います。
 
バイアスは研究のデータを歪めてしまうので研究結果にも影響を与えます。
 
効果があるものをないと判断してしまったり、効果がないものをあると判断してしまったり、バイアスによって研究結果が変わってしまうことは珍しくありません。
 
バイアスが混入するタイミングは大きく分けて3つあります。

  1. 対象者を選定するとき⇒選択バイアス
  2. 実際にデータをとるとき⇒測定バイアス
  3. データに関連する要因を測定していないとき⇒交絡
今回は選択バイアスについて解説していきますが、どのバイアスに関してもデータを収集した後からではどうにもできないので、研究デザインの段階でしっかりとバイアスを除去したデザインを考えるべきです。
 
ここで勘違いしてほしくないのは、バイアスを完全に取り除くのは不可能であるということです。
 
もちろんバイアスは極力取り除く必要があります。しかし、研究過程において全くバイアスが入っていない研究というのはほぼ不可能です。
 
また、バイアスにはそれぞれ名前が付けられていますが、書籍や文献によって名前が違っていたり、同じ名前が違う意味で使われたりしています。
 
正直な話、名前とかはどうでもいいと僕は思っているので、しっかりと概念を理解するようにしてください。
【研究デザインとは?】種類と具体的な方法を事例を交えて徹底解説!! 研究を始めて、最初に躓くのが研究デザインではないでしょうか。 いきなり研究デザインなんて言われても、「なにそれ?おいしいの?」...

選択バイアスとは

選択バイアスとは主に対象者を選定する際に生じるバイアスのことをいいます。
 
研究を行う際には、必ず対象者を決めていきますが、その対象者を決める際にバイアスが入ってしまうことがあります。
 
これは意識的にだったり無意識的にだったりしますし、不可避的なものもあります。
 
選択バイアスとしては、以下のようなものがあります。

  • 母集団を構成している全ての人から標本抽出できないことによるバイアス
  • 自発的に研究参加した人とそうでない人の特性の違いによって生じるバイアス
  • 特定の性質の人が脱落することによって生じるバイアス
  • データ収集期間が時間的に一致しないことによるバイアス
  • 対象者が特定の集団に所属していることによるバイアス

母集団を構成している全ての人から標本抽出できないことによるバイアス

これは不可避的なものでもあり、研究としての限界だとも思います。
 
例えば、65歳以上の高齢者の運動習慣を研究した場合、母集団は日本の65歳以上の高齢者すべてです。
 
ですが、日本のすべての高齢者を調査するわけにはいきませんので、標本という形で一部の高齢者を抽出して調査します。
 
この時、抽出した標本は母集団である日本の65歳以上高齢者の代表しているのかというのがバイアスが混入する要因です。
 
田舎の高齢者のみが標本に入っていた場合は、都市部の高齢者の特徴を反映していませんし、比較的若い高齢者ばかりでデータを取った場合は、より高齢な方のデータが入っていません。
 
このように標本を抽出する際にはバイアスが混入することを理解しておきましょう。
母集団から標本を抽出した図

自発的に研究参加した人とそうでない人の特性の違いによって生じるバイアス

これも研究の限界になることがあります。
 
研究というのは必ず対象者の自由意志により参加不参加を決めてもらいます。
 
この時、研究に参加することを選択した人はそうでない人よりも優位な特性があるのではというのがこのバイアスの考え方です。
 
また高齢者の運動習慣の例をとると、研究参加に同意した人はより積極的に社会に関与している可能性がありますし、そもそも運動習慣がなく、家から出ない高齢者はその研究に参加する機会もないと思います。
 
このように自発的に研究参加をする人だけの特性が研究に反映されてしまうというバイアスもあります。
自発的な研究参加者は研究にポジティブな特性を、研究参加を断った人は研究にネガティブな特性を持っている

特定の性質の人が脱落することによって生じるバイアス

次は、脱落サンプルのかたよりによるバイアスです。
 
特性の性質を持った人だけが研究から脱落し、その性質が研究結果に反映されない可能性があることによってバイアスが生じます。
 
例えば、ある難病患者の長期的経過を辿るような研究の場合、重度な対象者は早期死亡するなどして、極軽症な人は早期に治療が終了するなどして経過が辿れないことがあります。
 
結果として経過を辿りながらデータをとれた対象者は中等症ばかりだったなんてことが起こります。

データ収集期間が時間的に一致しないことによるバイアス

研究のデータ収集は長期間になることも多く、1年以上、5年以上データを取っていることもざらにあると思います。
 
期間が長くなればなるほど、時間的に一致しないことによるバイアスが混入する可能性は高くなります。
 
上の難病患者の経過を例に挙げると、研究期間中に新薬が開発されたり、新しい治療法が確立されたりして期間の前半で取ったデータと後半で取ったデータの前提条件が異なってしまうことがあります。
 
ここまで長期でなくても、夏に取ったデータと冬にとったデータではやはり気温という前提条件が異なってしまいます。
 
これも完全にコントロールすることは難しいので、研究の限界になり得ますかね。研究期間中に新治療法が確立された場合の図

対象者が特定の集団に所属していることによるバイアス

母集団によって生じるバイアスと少し似ていますが、対象者が特定に集団の属している人だけで構成されていた場合にもバイアスが混入します。
 
先ほどの高齢者の運動習慣の例をとれば、データを公民館で行われている体操教室に参加している高齢者からとったとします。
 
するとその対象者は体操教室という集団に属していますので、運動習慣は高い可能性がありますよね。
 
ほかにも消防士の人は体力がある、家族の多い人は預貯金が少ないなど所属する集団の属性によりバイアスが混入する可能性があります。

まとめ

  • バイアスとは研究の過程で生じる偶然ではない誤差
  • 選択バイアスとは対象者を選定する際に生じるバイアス
いかがだったでしょうか。今回は選択バイアスについて解説を行いました。
 
何度も言いますが、研究でバイアスを完全に取り除くことは不可能です。
 
ですが、だからと言ってバイアスを全く考慮しなくて良いというわけではありません。
 
取り除けるバイアスは極力取り除いた研究デザインを設計する。そのためにはまずはバイアスについて正しく理解しておいてください。
RELATED POST

COMMENT

メールアドレスが公開されることはありません。 が付いている欄は必須項目です

CAPTCHA