第345話｜明日からできる「比較のための因果推論」の手法3選

ビジネスシーンで「比較のための因果推論」をすることは、意識していないだけで、実は意外と多いです。

例えば……

新製品の価格設定を検討している
マーケティングキャンペーンの効果を評価したい
従業員研修プログラムの効果を測定したい
新薬の効果を評価したい
ウェブサイトのデザイン変更の効果を評価したい

……などなど、例を上げればいくらでもあります。

要は、何か新しいことを始めたとき、何かを変えたとき、そのようなときに「比較のための因果推論」をします。

因果推論と聞くと難しく感じますが、従来からある比較的な簡単な手法でも実施することができます。

ただ、データによる因果推論は、あくまでもデータ上の議論なので、本当の因果なのかは不明です。そのあたりは注意しましょう。

ということで今回は、「明日からできる『比較のための因果推論』の手法3選」というお話しをします。

Contents

とりいそぎ3選
典型事例
　ランダム化比較試験 (RCT)
　マッチング法（傾向スコア）
　回帰分析
3つの方法論の前提条件と使い分け方
組み合わせ事例
　新製品の価格設定を検討している
　マーケティングキャンペーンの効果を評価したい
　従業員研修プログラムの効果を測定したい
　新薬の効果を評価したい
　ウェブサイトのデザイン変更の効果を評価したい
手順
　ランダム化比較試験 (RCT)
　マッチング法（傾向スコア）
　回帰分析
今回のまとめ

とりいそぎ3選

従来からある比較的な簡単な、比較のための因果推論のための3つの手法です。

ランダム化比較試験 (RCT)
ランダムに処置群と対照群に分け、その結果を比較します。その差は処置の効果として解釈されます。この手法は、統計的なバイアスを最小限に抑えるため、最も堅牢な因果関係の証拠を提供します。

マッチング法（傾向スコア）
これは、処置群の各観測に対して、対照群から類似した観測を見つけて比較する方法です。これにより、処置の効果が評価されます。傾向スコアマッチングは、マッチング法の一つで、処置を受ける確率（傾向スコア）に基づいてマッチングを行います。

回帰分析
回帰分析を使うと、処置の効果を他の変数を制御した上で推定できます。処置変数と結果変数間の関係性を調べることができます。

【用語】

処置群（Treatment Group）: 処置群は、特定の介入や処置（例えば、新たな製品の使用、特定の医療処置の受け取り、あるプログラムへの参加など）を受けるグループのことを指します。
対照群（Control Group）: 対照群は、比較のために設けられ、処置群とは異なり、特定の介入や処置を受けていないグループのことを指します。
処置変数（Treatment Variable）: 処置変数は、特定の介入や処置が行われたかどうかを示す変数です。例えば、特定の製品を購入したかどうか、特定のトレーニングプログラムに参加したかどうかなど、対象が処置群であるか対照群であるかを示します。
結果変数（Outcome Variable）: 結果変数は、因果推論の目的に基づいて選択され、その効果を測定したい特定の変数です。例えば、製品の売上、テストスコアの改善、患者の健康状態の改善などが考えられます。

典型事例

比較のための因果推論のための3つの手法の、ありがちなビジネス事例をを使い、それぞれを説明します。

　ランダム化比較試験 (RCT)

ランダム化比較試験 (RCT)が使われる一つの典型的な例は、A/Bテストです。

これはウェブサイトのデザイン、広告キャンペーン、製品価格など、ビジネス戦略の異なる要素の効果をテストするためによく使われます。

具体的な事例として、あるEコマース企業がウェブサイトのデザインを改善し、その結果売上が向上するかどうかをテストしたいと考えているとします。

企業はランダム化されたA/Bテストを実施することを決定します。その結果、一部の訪問者（グループA）は既存のウェブサイトデザインを見ますが、一方、他の訪問者（グループB）は新しいウェブサイトデザインを見ます。

テストの終わりに、企業は各グループからの購買データを分析し、新しいデザイン（B）が既存のデザイン（A）に比べて売上を向上させたかどうかを決定します。

この例では、ランダム化（訪問者がどのデザインを見るかはランダム）は混乱因子（例えば、訪問者の年齢、性別、過去の購買行動など）の影響を制御し、デザインの変更が売上にどのような影響を与えたかをより正確に理解するのに役立ちます。

このように、ビジネスにおいても、ランダム化は一つの介入（この場合はウェブサイトのデザイン変更）が特定の結果（この場合は売上）に因果的に影響を与えるかどうかを確認するための強力なツールとなります。

　マッチング法（傾向スコア）

マッチング法が使われる一つの典型的な例は、新たなプロモーションやマーケティング戦略の効果を評価する事例です。

例えば、ある小売企業が新たなロイヤルティプログラムを導入し、その効果を評価したいと考えているとしましょう。

プログラムは一部の顧客（処置群）に提供され、残りの顧客（対照群）には提供されません。この場合、ランダム化は常に可能なわけではないため、企業はマッチングのアプローチを選択するかもしれません。

この場合、企業は購入履歴、年齢、地域などの共変量に基づいて処置群と対照群の顧客をマッチングします。それぞれの処置群の顧客に対して、対照群から最も似た特性を持つ顧客が見つけ出され、マッチングされます。

その後、企業はロイヤルティプログラムの導入後の購入行動を比較します。このマッチングにより、その他の要素が同等であるときにロイヤルティプログラムが購入行動にどのような影響を与えるかを評価することが可能になります。

この結果を元に、企業はロイヤルティプログラムの効果をより正確に理解し、その戦略を改善するための洞察を得ることができます。

ただし、この方法には注意が必要です。マッチングは観察された共変量を制御しますが、観察されていない共変量（隠れたバイアス）による影響は制御できません。したがって、結果の解釈は注意深く行う必要があります。

　回帰分析

回帰分析が使われる一つの典型的な例は、製品価格と売上の関係を評価する事例です。

企業が製品の価格を変更すると、その影響を売上に対して理解するために回帰分析を行うことがあります。この場合、説明変数は製品の価格であり、結果変数は売上です。

しかし、売上は価格だけでなく、他の多くの要素によっても影響を受けます。これには、広告支出、競合他社の価格、季節性、経済状況などが含まれます。したがって、これらの要素を追加の説明変数として回帰モデルに含めることができます。

回帰モデルはこれらの変数が一定であると仮定した場合に、価格が売上にどのように影響を与えるかを評価します。例えば、すべての他の条件が等しいと仮定した場合、価格が1%上昇すると売上が何%変化するかを示すことができます。

しかしながら、この手法には注意が必要です。回帰分析は、観察データに基づくため、価格と売上の間の因果関係を確立するのは難しいかもしれません。価格の変更が売上に影響を与えるという結論を導く前に、他の可能な説明を排除することが重要です。これには、他の未観測の変数（例えば、消費者の好みの変化）が売上に影響を与える可能性が含まれます。

3つの方法論の前提条件と使い分け方

何となく、この3つの因果推論の方法論の違いが、見えてきたのではないでしょうか。

3つの因果推論の方法論は特定の前提条件を持ち、置かれている状況に応じて使い分ける必要があります。

そこで、以下のようにそれぞれの前提条件と使い分け方を整理しました。

	前提条件	使い分け
ランダム化比較試験 (RCT)	ランダム化は介入の割り当てがランダムであることを前提とします。つまり、対照群と処置群の割り当ては偶然に依存し、結果変数とは無関係であるべきです。	ランダム化は新しいプログラムやポリシーを評価する際、または新しい治療法をテストする際など、直接的な介入の効果を明確に評価できる状況で最も強力です。ただし、すべての状況でランダム化が可能または適切であるわけではありません。
マッチング法（傾向スコア）	マッチングは、観察データから因果関係を推定する際のバイアスを軽減するためのものです。これは共変量（観測された変数）が適切に測定され、比較できるようにマッチングできるという前提に基づいています。	マッチングは、ランダム化が不可能または不適切な場合、特に有用です。たとえば、経済的、倫理的、または実用的な理由からランダム化実験が不可能な場合などです。
回帰分析	回帰分析はデータが特定の統計的特性（例えば、線形性、独立性、均質性の分散、正規性など）を持つことを前提としています。これらの前提が満たされない場合、回帰分析の結果は無効になる可能性があります。	回帰分析は複数の変数が結果にどのように影響を与えるかを同時に評価したい場合に特に有用です。観察データに基づいて因果関係を探るためにも使われますが、その結果は観察されていない混乱因子の可能性を常に考慮する必要があります。

これらの方法論は、因果推論の目的、データの種類、そして問題の文脈によって使い分けるべきです。

また、これらの手法は相互に排他的なものではなく、しばしば組み合わせて使用されます。

組み合わせ事例

冒頭で登場した……

新製品の価格設定を検討している
マーケティングキャンペーンの効果を評価したい
従業員研修プログラムの効果を測定したい
新薬の効果を評価したい
ウェブサイトのデザイン変更の効果を評価したい

……における、3つの方法論の組み合わせ事例を紹介します。

　新製品の価格設定を検討している

企業が新製品の価格設定を検討しています。

この企業は、新製品の価格が販売数にどのように影響するかを理解したいと考えています。このような問題に対する答えは、製品の最適な価格を設定し、利益を最大化するための重要な情報を提供します。

ランダム化: 企業はランダム化比較試験（RCT）を実施することを決定しました。選ばれた顧客群に対して、同じ製品を異なる価格で販売します。価格はランダムに割り当てられ、その後、どの価格が最も高い販売数を生み出すかを分析します。
マッチング: その後、企業は既存のデータを用いて、製品の価格と販売数の関係をより深く理解しようとします。このデータは、同じ製品が様々な価格で販売された過去のトランザクションから得られます。企業はマッチング技術（例えば傾向スコアマッチング）を用いて、同じような特性を持つが異なる価格で製品を購入した顧客群を比較します。これにより、価格変動が販売数にどのような影響を与えるかを推定します。
回帰分析: 最後に、企業は回帰分析を用いて、価格と販売数の間の関係性をさらに詳しく調査します。この分析では、価格だけでなく、他の可能な要因（例えば、顧客の年齢、性別、地域など）も考慮に入れます。これにより、価格以外の要素が販売にどのように影響するかを理解し、より正確な予測を行うことが可能になります。

これらの手法を組み合わせることで、企業は新製品の最適な価格設定を行い、最大の利益を達成するための洞察を得ることができます。

　マーケティングキャンペーンの効果を評価したい

企業が新しいマーケティングキャンペーンの効果を評価したいと考えている場合を考えています。

ランダム化: 企業は顧客データベースをランダムに二つに分け、一方にだけ新しいマーケティングキャンペーンを実施します。これにより、キャンペーンの効果をきちんと評価することができます。一方のグループ（実験グループ）ではキャンペーンが展開され、もう一方のグループ（対照グループ）では展開されません。キャンペーンの後で、両者の購入行動を比較し、キャンペーンの影響を測定します。
マッチング: キャンペーンが特定の顧客セグメントにしか展開できなかった場合、マッチングを利用して効果を評価します。例えば、キャンペーンが都市部の顧客にしか展開されていない場合、都市部の顧客（実験グループ）と同様の特性を持つ非都市部の顧客（対照グループ）を見つけることで比較します。この場合、マッチングにより、都市部と非都市部の顧客間で自然発生する可能性のある違いを調整できます。
回帰分析: また、企業は回帰分析を用いて、マーケティングキャンペーンの影響をより詳しく理解します。ここでは、キャンペーンへの曝露（説明変数）と購入行動（応答変数）の間の関係を分析します。その他の影響因子（年齢、性別、所得など）もモデルに含めることで、これらの因子が結果にどのように影響するかを理解します。

これらの手法を組み合わせることで、企業はマーケティングキャンペーンの効果をきちんと評価し、今後のマーケティング戦略を策定するための重要な洞察を得ることができます。

　従業員研修プログラムの効果を測定したい

ある企業が新しい従業員研修プログラムの効果を測定したいと考えています。

研修プログラムが従業員の生産性や職場満足度にどのように影響するかを理解することは、そのプログラムが時間とリソースに見合った価値があるかを決定するのに重要です。

ランダム化: 企業は新しい研修プログラムを導入し、全従業員の中からランダムに一部の従業員を選び、新しい研修プログラムを受けさせます。その後、新しい研修を受けた従業員（実験グループ）と、通常の研修を受けた従業員（対照グループ）の間で生産性や職場満足度の違いを比較します。
マッチング: 研修プログラムがすべての従業員に対してランダムに割り当てられない場合、企業はマッチング手法を用いて、新しい研修を受けた従業員と似た特性を持つ他の従業員を見つけ、その効果を比較します。
回帰分析: さらに企業は、研修プログラムが従業員の生産性や職場満足度にどのように影響するかを詳しく理解するために、回帰分析を使用します。この分析では、他の可能性のある影響因子（従業員の経験、職位、教育水準など）を考慮に入れ、これらの要素が結果にどのように影響するかを理解し、研修プログラムの効果をより正確に評価します。

これらの手法を用いて、企業は新しい研修プログラムが実際に従業員の生産性や職場満足度を向上させるのに有効であるかを評価し、その結果を基に研修プログラムの改善や調整を行うことができます。

　新薬の効果を評価したい

ある製薬会社が新薬の効果を評価したいと考えています。

この新薬が既存の治療法よりも効果的であることを示すことは、製品の市場での成功を大いに左右します。

ランダム化: 製薬会社は新薬のランダム化比較試験（RCT）を行います。患者群をランダムに二つに分け、一方に新薬を、もう一方には既存の治療法またはプラセボ（効果のない薬）を施します。その後、二つのグループの患者の回復率や副作用の発生率を比較します。
マッチング: 新薬の影響をより深く理解するため、製薬会社はさらにマッチング手法を利用します。例えば、新薬を使用した患者と、既存の治療法を受けたが新薬を使用した患者と類似の特性を持つ患者とをマッチングし、新薬の効果を比較します。
回帰分析: 最後に、製薬会社は回帰分析を利用して、新薬の効果をより詳しく理解します。ここでは、新薬の使用と治療結果との間の関係を詳細に調べ、他の可能性のある影響因子（例えば、患者の年齢、性別、既存の健康状態など）を調整します。

これらの手法を組み合わせることで、製薬会社は新薬の効果を科学的かつ正確に評価し、新薬が市場で成功する確率を最大化することができます。

　ウェブサイトのデザイン変更の効果を評価したい

Eコマース企業がウェブサイトの新しいデザイン変更の効果を評価したいと考えています。

ウェブサイトのデザイン変更がユーザー体験や売上にどのように影響するかを把握することは、ビジネスの成長と収益性に直接的な影響を与えます。

ランダム化: この企業は新しいウェブサイトデザインのA/Bテスト（ランダム化比較試験）を行います。訪問者をランダムに二つのグループに分け、一つのグループには新デザインを、もう一つのグループには旧デザインを見せます。その後、新旧のデザインを見た訪問者の行動（例えば、ページビュー数、平均滞在時間、購入行動など）を比較します。
マッチング: さらに、新旧のデザインが特定の顧客セグメントに対して異なる効果を持つ可能性があるため、この企業はマッチング手法を利用します。新デザインを見た訪問者と似た特性を持つ旧デザインを見た訪問者をマッチングし、新デザインの効果を比較します。
回帰分析: 最後に、新デザインの効果をより詳細に把握するために、この企業は回帰分析を利用します。この分析では、新デザインの影響と他の要素（例えば、訪問者のデモグラフィック情報、訪問時間、前回の購入行動など）との関連性を調査します。

これらの手法を組み合わせることで、Eコマース企業は新しいウェブサイトデザインの影響を正確に評価し、その結果をもとにデザインの改善や最適化を行うことができます。

手順

　ランダム化比較試験 (RCT)

ランダム化比較試験（RCT）は、ある介入が効果的であるかどうかを判断するための最も信頼性の高い方法の一つで、以下のような手順を通じて実施されます。

参加者の募集: RCTは対象となる人々を集めることから始まります。これらの参加者は、因果推論の目的に応じて選ばれます。
ランダム化: 集められた参加者はランダムに二つのグループに分けられます。一つは実験群（または介入群）で、新たな介入を受けるグループです。もう一つは対照群で、これは新たな介入を受けず、プラセボ（効果がないとされるもの）や現在の最善の治療法などを受けるグループです。
介入の実施: 実験群には試験的な介入（新薬、新療法、新プログラムなど）が施され、対照群にはプラセボや現在の最善の治療法が施されます。
アウトカムの追跡: データ取得期間中、参加者のアウトカム（結果）を観察・追跡します。アウトカムは介入の効果を判断するためのもので、これは症状の改善、テストスコアの向上、行動の変化など、因果推論の目的によります。
データ分析: データ取得期間が終わったら、実験群と対照群のアウトカムを比較します。もし実験群のアウトカムが対照群に比べて統計的に有意に改善していれば、その介入は効果的であると結論付けることができます。

ランダム化比較試験は、介入が因果関係を持つ可能性を示すことができる信頼性の高い方法で、医学研究や政策評価、ビジネスの意思決定など、様々な分野で使用されています。

　マッチング法（傾向スコア）

傾向スコアマッチングは、観察データから因果関係を推定する方法の一つであり、交絡因子の影響を制御するために使用されます。傾向スコアは、ある処置（または介入）を受ける確率を表します。以下に、傾向スコアマッチングの基本的な手順を示します。

処置変数と共変量の選択: 処置変数（介入を受けたかどうかを示す変数）と共変量（介入と結果の両方に影響を与える可能性がある他の変数）を選択します。
傾向スコアの推定: 共変量に基づいて処置変数を予測するロジスティック回帰モデル（または他の適切なモデル）を推定します。このモデルの推定確率が傾向スコアとなります。
マッチング: 各観察値について、同じ（または非常に近い）傾向スコアを持つ処置群と対照群の観察値をマッチングします。これには様々な方法があります。例えば、最近傍マッチング、カルパーン-ロビンズマッチング、最適マッチングなどがあります。
処置効果の推定: マッチングしたペアに対して処置の効果（結果の平均の差）を計算します。これが処置の平均的効果（ATE）または処置群の平均的効果（ATT）となります。
バイアスのチェック: マッチング後の共変量のバランスをチェックし、必要に応じてマッチングを調整します。共変量のバランスが達成されている場合、それらの共変量は処置と結果間の関係を交絡することはないと考えられます。

以上が傾向スコアマッチングの基本的な手順ですが、具体的な手順は因果推論の目的やデータの性質により異なることがあります。また、傾向スコアマッチングが適切な結果をもたらすためには、強い無視可能性仮定（すなわち、共変量が与えられると処置が結果に対してランダムであるという仮定）が満たされていることが必要です。

　回帰分析

因果推論における回帰分析は、特定の介入や処置が結果にどの程度影響を与えるかを定量的に評価するための強力なツールです。以下に、比較のための因果推論における回帰分析の基本的な手順を示します。

因果関係の仮説設定: 因果関係の仮説を明確に設定します。たとえば、「特定の広告キャンペーンは製品の売上に正の影響を与える」という仮説が考えられます。
データの収集: 介入の効果を推定するためのデータを収集します。データは介入の有無や程度、そして関心のある結果（この場合は売上）を含むべきです。また、潜在的な交絡因子（つまり、介入と結果の両方に影響を与える可能性のある他の変数）についても情報を収集すると良いでしょう。
モデルの設定: 独立変数（この場合は広告キャンペーン）と従属変数（売上）間の関係を表す回帰モデルを設定します。このモデルには通常、潜在的な交絡因子も含まれます。
モデルの推定: 回帰モデルのパラメータ（すなわち、回帰係数）をデータに基づいて推定します。これにより、介入の効果の大きさと方向を定量化することができます。
モデルの評価: 推定したモデルがデータにどれだけよくフィットしているかを評価します。また、モデルの仮定（例えば、誤差項の独立性や等分散性）が満たされているかを確認します。
結果の解釈と報告: 最後に、回帰係数の統計的な有意性と実務上の意義を評価し、その結果を適切な形式で報告します。

このようにして、回帰分析を用いて比較のための因果推論を行うことができます。ただし、回帰分析にはその仮定や限界があり、それらを適切に理解し、結果の解釈に反映させることが重要です。