Problém s falošnou pozitivitou testov v zdravej populácii

Tento článok ilustruje, prečo je nevhodné použiť jediný test na zdravej populácii.

Príklad:

Ak má test na ochorenie pravdepodobnosť správnej diagnózy 0,95 a ak je výskyt choroby X v populácii 100000 ľudí 2%, koľko falošne pozitívnych výsledkov dostaneme, ak otestujeme náhodnú vzorku 5000 ľudí?

Riešenie:

Pravdepodobnosť falošne pozitívneho výsledku v tomto prípade bude daná pravdepodobnosťou, že test ukáže pozitívny výsledok u zdravého jedinca.

Pravdepodobnosť falošne pozitívneho výsledku je komplementárna k pravdepodobnosti správnej diagnózy, teda (1 – 0,95 = 0,05).

Teraz potrebujeme zistiť, koľko ľudí z náhodnej vzorky 5000 ľudí bude mať falošne pozitívny výsledok.

Ak je výskyt choroby X v populácii 2%, znamená to, že 2% z 100000 ľudí je chorých, čo je 2000 ľudí. Zvyšných 98000 ľudí je zdravých.

Avšak, test má pravdepodobnosť falošne pozitívneho výsledku 5%, takže 5% z 98000 ľudí (zdravých) dostaneme falošne pozitívny výsledok.

0,05 * 98000 = 4900

Takže otestovaním náhodnej vzorky 5000 ľudí by sme očakávali približne 4900 falošne pozitívnych výsledkov.

Skúška správnosti:

Vytvoríme si jednoduchý PHP skript na overenie tohto tvrdenia:

<?php
// Počet simulácií
$num_simulations = 100000;

// Počet zdravých jedincov v populácii
$num_healthy = 98000;

// Počet chorých jedincov v populácii
$num_sick = 2000;

// Pravdepodobnosť správnej diagnózy
$probability_correct_diagnosis = 0.95;

// Pravdepodobnosť falošne pozitívneho výsledku
$probability_false_positive = 1 - $probability_correct_diagnosis;

// Počet falošne pozitívnych výsledkov
$num_false_positives = 0;

// Simulácia
for ($i = 0; $i < $num_simulations; $i++) {
  // Otestujeme náhodnú vzorku 5000 ľudí
  $tested_sample = mt_rand(0, $num_healthy + $num_sick - 1);

  // Ak test vykazuje falošne pozitívny výsledok pre zdravého jedinca
  if ($tested_sample < $num_healthy) {
    $num_false_positives++;
  }
}

// Výpočet percentuálnych falošne pozitívnych výsledkov
$percent_false_positives = ($num_false_positives / $num_simulations) * 100;

// Výstup
echo "Počet falošne pozitívnych výsledkov: $num_false_positives\n";
echo "Percento falošne pozitívnych výsledkov: $percent_false_positives%\n";
?>