Metodologie; a invetigaci; n Metode parametrice pentru compararea a două mijloace

M. cercetare

Index de conținut

Introducere

În mod normal, în acest tip de analiză putem stabili o ipoteză de pornire (ipoteză nulă), care presupune în general că efectul interesului este nul, de exemplu că tensiunea arterială este aceeași la bărbați și femei sau că două tratamente pentru hipercolesterolemie sunt la fel de eficiente. Mai târziu, probabilitatea de a obține datele observate poate fi evaluată dacă această ipoteză este corectă. Valoarea acestei probabilități coincide cu valoarea p furnizată de fiecare test statistic, astfel încât, cu cât este mai mică, cu atât este mai puțin probabil ca ipoteza inițială să fie verificată.

În prima secțiune, testul t al studentului va fi prezentat pentru două eșantioane independente, introducând modificările necesare în cazul în care variabilitatea ambelor grupuri este diferită. Apoi, testul t al studentului va fi introdus pentru cazul a două eșantioane dependente.

Studentul pentru două eșantioane independente

Una dintre cele mai frecvente analize statistice în practică este probabil cea utilizată pentru a compara două grupuri independente de observații cu privire la o variabilă numerică. De exemplu, să luăm în considerare datele prezentate în Tabelul 1, corespunzătoare a 75 de indivizi supraponderali supuși la două diete diferite, astfel încât să dorim să comparăm greutatea indivizilor care au început fiecare dintre diete.

După cum a fost deja avansat, aplicarea unui test parametric necesită normalitatea observațiilor pentru fiecare dintre grupuri. Verificarea acestei ipoteze poate fi realizată atât prin metode grafice (prin intermediul histogramelor, graficelor cutiei sau graficelor de normalitate), cât și prin teste statistice (testul Kolmogorov-Smirnov, testul Shapiro-Wilks). Cu toate acestea, un număr suficient de observații (să spunem mai mult de 30), așa cum se întâmplă în exemplul dat, justifică utilizarea aceluiași www. De asemenea, acest tip de metodologie va necesita ca varianța în ambele grupuri de observații să fie aceeași. În primul rând, testul Student t va fi dezvoltat pentru cazul în care ambele condiții sunt verificate, discutând ulterior cum să abordăm formal cazul în care variațiile nu sunt similare.

Conform ipotezelor de normalitate și varianță egală, comparația ambelor grupuri poate fi efectuată în termeni de un singur parametru, cum ar fi valoarea medie (Figura 1a), astfel încât, în exemplul prezentat, ipoteza de pornire va fi, prin urmare:

H0: Greutatea inițială medie este aceeași în ambele grupuri

Va fi notat cu < X 1, X 2. X n> și < Y 1, Y 2. Y m> la greutatea observată la fiecare dintre subiecții supuși dietei A și respectiv dietei B. În general, numărul observațiilor din fiecare dintre grupurile comparate nu va trebui să coincidă, astfel încât în exemplul n = 40 și m = 35.

Testul t pentru două eșantioane independente se bazează pe statistică:

(1)

unde e denotă greutatea medie în fiecare dintre grupuri:

și, eșantionul corespondent corespondent:

Cu care, în acest caz particular, valoarea utilizată pentru contrast va fi:

Dacă ipoteza de pornire este adevărată, statistica (1) va urma o distribuție t a lui Student cu n + m-2 grade de libertate. Dacă da, valoarea obținută ar trebui să se încadreze în intervalul de probabilitate cea mai mare în conformitate cu această distribuție (Figura 2). De obicei, domeniul de date în care este concentrată 95% din probabilitate este luat ca referință. Valoarea p pe care o raportează de obicei majoritatea pachetelor statistice nu este altceva decât probabilitatea de a obține, conform acelei distribuții, date mai extreme decât cele furnizate de www. După cum sa menționat deja, reflectă și probabilitatea de a obține datele observate dacă ipoteza inițială ar fi adevărată. Dacă valoarea p este foarte mică (de obicei se ia în considerare p 0,05. În exemplul prezentat, valoarea p corespunzătoare este 0,425, deci nu există dovezi statistice că greutatea medie în ambele grupuri este diferită. În tabelul 2, gradele de libertate (în prima coloană) și valoarea lui α (în primul rând) sunt determinate. Numărul care determină intersecția lor este valoarea critică corespunzătoare. Astfel, dacă statistica obținută ia o valoare cu atât mai mare se va spune că diferența este semnificativă.