positiv-promotion.ru

  

Bästa artiklarna:

  
Main / Vad betyder 99 betyder inte 100

Vad betyder 99 betyder inte 100

Som noterats i tidigare moduler är ett centralt mål för tillämpad biostatistik att göra slutsatser om okända populationsparametrar baserat på provstatistik.

Det finns två breda områden för statistisk inferens, uppskattning och hypotesprovning. Uppskattning är processen för att bestämma ett troligt värde för en populationsparameter e. I praktiken väljer vi ett urval från målpopulationen och använder exempelstatistik e.

Urvalet ska vara representativt för befolkningen, med deltagare slumpmässigt valda bland befolkningen. Vid generering av uppskattningar är det också viktigt att kvantifiera precisionen av uppskattningar från olika prover. Det finns ett antal populationsparametrar av potentiellt intresse när man uppskattar hälsoresultat eller "slutpunkter".

Många av de resultat vi är intresserade av att uppskatta är antingen kontinuerliga eller dikotoma variabler, även om det finns andra typer som diskuteras i en senare modul.

Dessutom, när två grupper jämförs är det viktigt att fastställa om grupperna är oberoende e. Tabellen nedan sammanfattar parametrar som kan vara viktiga att uppskatta i hälsorelaterade studier. Kontinuerlig variabel. Dikotom variabel. För båda kontinuerliga variablerna e. Kom ihåg att provmedel och provproportioner är opartiska uppskattningar av motsvarande populationsparametrar.

För både kontinuerliga och dikotoma variabler är konfidensintervalluppskattningen CI ett intervall av troliga värden för populationsparametern baserat på :.

I praktiken väljer vi emellertid ett slumpmässigt urval och genererar ett konfidensintervall, som kanske eller inte innehåller det verkliga medelvärdet. Konfidensintervallet återspeglar inte variationen i den okända parametern. Snarare speglar det mängden slumpmässigt fel i provet och ger ett antal värden som sannolikt kommer att inkludera den okända parametern.

Den centrala gränssatsen som introducerades i modulen om sannolikhet uppgav att fördelningen av provmedlen för stora prover är ungefär normalt fördelad med ett medelvärde :. The Central Limit Theorem anger att för stora prover :. Således är felmarginalen 1. Så den allmänna formen av ett konfidensintervall är: Önskat förtroendeintervall. T-fördelningen liknar den normala normalfördelningen men har en något annorlunda form beroende på provstorleken.

På sätt och vis kan man tänka på t-distributionen som en familj av distributioner för mindre prover. Istället för "Z" -värden finns "t" -värden för konfidensintervall som är större för mindre sampel, vilket ger större felmarginaler, eftersom små sampel är mindre exakta. Precis som med stora prover antar t-fördelningen att resultatet av intresse är ungefär normalt fördelat.

En tabell med t-värden visas i ramen nedan. Observera att tabellen också kan nås från "Övriga resurser" till höger på sidan.

Anta att vi vill uppskatta det genomsnittliga systoliska blodtrycket, kroppsmassindex, total kolesterolnivå eller antalet vita blodkroppar i en enda målpopulation. Vi väljer ett prov och beräknar beskrivande statistik inklusive provstorleken n, provets medelvärde och provets standardavvikelse. Formlerna för konfidensintervall för populationens medelvärde beror på urvalsstorleken och anges nedan. Både tabellen över Z-poäng och tabellen över t-poäng kan också nås från "Övriga resurser" till höger på sidan.

En poängskattning för det verkliga systoliska blodtrycket i befolkningen är 127. Felmarginalen är mycket liten här på grund av den stora provstorleken.

Eftersom urvalsstorleken är liten måste vi nu använda konfidensintervallformeln som involverar t snarare än Z. Observera att felmarginalen här är större främst på grund av den lilla urvalsstorleken. Antag att vi vill uppskatta andelen personer med diabetes i en befolkning eller andelen personer med högt blodtryck eller fetma. Dessa diagnoser definieras av specifika nivåer av laboratorietester och mätningar av blodtryck respektive kroppsmassindex.

Ämnen definieras som att de har dessa diagnoser eller inte, baserat på definitionerna. När resultatet av intresse är dikotomt så här indikerar posten för varje medlem i provet att ha tillståndet eller karakteristiken av intresse eller inte. Kom ihåg att för dikotomiska resultat definierar utredaren att ett av resultaten är "framgång" och det andra ett misslyckande. Provstorleken betecknas med n, och vi låter x beteckna antalet "framgångar" i provet.

Om vi ​​till exempel vill uppskatta andelen personer med diabetes i en befolkning anser vi att diagnosen diabetes är en "framgång" i. Om det finns fler än 5 framgångar och fler än fem misslyckanden kan konfidensintervallet beräknas med denna formel :. Punktuppskattningen för befolkningsandelen är urvalsproportionen och felmarginalen är produkten av Z-värdet för önskad konfidensnivå e.

Med andra ord är standardfelet i punktuppskattningen :. Denna formel är lämplig för stora prover, definierade som minst 5 framgångar och minst 5 misslyckanden i provet. Detta var ett villkor för Central Limit Theorem för binomiala resultat. Om det finns färre än fem framgångar eller misslyckanden måste alternativa procedurer, som kallas exakta metoder, användas för att uppskatta befolkningsandelen. Provproportionen är :. Detta är punktuppskattningen, dvs.

Provet är stort, så konfidensintervallet kan beräknas med formeln :. Specifika tillämpningar av uppskattning för en enskild population med ett dikotomt resultat involverar uppskattning av prevalens, kumulativ incidens och incidens. Tabellen nedan, från den femte undersökningen av Framingham Offspring-kohorten, visar antalet män och kvinnor som hittats med eller utan hjärt-kärlsjukdom.

Det finns många situationer där det är intressant att jämföra två grupper med avseende på deras genomsnittliga poäng på ett kontinuerligt resultat. Vi kan till exempel vara intresserade av att jämföra genomsnittligt systoliskt blodtryck hos män och kvinnor, eller kanske jämföra kroppsmassindex BMI hos rökare och icke-rökare. Båda dessa situationer involverar jämförelser mellan två oberoende grupper, vilket innebär att det finns olika människor i grupperna som jämförs.

Vi kunde börja med att beräkna provstorlekarna n 1 och n 2, medelvärden och standardavvikelserna s 1 och s 2 i varje prov. Poänguppskattningen för skillnaden i populationsmedel är skillnaden i provmedel :. Konfidensintervallet kommer att beräknas med antingen Z- eller t-fördelningen för den valda konfidensnivån och standardfelet i punktuppskattningen.

Standardfelet i punktuppskattningen kommer att inkludera variationen i resultatet av intresse i var och en av jämförelsegrupperna. Om vi ​​antar lika avvikelser mellan grupper kan vi samla informationen om variabilitetsprovvariationer för att generera en uppskattning av befolkningsvariabiliteten. Därför är standardfelet SE för skillnaden i provmedel den sammanlagda uppskattningen av den gemensamma standardavvikelsen Sp, förutsatt att variationerna i populationerna är lika beräknade som det vägda genomsnittet av standardavvikelserna i proverna, d.v.s.

Om provstorlekarna är större, det vill säga både n 1 och n 2 är större än 30, använder man z-tabellen. För både stora och små prover är Sp den sammanlagda uppskattningen av den gemensamma standardavvikelsen förutsatt att variationerna i populationerna är lika beräknade som det viktade genomsnittet av standardavvikelserna i proverna.

Dessa formler antar lika variation i de två populationerna i. För analys har vi prover från var och en av jämförelsepopulationerna, och om provvariationerna är lika, är antagandet om variation i populationerna rimligt. Om inte, måste alternativa formler användas för att ta hänsyn till heterogeniteten i avvikelser. Därefter kommer vi att kontrollera antagandet om lika variation i befolkningsvariationer. Förhållandet mellan provvariationerna är 17. Observera att för detta exempel är Sp, den sammanlagda uppskattningen av den gemensamma standardavvikelsen, 19, och detta faller mellan standardavvikelserna i jämförelsegrupperna i.

Därför är konfidensintervallet 0. Vår bästa uppskattning av skillnaden, punktuppskattningen, är 1. Standardfelet för skillnaden är 0. Observera att när vi genererar uppskattningar för en populationsparameter i ett enda prov e. Däremot ger konfidensintervallet ett värdeintervall för skillnaden när man jämför två oberoende prover på detta sätt. I detta exempel uppskattar vi att skillnaden i genomsnittligt systoliskt blodtryck är mellan 0.

I detta exempel betecknade vi godtyckligt männen som grupp 1 och kvinnor som grupp 2. Hade vi utsett grupperna på andra sätt i. Tabellen nedan sammanfattar skillnader mellan män och kvinnor med avseende på de egenskaper som anges i den första kolumnen.

Den andra och tredje kolumnen visar medelvärdet och standardavvikelserna för män respektive kvinnor. Män har lägre genomsnittliga totala kolesterolnivåer än kvinnor; var som helst från 12. Männen har högre medelvärden för var och en av de andra egenskaperna som betraktas indikeras av de positiva konfidensintervallen.

Konfidensintervallet för skillnaden i medel ger en uppskattning av den absoluta skillnaden i medel för utfallsvariabeln av intresse mellan jämförelsegrupperna. Det är ofta av intresse att bedöma om det finns en statistiskt meningsfull skillnad mellan jämförelsesgrupper.

Denna bedömning baseras på om den observerade skillnaden är större än vad man förväntar sig av en slump. Om det inte finns någon skillnad mellan populationsmedlet, blir skillnaden noll i. Noll är parameterns nullvärde i detta fall skillnaden i medelvärde.

Om konfidensintervallet inte inkluderar nollvärdet drar vi slutsatsen att det finns en statistiskt signifikant skillnad mellan grupperna. För var och en av egenskaperna i tabellen ovan finns en statistiskt signifikant skillnad i medel mellan män och kvinnor, eftersom inget av konfidensintervallen inkluderar nollvärdet, noll.

Observera dock att några av medlen inte skiljer sig mycket mellan män och kvinnor e. Detta innebär att det finns en liten men statistiskt meningsfull skillnad i medel. När det finns små skillnader mellan grupper kan det vara möjligt att visa att skillnaderna är statistiskt signifikanta om provstorleken är tillräckligt stor, som det är i detta exempel. Följande tabell innehåller beskrivande statistik om samma kontinuerliga egenskaper i delprovet stratifierat efter kön.

Vi kommer återigen godtyckligt att utse män grupp 1 och kvinnor grupp 2. Eftersom urvalsstorlekarna är små i. Vi kommer dock först att kontrollera om antagandet om jämlikhet med befolkningsvariationer är rimligt. Förhållandet mellan provvariationerna är 9.

(с) 2019 positive-promotion.ru