Umeå University's logo

umu.sePublikasjoner
Endre søk
RefereraExporteraLink to record
Permanent link

Direct link
Referera
Referensformat
  • apa
  • ieee
  • vancouver
  • Annet format
Fler format
Språk
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Annet språk
Fler språk
Utmatningsformat
  • html
  • text
  • asciidoc
  • rtf
Utvärdering av rule of ten för logistisk regression
Umeå universitet, Samhällsvetenskapliga fakulteten, Handelshögskolan vid Umeå universitet, Statistik.
Umeå universitet, Samhällsvetenskapliga fakulteten, Handelshögskolan vid Umeå universitet, Statistik.
2023 (svensk)Independent thesis Basic level (degree of Bachelor), 10 poäng / 15 hpOppgaveAlternativ tittel
Evaluating Rule of Ten for Logistic Regression (engelsk)
Abstract [sv]

Tidigare studier har visat att koefficientskattningar för logistisk regression inte är pålitliga när EPV (events per variable, händelser per variabel) är lågt. Baserat på dessa studier har en tumregel på minst 10 EPV föreslagits. Tumregeln kallas ’rule of ten’ och är vad som har undersökts i den här studien. För att utvärdera tumregeln gjordes en simuleringsstudie, i programmeringsspråket R, där nya datamaterial genererades baserat på ett verkligt datamaterial. 500 datamaterial genererades för varje stickprovsstorlek och EPV. För varje datamaterial skattades nya modeller och modellernas koefficienter användes för utvärderingen. Totalt analyserades 10 olika EPV och 18 stickprovsstorlekar. Resultaten bekräftar tidigare studier som visat att flera problem kan uppstå vid låga EPV och att stickprovsstorleken har mindre påverkan på resultaten. Problemen är också starkt relaterade till sambandet mellan förklarings- och responsvariabeln. 

Abstract [en]

Previous studies have shown that coefficient estimates for logistic regression are not reliable when EPV (events per variable, events per variable) is low. Based on these studies, a rule of thumb of at least 10 EPV has been proposed. The rule of thumb is called the 'rule of ten' and is what is being investigated in this study. To evaluate the rule of thumb, a simulation study was performed in the programming language R, where new datasets were generated based on an original dataset. 500 datasets were generated for each sample size and EPV. For each dataset, new models were evaluated which are evaluated by comparisons with the original model. A total of 10 different EPVs and 18 sample sizes were analyzed. The results confirm previous studies that have shown that several problems can occur at low EPV and that the sample size has a lesser effect on the results. The problems are also strongly related to the relationship between the independent and the dependent variable. 

sted, utgiver, år, opplag, sider
2023.
HSV kategori
Identifikatorer
URN: urn:nbn:se:umu:diva-210054OAI: oai:DiVA.org:umu-210054DiVA, id: diva2:1769804
Tilgjengelig fra: 2023-06-19 Laget: 2023-06-18 Sist oppdatert: 2023-06-19bibliografisk kontrollert

Open Access i DiVA

fulltext(3104 kB)841 nedlastinger
Filinformasjon
Fil FULLTEXT01.pdfFilstørrelse 3104 kBChecksum SHA-512
79d96af89588ae62c2e64941de7ad0f46bc619091d7eacbcfcdd45f786fc2360cee51037b0dc4c6ccc61c5844b1dec343e3dbc22b0a29410013213261bafebc1
Type fulltextMimetype application/pdf

Av organisasjonen

Søk utenfor DiVA

GoogleGoogle Scholar
Totalt: 841 nedlastinger
Antall nedlastinger er summen av alle nedlastinger av alle fulltekster. Det kan for eksempel være tidligere versjoner som er ikke lenger tilgjengelige

urn-nbn

Altmetric

urn-nbn
Totalt: 387 treff
RefereraExporteraLink to record
Permanent link

Direct link
Referera
Referensformat
  • apa
  • ieee
  • vancouver
  • Annet format
Fler format
Språk
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Annet språk
Fler språk
Utmatningsformat
  • html
  • text
  • asciidoc
  • rtf