umu.sePublications
Change search
CiteExportLink to record
Permanent link

Direct link
Cite
Citation style
  • apa
  • ieee
  • modern-language-association-8th-edition
  • vancouver
  • Other style
More styles
Language
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Other locale
More languages
Output format
  • html
  • text
  • asciidoc
  • rtf
Klassificeringsmetoder med medicinska tillämpningar: En jämförande studie mellan logistisk regression, elastic net och random forest
Umeå University, Faculty of Social Sciences, Umeå School of Business and Economics (USBE), Statistics.
Umeå University, Faculty of Social Sciences, Umeå School of Business and Economics (USBE), Statistics.
2016 (Swedish)Independent thesis Basic level (degree of Bachelor), 10 credits / 15 HE creditsStudent thesisAlternative title
Classification methods in medical applications : A comparative study between logistic regression, elastic net and random forest (English)
Abstract [sv]

Idag genererar den medicinska forskningen mycket stora mängder data med en skiftande karaktär. Detta har gjort att statistiska klassificeringsmetoder blivit allt mer populära som beslutstöd inom medicinsk forskning och praktik. Den här uppsatsen försöker reda ut om någon av klassificeringsmetoderna logistisk regression, elastic net eller random forest presterar bättre än övriga metoder när datamaterialets förhållande mellan observationer och förklaringsvariabler varierar. Metodernas klassificeringsprestation utvärderas med hjälp av korsvalidering. Resultatet visar att metoderna presterar likvärdigt när datamaterialet består av fler observationer än förklaringsvariabler och även då datamaterialet innehåller fler förklaringsvariabler än observationer. Däremot presterar elastic net klart bättre än de övriga metoderna på det datamaterial där antalet observationer är ungefär lika som antalet förklaringsvariabler. Vidare tyder resultaten på att alla tre metoder med fördel kan användas på datamaterial med fler variabler än observationer vilket är vanligt för datamaterial som rör genetik. Detta givet att en manuell variabelselektion sker för logistisk regression för att metoden ska kunna appliceras i denna situation.

Place, publisher, year, edition, pages
2016.
National Category
Probability Theory and Statistics
Identifiers
URN: urn:nbn:se:umu:diva-122698OAI: oai:DiVA.org:umu-122698DiVA: diva2:940599
Educational program
Statistics programme
Available from: 2016-06-21 Created: 2016-06-21 Last updated: 2016-06-21Bibliographically approved

Open Access in DiVA

fulltext(810 kB)103 downloads
File information
File name FULLTEXT01.pdfFile size 810 kBChecksum SHA-512
f18941b8d0c997592d41414075026e68486cf9f37a5ed6c1580f792af966dd352f7ac65d8c8b4245b9412a2cf4d0fd4b8c7b6199d5ca68f6ccb0a43765202bbc
Type fulltextMimetype application/pdf

By organisation
Statistics
Probability Theory and Statistics

Search outside of DiVA

GoogleGoogle Scholar
Total: 103 downloads
The number of downloads is the sum of all downloads of full texts. It may include eg previous versions that are now no longer available

urn-nbn

Altmetric score

urn-nbn
Total: 300 hits
CiteExportLink to record
Permanent link

Direct link
Cite
Citation style
  • apa
  • ieee
  • modern-language-association-8th-edition
  • vancouver
  • Other style
More styles
Language
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Other locale
More languages
Output format
  • html
  • text
  • asciidoc
  • rtf