Machine learning for efficient and robust causal inference and prediction
2024 (English)Doctoral thesis, comprehensive summary (Other academic)Alternative title
Maskininlärning för effektiv och robust kausal inferens och prediktion (Swedish)
Abstract [en]
This thesis makes contributions within the area of causal inference, domain adaptation, and studies of health inequalities. The common theme is using asymptotic statistics, where estimators and predictors are shown to be asymptotically unbiased, normally distributed, and reach the asymptotic efficiency bound. Furthermore, due to the robustness of the solutions, the usage of flexible machine learning models like neural networks is justified.
The first work studies the necessary growth rate for convolutional neural network architectures, where asymptotically efficient estimation of causal effect estimators is aimed at, and convolutional neural networks are used to fit nuisance models. The proposed method is also applied to Swedish registry data in order to study the effects of early retirement on health outcomes.
The second article proposes an asymptotically efficient estimator for a novel causal parameter. The parameter of interest is the effect of an intervention on a counterfactual version of the concentration index, which is an index that represents socioeconomic-related health inequality. The real data application of this paper is the study of the effect of education on different health-related inequalities in a cohort of Swedes.
The third paper solves a problem in the field of domain adaptation in machine learning, where the training set is observed but it is not possible to assume that test and training sets follow the same distribution. A weaker assumption is instead considered, referred to as a generalized label shift. This paper proposes a robust and asymptotically efficient predictor under the generalized label shift assumption.
The last article is a vignette on the software developed to perform the analysis in the first paper. It is possible to utilize the software in a broader manner than what is described in the first paper. Several examples and more practical details are presented in this article in order to demonstrate how neural networks can be used in order to fit nuisance functions when the average treatment effect or the average treatment effect on the treated is the parameter of interest.
Abstract [sv]
Denna avhandling bidrar till området kausal inferens, domänanpassning och studier om ojämlikhet i hälsa. Det gemensamma motivet är att använda asymptotisk statistik, där estimatorer och prediktorer visas vara asymptotiskt väntevärdesriktiga, normalfördelade och nå den asymptotiska effektivitetsgränsen. Dessutom, på grund av robustheten hos lösningar, är användningen av flexibla maskininlärningsmodeller, så som neurala nätverk, motiverad.
Det första arbetet studerar den nödvändiga tillväxthastigheten för konvolutionella neurala nätverks arkitekturer, där asymptotiskt effektiva skattningar av kausala effekter är syftet och konvolutionella neurala nätverk används för att skatta störmodeller. Den föreslagna metoden tillämpas även på svenska registerdata för att studera effekterna av förtidspension på hälsoutfall.
Den andra artikeln föreslår en asymptotiskt effektiv estimator för en ny kausal parameter. Parametern av intresse är effekten av en intervention på en kontrafaktisk version av koncentrationsindexet, vilket är ett index som beskriver socioekonomisk ojämlikhet i hälsa. Datatillämpningen i denna uppsats studerar effekten av utbildning på olika hälsorelaterade ojämlikheter i en kohort svenskar.
Den tredje uppsatsen löser ett problem inom domänanpassning i maskininlärning, där träningsdata observeras men det är inte möjligt att anta att test- och träningsdata följer samma fördelning. Ett svagare antagande övervägs istället, kallad ett generaliserat etikettskifte. Denna artikel föreslår en robust och asymptotiskt effektiv prediktor under det generaliserade etikettskiftes antagandet.
Den sista artikeln är en vinjett som klargör programvaran som utvecklats för att utföra analysen i den första uppsatsen. Det är möjligt att använda programvaran på ett bredare sätt än vad som beskrivs i den första artikeln. Olika exempel och fler praktiska detaljer presenteras i denna artikel för att visa hur neurala nätverk kan användas för att skatta störfunktioner när syftet är att estimera den genomsnittliga behandlingseffekten i en population eller delpopulation av de behandlade.
Place, publisher, year, edition, pages
Umeå: Umeå University, 2024. , p. 20
Series
Statistical studies, ISSN 1100-8989 ; 59
Keywords [en]
Causal inference, Convolutional neural network, Concentration index, Generalized label shift, Machine learning, Asymptotic efficiency
National Category
Probability Theory and Statistics
Research subject
Statistics
Identifiers
URN: urn:nbn:se:umu:diva-230215ISBN: 978-91-8070-475-5 (print)ISBN: 978-91-8070-476-2 (electronic)OAI: oai:DiVA.org:umu-230215DiVA, id: diva2:1902456
Public defence
2024-10-25, Hörsal SAM.A.280, Samhällsvetarhuset, Umeå, 09:30 (English)
Opponent
Supervisors
Funder
Marianne and Marcus Wallenberg Foundation2024-10-042024-10-012024-10-08Bibliographically approved
List of papers