Umeå universitets logga

umu.sePublikationer
Ändra sökning
RefereraExporteraLänk till posten
Permanent länk

Direktlänk
Referera
Referensformat
  • apa
  • ieee
  • vancouver
  • Annat format
Fler format
Språk
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Annat språk
Fler språk
Utmatningsformat
  • html
  • text
  • asciidoc
  • rtf
Convolutional neural networks for valid and efficient causal inference
Umeå universitet, Samhällsvetenskapliga fakulteten, Handelshögskolan vid Umeå universitet, Statistik.ORCID-id: 0000-0003-0633-0177
Umeå universitet, Samhällsvetenskapliga fakulteten, Handelshögskolan vid Umeå universitet, Statistik.ORCID-id: 0000-0001-5442-9708
Umeå universitet, Samhällsvetenskapliga fakulteten, Handelshögskolan vid Umeå universitet, Statistik.ORCID-id: 0000-0003-3187-1987
2024 (Engelska)Ingår i: Journal of Computational And Graphical Statistics, ISSN 1061-8600, E-ISSN 1537-2715, Vol. 33, nr 2, s. 714-723Artikel i tidskrift (Refereegranskat) Published
Abstract [en]

Convolutional neural networks (CNN) have been successful in machine learning applications including image classification. When it comes to images, their success relies on their ability to consider the space invariant local features in the data. Here, we consider the use of CNN to fit nuisance models in semiparametric estimation of a one dimensional causal parameter: the average causal effect of a binary treatment. In this setting, nuisance models are functions of pre-treatment covariates that need to be controlled for. In an application where we want to estimate the effect of early retirement on a health outcome, we propose to use CNN to control for time-structured covariates. Thus, CNN is used when fitting nuisance models explaining the treatment assignment and the outcome. These fits are then combined into an augmented inverse probability weighting estimator yielding efficient and uniformly valid inference. Theoretically, we contribute by providing rates of convergence for CNN equipped with the rectified linear unit activation function and compare it to an existing result for feedforward neural networks. We also show when those rates guarantee uniformly valid inference for the proposed estimator. A Monte Carlo study is provided where the performance of the proposed estimator is evaluated and compared with other strategies. Finally, we give results on a study of the effect of early retirement on later hospitalization using a database covering the whole Swedish population.

Ort, förlag, år, upplaga, sidor
Taylor & Francis, 2024. Vol. 33, nr 2, s. 714-723
Nyckelord [en]
Average causal effect, augmented inverse probability weighting, early retirement, rate double robustness, post-machine learning inference
Nationell ämneskategori
Sannolikhetsteori och statistik
Identifikatorer
URN: urn:nbn:se:umu:diva-199235DOI: 10.1080/10618600.2023.2257247ISI: 001119527600001Scopus ID: 2-s2.0-85174611652OAI: oai:DiVA.org:umu-199235DiVA, id: diva2:1693996
Forskningsfinansiär
Marianne och Marcus Wallenbergs StiftelseVetenskapsrådet
Anmärkning

Orinally included in thesis in manuscript form. 

Tillgänglig från: 2022-09-08 Skapad: 2022-09-08 Senast uppdaterad: 2024-10-01Bibliografiskt granskad
Ingår i avhandling
1. Valid causal inference in high-dimensional and complex settings
Öppna denna publikation i ny flik eller fönster >>Valid causal inference in high-dimensional and complex settings
2022 (Engelska)Doktorsavhandling, sammanläggning (Övrigt vetenskapligt)
Alternativ titel[sv]
Giltig kausalinferens med högdimensionella och komplexa data
Abstract [en]

The objective of this thesis is to consider some challenges that arise when conducting causal inference based on observational data. High dimensionality can occur when it is necessary to adjust for many covariates, and flexible models must be used to meet convergence assumptions. The latter may require the use of a novel machine learning estimator. Estimating nonparametrically-defined causal estimands at parametric rates and obtaining good-quality confidence intervals (with near nominal coverage) are the primary goals. Another challenge is providing a sensitivity analysis that can be applied in high-dimensional scenarios as a way of assessing the robustness of the results to missing confounders. 

Four papers are included in the thesis. A common theme in all the papers is covariate selection or nonparametric estimation of nuisance models. To provide insight into the performance of the approaches presented, some theoretical results are provided. Additionally, simulation studies are reported. In paper I, covariate selection is discussed as a method for removing redundant variables. This approach is compared to other strategies for variable selection that ensure reasonable confidence interval coverage. Paper II integrates variable selection into a sensitivity analysis, where the sensitivity parameter is the conditional correlation of the outcome and treatment variables. The validity of the analysis where the sensitivity parameter is small relative to the sample size is shown theoretically. In simulation settings, however, the analysis performs as expected, even for larger values of sensitivity parameters, when using a correction of the estimator of the residual variance for the outcome model. Paper IV extends the applicability of the sensitivity analysis method through the use of a different residual variance estimator and applies it to a real study of the effects of smoking during pregnancy on child birth weight. A real data problem of analysing the effect of early retirement on health outcomes is studied in Paper III. Rather than using variable selection strategies, convolutional neural networks are studied to fit the nuisance models.

Ort, förlag, år, upplaga, sidor
Umeå: Umeå University, 2022. s. 14
Serie
Statistical studies, ISSN 1100-8989 ; 56
Nyckelord
Causal inference, high dimension, sensitivity analysis, variable selection, convolutional neural network, semiparametric efficiency bound
Nationell ämneskategori
Sannolikhetsteori och statistik
Forskningsämne
statistik
Identifikatorer
urn:nbn:se:umu:diva-199258 (URN)978-91-7855-881-0 (ISBN)978-91-7855-882-7 (ISBN)
Disputation
2022-10-07, Hörsal NBET.A.101, Norra Beteendevetarhuset, Umeå, 10:00 (Engelska)
Opponent
Handledare
Tillgänglig från: 2022-09-16 Skapad: 2022-09-09 Senast uppdaterad: 2024-06-05Bibliografiskt granskad
2. Machine learning for efficient and robust causal inference and prediction
Öppna denna publikation i ny flik eller fönster >>Machine learning for efficient and robust causal inference and prediction
2024 (Engelska)Doktorsavhandling, sammanläggning (Övrigt vetenskapligt)
Alternativ titel[sv]
Maskininlärning för effektiv och robust kausal inferens och prediktion
Abstract [en]

This thesis makes contributions within the area of causal inference, domain adaptation, and studies of health inequalities. The common theme is using asymptotic statistics, where estimators and predictors are shown to be asymptotically unbiased, normally distributed, and reach the asymptotic efficiency bound. Furthermore, due to the robustness of the solutions, the usage of flexible machine learning models like neural networks is justified.

The first work studies the necessary growth rate for convolutional neural network architectures, where asymptotically efficient estimation of causal effect estimators is aimed at, and convolutional neural networks are used to fit nuisance models. The proposed method is also applied to Swedish registry data in order to study the effects of early retirement on health outcomes.

The second article proposes an asymptotically efficient estimator for a novel causal parameter. The parameter of interest is the effect of an intervention on a counterfactual version of the concentration index, which is an index that represents socioeconomic-related health inequality. The real data application of this paper is the study of the effect of education on different health-related inequalities in a cohort of Swedes.

The third paper solves a problem in the field of domain adaptation in machine learning, where the training set is observed but it is not possible to assume that test and training sets follow the same distribution. A weaker assumption is instead considered, referred to as a generalized label shift. This paper proposes a robust and asymptotically efficient predictor under the generalized label shift assumption.

The last article is a vignette on the software developed to perform the analysis in the first paper. It is possible to utilize the software in a broader manner than what is described in the first paper. Several examples and more practical details are presented in this article in order to demonstrate how neural networks can be used in order to fit nuisance functions when the average treatment effect or the average treatment effect on the treated is the parameter of interest.

Abstract [sv]

Denna avhandling bidrar till området kausal inferens, domänanpassning och studier om ojämlikhet i hälsa. Det gemensamma motivet är att använda asymptotisk statistik, där estimatorer och prediktorer visas vara asymptotiskt väntevärdesriktiga, normalfördelade och nå den asymptotiska effektivitetsgränsen. Dessutom, på grund av robustheten hos lösningar, är användningen av flexibla maskininlärningsmodeller, så som neurala nätverk, motiverad.

Det första arbetet studerar den nödvändiga tillväxthastigheten för konvolutionella neurala nätverks arkitekturer, där asymptotiskt effektiva skattningar av kausala effekter är syftet och konvolutionella neurala nätverk används för att skatta störmodeller. Den föreslagna metoden tillämpas även på svenska registerdata för att studera effekterna av förtidspension på hälsoutfall.

Den andra artikeln föreslår en asymptotiskt effektiv estimator för en ny kausal parameter. Parametern av intresse är effekten av en intervention på en kontrafaktisk version av koncentrationsindexet, vilket är ett index som beskriver socioekonomisk ojämlikhet i hälsa. Datatillämpningen i denna uppsats studerar effekten av utbildning på olika hälsorelaterade ojämlikheter i en kohort svenskar.

Den tredje uppsatsen löser ett problem inom domänanpassning i maskininlärning, där träningsdata observeras men det är inte möjligt att anta att test- och träningsdata följer samma fördelning. Ett svagare antagande övervägs istället, kallad ett generaliserat etikettskifte. Denna artikel föreslår en robust och asymptotiskt effektiv prediktor under det generaliserade etikettskiftes antagandet.

Den sista artikeln är en vinjett som klargör programvaran som utvecklats för att utföra analysen i den första uppsatsen. Det är möjligt att använda programvaran på ett bredare sätt än vad som beskrivs i den första artikeln. Olika exempel och fler praktiska detaljer presenteras i denna artikel för att visa hur neurala nätverk kan användas för att skatta störfunktioner när syftet är att estimera den genomsnittliga behandlingseffekten i en population eller delpopulation av de behandlade.

Ort, förlag, år, upplaga, sidor
Umeå: Umeå University, 2024. s. 20
Serie
Statistical studies, ISSN 1100-8989 ; 59
Nyckelord
Causal inference, Convolutional neural network, Concentration index, Generalized label shift, Machine learning, Asymptotic efficiency
Nationell ämneskategori
Sannolikhetsteori och statistik
Forskningsämne
statistik
Identifikatorer
urn:nbn:se:umu:diva-230215 (URN)978-91-8070-475-5 (ISBN)978-91-8070-476-2 (ISBN)
Disputation
2024-10-25, Hörsal SAM.A.280, Samhällsvetarhuset, Umeå, 09:30 (Engelska)
Opponent
Handledare
Forskningsfinansiär
Marianne och Marcus Wallenbergs Stiftelse
Tillgänglig från: 2024-10-04 Skapad: 2024-10-01 Senast uppdaterad: 2024-10-08Bibliografiskt granskad

Open Access i DiVA

fulltext(1818 kB)116 nedladdningar
Filinformation
Filnamn FULLTEXT03.pdfFilstorlek 1818 kBChecksumma SHA-512
5d6f6adda6c2b59ddbecfbe7cdd767699b6e913688de4593896603cea0607b80607382b111a5d204c0f2fbfd265705c0d489be34e1f24472c0e955a7970f7cbd
Typ fulltextMimetyp application/pdf

Övriga länkar

Förlagets fulltextScopus

Person

Mohammad, GhasempourMoosavi, Niloofarde Luna, Xavier

Sök vidare i DiVA

Av författaren/redaktören
Mohammad, GhasempourMoosavi, Niloofarde Luna, Xavier
Av organisationen
Statistik
I samma tidskrift
Journal of Computational And Graphical Statistics
Sannolikhetsteori och statistik

Sök vidare utanför DiVA

GoogleGoogle Scholar
Totalt: 180 nedladdningar
Antalet nedladdningar är summan av nedladdningar för alla fulltexter. Det kan inkludera t.ex tidigare versioner som nu inte längre är tillgängliga.

doi
urn-nbn

Altmetricpoäng

doi
urn-nbn
Totalt: 822 träffar
RefereraExporteraLänk till posten
Permanent länk

Direktlänk
Referera
Referensformat
  • apa
  • ieee
  • vancouver
  • Annat format
Fler format
Språk
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Annat språk
Fler språk
Utmatningsformat
  • html
  • text
  • asciidoc
  • rtf