Umeå universitets logga

umu.sePublikationer
Ändra sökning
RefereraExporteraLänk till posten
Permanent länk

Direktlänk
Referera
Referensformat
  • apa
  • ieee
  • vancouver
  • Annat format
Fler format
Språk
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Annat språk
Fler språk
Utmatningsformat
  • html
  • text
  • asciidoc
  • rtf
Nonparametric bagging clustering methods to identify latent structures from a sequence of dependent categorical data
Umeå universitet, Teknisk-naturvetenskapliga fakulteten, Institutionen för matematik och matematisk statistik.ORCID-id: 0000-0002-9040-6674
Umeå universitet, Teknisk-naturvetenskapliga fakulteten, Institutionen för matematik och matematisk statistik.ORCID-id: 0000-0003-1591-5716
Umeå universitet, Samhällsvetenskapliga fakulteten, Handelshögskolan vid Umeå universitet, Statistik.ORCID-id: 0000-0003-1098-0076
2023 (Engelska)Ingår i: Computational Statistics & Data Analysis, ISSN 0167-9473, E-ISSN 1872-7352, Vol. 177, artikel-id 107583Artikel i tidskrift (Refereegranskat) Published
Abstract [en]

Nonparametric bagging clustering methods are studied and compared to identify latent structures from a sequence of dependent categorical data observed along a one-dimensional (discrete) time domain. The frequency of the observed categories is assumed to be generated by a (slowly varying) latent signal, according to latent state-specific probability distributions. The bagging clustering methods use random tessellations (partitions) of the time domain and clustering of the category frequencies of the observed data in the tessellation cells to recover the latent signal, within a bagging framework. New and existing ways of generating the tessellations and clustering are discussed and combined into different bagging clustering methods. Edge tessellations and adaptive tessellations are the new proposed ways of forming partitions. Composite methods are also introduced, that are using (automated) decision rules based on entropy measures to choose among the proposed bagging clustering methods. The performance of all the methods is compared in a simulation study. From the simulation study it can be concluded that local and global entropy measures are powerful tools in improving the recovery of the latent signal, both via the adaptive tessellation strategies (local entropy) and in designing composite methods (global entropy). The composite methods are robust and overall improve performance, in particular the composite method using adaptive (edge) tessellations.

Ort, förlag, år, upplaga, sidor
Elsevier, 2023. Vol. 177, artikel-id 107583
Nyckelord [en]
Bagging methods, Categorical dependent data, Clustering, Entropy
Nationell ämneskategori
Sannolikhetsteori och statistik
Forskningsämne
statistik
Identifikatorer
URN: urn:nbn:se:umu:diva-198931DOI: 10.1016/j.csda.2022.107583ISI: 000930488900007Scopus ID: 2-s2.0-85135796679OAI: oai:DiVA.org:umu-198931DiVA, id: diva2:1696677
Forskningsfinansiär
Vetenskapsrådet, 340-2013-5203Tillgänglig från: 2022-09-19 Skapad: 2022-09-19 Senast uppdaterad: 2024-08-15Bibliografiskt granskad

Open Access i DiVA

fulltext(2302 kB)256 nedladdningar
Filinformation
Filnamn FULLTEXT01.pdfFilstorlek 2302 kBChecksumma SHA-512
09350dcc74db5a48b5ec6c184e4e9681efa069fb2a58d4ab5e16989c9814d5c1dd2ab23246c75f1be3bb083aa542c7444f6d4048fbd11da8bb6e9095fe2c0883
Typ fulltextMimetyp application/pdf

Övriga länkar

Förlagets fulltextScopus

Person

Abramowicz, KonradSjöstedt de Luna, SaraStrandberg, Johan

Sök vidare i DiVA

Av författaren/redaktören
Abramowicz, KonradSjöstedt de Luna, SaraStrandberg, Johan
Av organisationen
Institutionen för matematik och matematisk statistikStatistik
I samma tidskrift
Computational Statistics & Data Analysis
Sannolikhetsteori och statistik

Sök vidare utanför DiVA

GoogleGoogle Scholar
Totalt: 256 nedladdningar
Antalet nedladdningar är summan av nedladdningar för alla fulltexter. Det kan inkludera t.ex tidigare versioner som nu inte längre är tillgängliga.

doi
urn-nbn

Altmetricpoäng

doi
urn-nbn
Totalt: 986 träffar
RefereraExporteraLänk till posten
Permanent länk

Direktlänk
Referera
Referensformat
  • apa
  • ieee
  • vancouver
  • Annat format
Fler format
Språk
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Annat språk
Fler språk
Utmatningsformat
  • html
  • text
  • asciidoc
  • rtf