Umeå universitets logga

umu.sePublikationer
Ändra sökning
RefereraExporteraLänk till posten
Permanent länk

Direktlänk
Referera
Referensformat
  • apa
  • ieee
  • modern-language-association-8th-edition
  • vancouver
  • Annat format
Fler format
Språk
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Annat språk
Fler språk
Utmatningsformat
  • html
  • text
  • asciidoc
  • rtf
Mapping flows on sparse networks with missing links
Umeå universitet, Teknisk-naturvetenskapliga fakulteten, Institutionen för fysik. Scientific Computing Laboratory, Center for the Study of Complex Systems, Institute of Physics, University of Belgrade, Serbia.ORCID-id: 0000-0003-0124-1909
Umeå universitet, Teknisk-naturvetenskapliga fakulteten, Institutionen för fysik. Gothenburg Global Biodiversity Centre, Gothenburg, Sweden; Department of Biological and Environmental Sciences, University of Gothenburg, Sweden.ORCID-id: 0000-0001-5420-0591
Umeå universitet, Teknisk-naturvetenskapliga fakulteten, Institutionen för fysik.ORCID-id: 0000-0002-7181-9940
2020 (Engelska)Ingår i: Physical review. E, ISSN 2470-0045, E-ISSN 2470-0053, Vol. 102, nr 1, artikel-id 012302Artikel i tidskrift (Refereegranskat) Published
Abstract [en]

Unreliable network data can cause community-detection methods to overfit and highlight spurious structures with misleading information about the organization and function of complex systems. Here we show how to detect significant flow-based communities in sparse networks with missing links using the map equation. Since the map equation builds on Shannon entropy estimation, it assumes complete data such that analyzing undersampled networks can lead to overfitting. To overcome this problem, we incorporate a Bayesian approach with assumptions about network uncertainties into the map equation framework. Results in both synthetic and real-world networks show that the Bayesian estimate of the map equation provides a principled approach to revealing significant structures in undersampled networks.

Ort, förlag, år, upplaga, sidor
American Physical Society, 2020. Vol. 102, nr 1, artikel-id 012302
Nationell ämneskategori
Datavetenskap (datalogi) Annan fysik
Identifikatorer
URN: urn:nbn:se:umu:diva-173895DOI: 10.1103/PhysRevE.102.012302ISI: 000550381200011Scopus ID: 2-s2.0-85089465455OAI: oai:DiVA.org:umu-173895DiVA, id: diva2:1456632
Forskningsfinansiär
Vetenskapsrådet, 2016-00796Tillgänglig från: 2020-08-06 Skapad: 2020-08-06 Senast uppdaterad: 2023-03-24Bibliografiskt granskad
Ingår i avhandling
1. Mapping incomplete relational data: networks in ecology & evolution
Öppna denna publikation i ny flik eller fönster >>Mapping incomplete relational data: networks in ecology & evolution
2022 (Engelska)Doktorsavhandling, sammanläggning (Övrigt vetenskapligt)
Alternativ titel[sv]
Kartläggning av inkomplett relationell data : nätverk inom ekologi & evolution
Abstract [en]

We live in an interconnected world full of complex systems that cannot be understood simply by analyzing their components. From how genes regulate biological functions to the distribution of life on Earth, we need methods that can analyze systems as a whole.

Networks are abstractions of complex systems, helping capture properties that emerge from patterns of interactions rather than from the individual parts. To understand the patterns of interactions in large networks, we need to simplify them by discovering their modular structure that often characterizes complex systems. A hierarchical modular structure functions as a map that lets us navigate relational data efficiently and helps us see the general patterns. But how reliable is the map if it is based on incomplete data?

This thesis applies and builds upon the map equation, which is an information-theoretic method for detecting modular regularities in the flow patterns on networks. To robustly map incomplete data, we have developed three general approaches: (1) Adaptive resolution in both sampling of and dynamics on networks better fits the data. (2) Regularization avoids overfitting to random patterns. (3) Richer data can be included into the network for a more complete map. Methods that can include evolutionary relationships and handle incomplete data provide more powerful tools for mapping biodiversity in space and time.

Abstract [sv]

Vi lever i en sammankopplad värld full av komplexa system som inte låter sig förstås enbart genom att analysera dess komponenter. Från hur gener reglerar biologiska funktioner till livets utbredning på jorden behöver vi metoder som kan analysera system som en helhet.

Nätverk är abstraktioner av komplexa system som hjälper till att fånga egenskaper som uppstår genom interaktionsmönster snarare än hos de enskilda delarna. För att förstå dessa mönster i stora nätverk måste vi förenkla dem genom att upptäcka dess modulära stuktur som präglar komplexa system. En hierarkisk modulär struktur fungerar som en karta som låter oss navigera effektivt i relationsdata och hjälper oss att se de allmänna mönstren. Men hur tillförlitlig är kartan om den baseras på inkompletta data?

Den här avhandlingen applicerar och bygger vidare på kartekvationen som är en informationsteoretisk metod för att upptäcka modulära regelbundenheter i flödesmönstren på nätverk.För att robust kartlägga inkompletta data har vi utvecklat tre övergripande tillvägagångssätt: (1) Adaptiv upplösning i båda sampling av och dynamik på nätverk ger bättre anpassning till data. (2) Regularisering undviker överanpassning till slumpmässiga mönster. (3) Rikare data kan inkluderas i nätverket för en mer komplett karta. Metoder som kan inkludera evolutionära relationer och hantera inkompletta data ger kraftfullare verktyg för att kartlägga den biologiska mångfalden i rum och tid.

Ort, förlag, år, upplaga, sidor
Umeå: Umeå University, 2022. s. 66
Nyckelord
network science, information theory, map equation, community detection, biogeography, evolution
Nationell ämneskategori
Datavetenskap (datalogi) Annan fysik Biologisk systematik
Identifikatorer
urn:nbn:se:umu:diva-201176 (URN)978-91-7855-887-2 (ISBN)978-91-7855-888-9 (ISBN)
Disputation
2022-12-19, NAT.D.410, Naturvetarhuset, Umeå, 09:00 (Engelska)
Opponent
Handledare
Tillgänglig från: 2022-11-28 Skapad: 2022-11-22 Senast uppdaterad: 2022-11-24Bibliografiskt granskad

Open Access i DiVA

fulltext(1932 kB)234 nedladdningar
Filinformation
Filnamn FULLTEXT01.pdfFilstorlek 1932 kBChecksumma SHA-512
991fc41a1b32d12599bed3b88aa8695306eb4d8fe23ae8d77b894298078976ef9f5ef20afe9abdf0d9e4a5fa9c5d83a71adf7ed44b57af1d3eef7b5f955ddfa8
Typ fulltextMimetyp application/pdf

Övriga länkar

Förlagets fulltextScopus

Person

Smiljanic, JelenaEdler, DanielRosvall, Martin

Sök vidare i DiVA

Av författaren/redaktören
Smiljanic, JelenaEdler, DanielRosvall, Martin
Av organisationen
Institutionen för fysik
I samma tidskrift
Physical review. E
Datavetenskap (datalogi)Annan fysik

Sök vidare utanför DiVA

GoogleGoogle Scholar
Totalt: 234 nedladdningar
Antalet nedladdningar är summan av nedladdningar för alla fulltexter. Det kan inkludera t.ex tidigare versioner som nu inte längre är tillgängliga.

doi
urn-nbn

Altmetricpoäng

doi
urn-nbn
Totalt: 477 träffar
RefereraExporteraLänk till posten
Permanent länk

Direktlänk
Referera
Referensformat
  • apa
  • ieee
  • modern-language-association-8th-edition
  • vancouver
  • Annat format
Fler format
Språk
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Annat språk
Fler språk
Utmatningsformat
  • html
  • text
  • asciidoc
  • rtf