Umeå universitets logga

umu.sePublikationer
Ändra sökning
RefereraExporteraLänk till posten
Permanent länk

Direktlänk
Referera
Referensformat
  • apa
  • ieee
  • vancouver
  • Annat format
Fler format
Språk
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Annat språk
Fler språk
Utmatningsformat
  • html
  • text
  • asciidoc
  • rtf
LIVECell: a large-scale dataset for label-free live cell segmentation
Sartorius Corporate Research, Umeå, Sweden.ORCID-id: 0000-0003-0003-3681
Sartorius, BioAnalytics, Royston, UK.
Deutsches Forschungszentrum für Künstliche Intelligenz, GmbH (DFKI), Saarbrücken, Germany.
Sartorius, BioAnalytics, Royston, UK.
Visa övriga samt affilieringar
2021 (Engelska)Ingår i: Nature Methods, ISSN 1548-7091, E-ISSN 1548-7105, Vol. 18, nr 9, s. 1038-1045Artikel i tidskrift (Övrigt vetenskapligt) Published
Abstract [en]

Light microscopy combined with well-established protocols of two-dimensional cell culture facilitates high-throughput quantitative imaging to study biological phenomena. Accurate segmentation of individual cells in images enables exploration of complex biological questions, but can require sophisticated imaging processing pipelines in cases of low contrast and high object density. Deep learning-based methods are considered state-of-the-art for image segmentation but typically require vast amounts of annotated data, for which there is no suitable resource available in the field of label-free cellular imaging. Here, we present LIVECell, a large, high-quality, manually annotated and expert-validated dataset of phase-contrast images, consisting of over 1.6 million cells from a diverse set of cell morphologies and culture densities. To further demonstrate its use, we train convolutional neural network-based models using LIVECell and evaluate model segmentation accuracy with a proposed a suite of benchmarks.

Ort, förlag, år, upplaga, sidor
Nature Publishing Group, 2021. Vol. 18, nr 9, s. 1038-1045
Nationell ämneskategori
Medicinsk bildvetenskap
Identifikatorer
URN: urn:nbn:se:umu:diva-182681DOI: 10.1038/s41592-021-01249-6ISI: 000691220800001PubMedID: 34462594Scopus ID: 2-s2.0-85113983609OAI: oai:DiVA.org:umu-182681DiVA, id: diva2:1548574
Anmärkning

Previously included in thesis in manuscript form. 

Tillgänglig från: 2021-05-03 Skapad: 2021-05-03 Senast uppdaterad: 2025-02-09Bibliografiskt granskad
Ingår i avhandling
1. Synergies between Chemometrics and Machine Learning
Öppna denna publikation i ny flik eller fönster >>Synergies between Chemometrics and Machine Learning
2021 (Engelska)Doktorsavhandling, sammanläggning (Övrigt vetenskapligt)
Alternativ titel[sv]
Synergier mellan kemometri och maskininlärning
Abstract [en]

Thanks to digitization and automation, data in all shapes and forms are generated in ever-growing quantities throughout society, industry and science. Data-driven methods, such as machine learning algorithms, are already widely used to benefit from all these data in all kinds of applications, ranging from text suggestion in smartphones to process monitoring in industry. To ensure maximal benefit to society, we need workflows to generate, analyze and model data that are performant as well as robust and trustworthy.

There are several scientific disciplines aiming to develop data-driven methodologies, two of which are machine learning and chemometrics. Machine learning is part of artificial intelligence and develops algorithms that learn from data. Chemometrics, on the other hand, is a subfield of chemistry aiming to generate and analyze complex chemical data in an optimal manner. There is already a certain overlap between the two fields where machine learning algorithms are used for predictive modelling within chemometrics. Although, since both fields aims to increase value of data and have disparate backgrounds, there are plenty of possible synergies to benefit both fields. Thanks to its wide applicability, there are many tools and lessons learned within machine learning that goes beyond the predictive models that are used within chemometrics today. On the other hand, chemometrics has always been application-oriented and this pragmatism has made it widely used for quality assurance within regulated industries. 

This thesis serves to nuance the relationship between the two fields and show that knowledge in either field can be used to benefit the other. We explore how tools widely used in applied machine learning can help chemometrics break new ground in a case study of text analysis of patents in Paper I. We then draw inspiration from chemometrics and show how principles of experimental design can help us optimize large-scale data processing pipelines in Paper II and how a method common in chemometrics can be adapted to allow artificial neural networks detect outlier observations in Paper III. We then show how experimental design principles can be used to ensure quality in the core of concurrent machine learning, namely generation of large-scale datasets in Paper IV. Lastly, we outline directions for future research and how state-of-the-art research in machine learning can benefit chemometric method development.

Abstract [sv]

Tack vare digitalisering och automation genereras växande mängder data i alla möjliga former runtom i samhället, industrin och akademin. För att utnyttja dessa data på  bästa vis används redan idag så kallade datadrivna metoder, till exempel maskininlärning, i mängder av tillämpningar i allt ifrån förslag av nästa ord i SMS på smartphones till process-övervakning inom industri. För att maximera samhällsnyttan av den data som genereras behöver vi robusta och pålitliga arbetsflöden för att skapa, analysera och modellera data för alla tänkbara tillämpningar.

Det finns många vetenskapliga fält som utvecklar och utnyttjar datadrivna metoder, där två av dessa är maskininlärning och kemometri. Maskininlärning faller inom det som kallas artificiell intelligens och utvecklar algoritmer som lär sig från data. Kemometri däremot har sitt ursprung i kemi och utvecklar metoder för att generera, analysera och maximera värdet av komplexa kemiska data. Det finns ett visst överlapp mellan fälten där maskininlärnings-algoritmer används flitigt för prediktiv modellering inom kemometrin. Eftersom bägge fält försöker öka värdet av data och har vitt skilda bakgrunder finns det många potentiella synergieffekter. Tack vare att maskininlärning är så vida använt finns det många verktyg och lärdomar utöver dom prediktiva modeller som redan används inom kemometrin. Å andra sidan har kemometri alltid varit inriktat på praktisk tillämpning och har tack vare sin pragmatism lett till att det idag är välanvänt för kvalitetsarbete inom reglerad industri. 

Den här avhandlingen har som mål att nyansera förhållandet mellan kemometri och maskin-inlärning och visa att lärdomar inom vardera fält kan gynna det andra. Vi visar på hur man kan använda verktyg vanliga inom maskininlärning för att hjälpa kemometrin att bryta ny mark i en case-studie på textanalys av patentsamlingar i Paper I. Sedan lånar vi från kemometrin och visar hur vi kan använda experimentdesign för att optimera storskaliga beräkningsflöden i Paper II och hur en vanlig metod inom kemometrin kan formuleras om för att för att upptäcka avvikande mätningar i artificiella neuronnät i Paper III. Efter det visar vi hur principer från experimentdesign kan användas för att säkerställa kvalitet i kärnan av modern maskininlärning, nämligen skapandet av stora dataset i Paper IV. Till sist ger vi förslag på framtida forskning och hur de senaste metoderna inom maskin-inlärning kan gynna metodutveckling inom kemometrin.

Ort, förlag, år, upplaga, sidor
Umeå: Umeå Universitet, 2021. s. 50
Nyckelord
computational science, machine learning, chemometrics, multivariate data analysis, design of experiments, data science, beräkningsvetenskap, maskininlärning, kemometri, multivariat dataanalys, experimentdesign
Nationell ämneskategori
Annan kemi Bioinformatik och beräkningsbiologi Datavetenskap (datalogi)
Identifikatorer
urn:nbn:se:umu:diva-182683 (URN)978-91-7855-558-1 (ISBN)978-91-7855-559-8 (ISBN)
Disputation
2021-05-28, KBC Glasburen, KBC - building, Umeå, 09:00 (Engelska)
Opponent
Handledare
Forskningsfinansiär
eSSENCE - An eScience CollaborationStiftelsen för internationalisering av högre utbildning och forskning (STINT)Vetenskapsrådet, 2016‐04376
Tillgänglig från: 2021-05-07 Skapad: 2021-05-03 Senast uppdaterad: 2025-02-05Bibliografiskt granskad

Open Access i DiVA

fulltext(2367 kB)236 nedladdningar
Filinformation
Filnamn FULLTEXT02.pdfFilstorlek 2367 kBChecksumma SHA-512
d2ac3c620acd15129898116b5ad0e5ac0d1e9649e562d48492d43e33d310460a3ec0d95e960b41b81b8f29e1ddac94c578606e2084709111b28cdfa59962b5d6
Typ fulltextMimetyp application/pdf

Övriga länkar

Förlagets fulltextPubMedScopus

Person

Trygg, JohanSjögren, Rickard

Sök vidare i DiVA

Av författaren/redaktören
Edlund, ChristofferDengel, AndreasAhmed, SherazTrygg, JohanSjögren, Rickard
Av organisationen
Kemiska institutionen
I samma tidskrift
Nature Methods
Medicinsk bildvetenskap

Sök vidare utanför DiVA

GoogleGoogle Scholar
Totalt: 251 nedladdningar
Antalet nedladdningar är summan av nedladdningar för alla fulltexter. Det kan inkludera t.ex tidigare versioner som nu inte längre är tillgängliga.

doi
pubmed
urn-nbn

Altmetricpoäng

doi
pubmed
urn-nbn
Totalt: 1004 träffar
RefereraExporteraLänk till posten
Permanent länk

Direktlänk
Referera
Referensformat
  • apa
  • ieee
  • vancouver
  • Annat format
Fler format
Språk
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Annat språk
Fler språk
Utmatningsformat
  • html
  • text
  • asciidoc
  • rtf