Umeå universitets logga

umu.sePublikationer
Ändra sökning
RefereraExporteraLänk till posten
Permanent länk

Direktlänk
Referera
Referensformat
  • apa
  • ieee
  • vancouver
  • Annat format
Fler format
Språk
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Annat språk
Fler språk
Utmatningsformat
  • html
  • text
  • asciidoc
  • rtf
A Comparative Analysis of Metadata Tools for use on Unknown Operational Datasets
Umeå universitet, Teknisk-naturvetenskapliga fakulteten, Institutionen för datavetenskap.
2024 (Engelska)Självständigt arbete på avancerad nivå (masterexamen), 20 poäng / 30 hpStudentuppsats (Examensarbete)
Abstract [en]

When working with large datasets it is important that the right tools and methods are selected in order to effectively, it is important that the right tools and methods are selected in order to effectively analyze the data. This thesis presents a comparative evaluation of data management tools in the categories of validation, profiling, and feature extraction. The tools, Pandera, Ydata Profiling, SweetViz, and Tsfel, were selected and integrated into a data processing system for the WARA--Ops portal in order to validate, profile, and analyze new operational datasets uploaded to the portal. Finally, the system extracts statistical information from the dataset and uses a machine learning classification algorithm to apply a general label to the data based on the extracted information.

Ort, förlag, år, upplaga, sidor
2024. , s. 43
Serie
UMNAD ; 1497
Nationell ämneskategori
Datavetenskap (datalogi)
Identifikatorer
URN: urn:nbn:se:umu:diva-227466OAI: oai:DiVA.org:umu-227466DiVA, id: diva2:1879306
Externt samarbete
Ericsson
Utbildningsprogram
Civilingenjörsprogrammet i Teknisk datavetenskap
Handledare
Examinatorer
Tillgänglig från: 2024-06-28 Skapad: 2024-06-28 Senast uppdaterad: 2025-04-01Bibliografiskt granskad

Open Access i DiVA

A Comparative Analysis of Metadata Tools for use on Unknown Operational Datasets(724 kB)3 nedladdningar
Filinformation
Filnamn FULLTEXT01.pdfFilstorlek 724 kBChecksumma SHA-512
0e4107fa01d9b334a9fe783c7a63b6b4232fa59c5b5f607fa9213157a3fbcd3fe8f3a9e151e69f42f703ccd20626fd7eff712875a473d6d7d23199039411de0c
Typ fulltextMimetyp application/pdf

Av organisationen
Institutionen för datavetenskap
Datavetenskap (datalogi)

Sök vidare utanför DiVA

GoogleGoogle Scholar
Totalt: 3 nedladdningar
Antalet nedladdningar är summan av nedladdningar för alla fulltexter. Det kan inkludera t.ex tidigare versioner som nu inte längre är tillgängliga.

urn-nbn

Altmetricpoäng

urn-nbn
Totalt: 174 träffar
RefereraExporteraLänk till posten
Permanent länk

Direktlänk
Referera
Referensformat
  • apa
  • ieee
  • vancouver
  • Annat format
Fler format
Språk
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Annat språk
Fler språk
Utmatningsformat
  • html
  • text
  • asciidoc
  • rtf