umu.sePublikationer
Ändra sökning
RefereraExporteraLänk till posten
Permanent länk

Direktlänk
Referera
Referensformat
  • apa
  • ieee
  • modern-language-association-8th-edition
  • vancouver
  • Annat format
Fler format
Språk
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Annat språk
Fler språk
Utmatningsformat
  • html
  • text
  • asciidoc
  • rtf
Maskinläsning: om massdigitalisering, digitala metoder och svensk dagspress
Umeå universitet, Humanistiska fakulteten, Institutionen för kultur- och medievetenskaper.
Umeå universitet, Humanistiska fakulteten, Institutionen för kultur- och medievetenskaper.
Umeå universitet, Umeå universitetsbibliotek (UB). Umeå universitet, Samhällsvetenskapliga fakulteten, Sociologiska institutionen.
2016 (Svenska)Ingår i: Nordicom Information, ISSN 0349-5949, Vol. 38, nr 3, s. 27-40Artikel i tidskrift (Refereegranskat) Published
Abstract [en]

This article highlights the media historical possibilities to analyse linguistic patterns in massive amounts of texts using digital methods. Our starting point is the fact that The National Library of Sweden has made over 12 million newspaper pages available in digital format. An important question is how to research them. The article presents a media history of the Swedish newspaper digitisation, as well as new ways of conducting historical newspaper research using digital methods. A case study is presented where the conceptualisation of a new media technology (the internet) in newspapers from the 1990s is tracked with a digital tool searching for word co-occurrences. The possibilities of digital methods are often incredible, but we should not underestimate the problematic aspects of using digital tools to explore digitised newspapers. The poor quality of the OCR (Optical Character Recognition) is described as one of the major challenges facing historical newspaper research in a digital environment

Ort, förlag, år, upplaga, sidor
Göteborg: Nordicom, 2016. Vol. 38, nr 3, s. 27-40
Nyckelord [sv]
media history, digitized newspapers, OCR, digital humanities, text analysis
Nationell ämneskategori
Medievetenskap Systemvetenskap, informationssystem och informatik med samhällsvetenskaplig inriktning
Forskningsämne
medie- och kommunikationsvetenskap
Identifikatorer
URN: urn:nbn:se:umu:diva-129854OAI: oai:DiVA.org:umu-129854DiVA, id: diva2:1063253
Tillgänglig från: 2017-01-09 Skapad: 2017-01-09 Senast uppdaterad: 2018-06-09Bibliografiskt granskad

Open Access i DiVA

fulltext(3816 kB)151 nedladdningar
Filinformation
Filnamn FULLTEXT01.pdfFilstorlek 3816 kBChecksumma SHA-512
1bb3ee2f6f4163e98550dccb46ed6fe3d2bd024dbb31cbe6d9dc5e4eee2072d8e251b592d5efd5c9d059681f9457c6e1b600234d55be2edb1d43443f3252e323
Typ fulltextMimetyp application/pdf

Övriga länkar

URL

Personposter BETA

Jarlbrink, JohanSnickars, PelleColliander, Cristian

Sök vidare i DiVA

Av författaren/redaktören
Jarlbrink, JohanSnickars, PelleColliander, Cristian
Av organisationen
Institutionen för kultur- och medievetenskaperUmeå universitetsbibliotek (UB)Sociologiska institutionen
I samma tidskrift
Nordicom Information
MedievetenskapSystemvetenskap, informationssystem och informatik med samhällsvetenskaplig inriktning

Sök vidare utanför DiVA

GoogleGoogle Scholar
Totalt: 151 nedladdningar
Antalet nedladdningar är summan av nedladdningar för alla fulltexter. Det kan inkludera t.ex tidigare versioner som nu inte längre är tillgängliga.

urn-nbn

Altmetricpoäng

urn-nbn
Totalt: 708 träffar
RefereraExporteraLänk till posten
Permanent länk

Direktlänk
Referera
Referensformat
  • apa
  • ieee
  • modern-language-association-8th-edition
  • vancouver
  • Annat format
Fler format
Språk
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Annat språk
Fler språk
Utmatningsformat
  • html
  • text
  • asciidoc
  • rtf