Umeå universitets logga

umu.sePublikationer
Driftinformation
Ett driftavbrott i samband med versionsuppdatering är planerat till 10/12-2024, kl 12.00-13.00. Under den tidsperioden kommer DiVA inte att vara tillgängligt
Ändra sökning
RefereraExporteraLänk till posten
Permanent länk

Direktlänk
Referera
Referensformat
  • apa
  • ieee
  • modern-language-association-8th-edition
  • vancouver
  • Annat format
Fler format
Språk
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Annat språk
Fler språk
Utmatningsformat
  • html
  • text
  • asciidoc
  • rtf
Crime and Relationship: Exploring Gender Bias in NLP Corpora
Umeå universitet, Teknisk-naturvetenskapliga fakulteten, Institutionen för datavetenskap. Umeå universitet, Samhällsvetenskapliga fakulteten, Umeå centrum för genusstudier (UCGS). (Foundations of Language Processing)
Uppsala University.ORCID-id: 0000-0002-4954-4397
Umeå universitet, Teknisk-naturvetenskapliga fakulteten, Institutionen för datavetenskap.ORCID-id: 0000-0002-4696-9787
2020 (Engelska)Konferensbidrag, Publicerat paper (Refereegranskat)
Abstract [en]

Gender bias in natural language processing (NLP) tools, deriving from implicit human bias embedded in language data, is an important and complicated problem on the road to fair algorithms. We leverage topic modeling to retrieve documents associated with particular gendered categories, and discuss how exploring these documents can inform our understanding of the corpora we may use to train NLP tools. This is a starting point for challenging the systemic power structures and producing a justice-focused approach to NLP.

Ort, förlag, år, upplaga, sidor
2020.
Nyckelord [en]
gender bias, topic modeling
Nationell ämneskategori
Språkteknologi (språkvetenskaplig databehandling) Genusstudier
Forskningsämne
datalogi; genusvetenskap
Identifikatorer
URN: urn:nbn:se:umu:diva-177583OAI: oai:DiVA.org:umu-177583DiVA, id: diva2:1509712
Konferens
SLTC 2020 – The Eighth Swedish Language Technology Conference, 25–27 November 2020, Online
Projekt
EQUITBLTillgänglig från: 2020-12-14 Skapad: 2020-12-14 Senast uppdaterad: 2021-01-14Bibliografiskt granskad

Open Access i DiVA

fulltext(106 kB)291 nedladdningar
Filinformation
Filnamn FULLTEXT01.pdfFilstorlek 106 kBChecksumma SHA-512
225c1115d9fda60ee0a8c034ddfca9b8c8488631bc3e3c5fb857b7846c54e6b39c56e3cedaa856e82d3de5ee284376c17b694a1e212aecfadb75daea445d379b
Typ fulltextMimetyp application/pdf

Övriga länkar

URL

Person

Devinney, HannahBjörklund, JennyBjörklund, Henrik

Sök vidare i DiVA

Av författaren/redaktören
Devinney, HannahBjörklund, JennyBjörklund, Henrik
Av organisationen
Institutionen för datavetenskapUmeå centrum för genusstudier (UCGS)
Språkteknologi (språkvetenskaplig databehandling)Genusstudier

Sök vidare utanför DiVA

GoogleGoogle Scholar
Totalt: 291 nedladdningar
Antalet nedladdningar är summan av nedladdningar för alla fulltexter. Det kan inkludera t.ex tidigare versioner som nu inte längre är tillgängliga.

urn-nbn

Altmetricpoäng

urn-nbn
Totalt: 1013 träffar
RefereraExporteraLänk till posten
Permanent länk

Direktlänk
Referera
Referensformat
  • apa
  • ieee
  • modern-language-association-8th-edition
  • vancouver
  • Annat format
Fler format
Språk
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Annat språk
Fler språk
Utmatningsformat
  • html
  • text
  • asciidoc
  • rtf