Umeå universitets logga

umu.sePublikationer
Driftinformation
Ett driftavbrott i samband med versionsuppdatering är planerat till 10/12-2024, kl 12.00-13.00. Under den tidsperioden kommer DiVA inte att vara tillgängligt
Ändra sökning
RefereraExporteraLänk till posten
Permanent länk

Direktlänk
Referera
Referensformat
  • apa
  • ieee
  • modern-language-association-8th-edition
  • vancouver
  • Annat format
Fler format
Språk
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Annat språk
Fler språk
Utmatningsformat
  • html
  • text
  • asciidoc
  • rtf
We don’t talk about that: case studies on intersectional analysis of social bias in large language models
Umeå universitet, Teknisk-naturvetenskapliga fakulteten, Institutionen för datavetenskap. Umeå universitet, Samhällsvetenskapliga fakulteten, Umeå centrum för genusstudier (UCGS). Linköping University.ORCID-id: 0000-0003-0278-9757
Centre for Gender Research, Uppsala University.ORCID-id: 0000-0002-4954-4397
Umeå universitet, Teknisk-naturvetenskapliga fakulteten, Institutionen för datavetenskap. (Foundations of Language Processing)ORCID-id: 0000-0002-4696-9787
2024 (Engelska)Ingår i: Proceedings of the 5th workshop on gender bias in natural language processing (GeBNLP) / [ed] Agnieszka Faleńska; Christine Basta; Marta Costa-jussà; Seraphina Goldfarb-Tarrant; Debora Nozza, Association for Computational Linguistics, 2024, s. 33-44Konferensbidrag, Publicerat paper (Refereegranskat)
Abstract [en]

Despite concerns that Large Language Models (LLMs) are vectors for reproducing and ampli- fying social biases such as sexism, transpho- bia, islamophobia, and racism, there is a lack of work qualitatively analyzing how such pat- terns of bias are generated by LLMs. We use mixed-methods approaches and apply a femi- nist, intersectional lens to the problem across two language domains, Swedish and English, by generating narrative texts using LLMs. We find that hegemonic norms are consistently re- produced; dominant identities are often treated as ‘default’; and discussion of identity itself may be considered ‘inappropriate’ by the safety features applied to some LLMs. Due to the dif- fering behaviors of models, depending both on their design and the language they are trained on, we observe that strategies of identifying “bias” must be adapted to individual models and their socio-cultural contexts.

Ort, förlag, år, upplaga, sidor
Association for Computational Linguistics, 2024. s. 33-44
Nationell ämneskategori
Språkteknologi (språkvetenskaplig databehandling)
Forskningsämne
datorlingvistik
Identifikatorer
URN: urn:nbn:se:umu:diva-228891Scopus ID: 2-s2.0-85204398108ISBN: 979-8-89176-137-7 (digital)OAI: oai:DiVA.org:umu-228891DiVA, id: diva2:1893187
Konferens
Workshop on Gender Bias in Natural Language Processing (GeBNLP), Bangkok, Thailand, 16th August, 2024.
Tillgänglig från: 2024-08-29 Skapad: 2024-08-29 Senast uppdaterad: 2024-10-07Bibliografiskt granskad

Open Access i DiVA

fulltext(395 kB)53 nedladdningar
Filinformation
Filnamn FULLTEXT01.pdfFilstorlek 395 kBChecksumma SHA-512
d7633920487b5e21666e2d3fc40ab70e87094bd7db5961527ec37f1ab3681971eb86cdb1e39ce56d123a4354fecd409f8f4239744c7b95da4f36161764d6a8ae
Typ fulltextMimetyp application/pdf

Övriga länkar

ScopusAbstractConference proceedings

Person

Devinney, HannahBjörklund, Henrik

Sök vidare i DiVA

Av författaren/redaktören
Devinney, HannahBjörklund, JennyBjörklund, Henrik
Av organisationen
Institutionen för datavetenskapUmeå centrum för genusstudier (UCGS)
Språkteknologi (språkvetenskaplig databehandling)

Sök vidare utanför DiVA

GoogleGoogle Scholar
Totalt: 53 nedladdningar
Antalet nedladdningar är summan av nedladdningar för alla fulltexter. Det kan inkludera t.ex tidigare versioner som nu inte längre är tillgängliga.

isbn
urn-nbn

Altmetricpoäng

isbn
urn-nbn
Totalt: 263 träffar
RefereraExporteraLänk till posten
Permanent länk

Direktlänk
Referera
Referensformat
  • apa
  • ieee
  • modern-language-association-8th-edition
  • vancouver
  • Annat format
Fler format
Språk
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Annat språk
Fler språk
Utmatningsformat
  • html
  • text
  • asciidoc
  • rtf