Umeå universitets logga

umu.sePublikationer
Ändra sökning
RefereraExporteraLänk till posten
Permanent länk

Direktlänk
Referera
Referensformat
  • apa
  • ieee
  • modern-language-association-8th-edition
  • vancouver
  • Annat format
Fler format
Språk
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Annat språk
Fler språk
Utmatningsformat
  • html
  • text
  • asciidoc
  • rtf
Improving Swedish part-of-speech tagging for hen
Umeå universitet, Teknisk-naturvetenskapliga fakulteten, Institutionen för datavetenskap. (Foundations of Language Processing)ORCID-id: 0000-0002-4696-9787
Umeå universitet, Teknisk-naturvetenskapliga fakulteten, Institutionen för datavetenskap. Umeå universitet, Samhällsvetenskapliga fakulteten, Umeå centrum för genusstudier (UCGS). (Foundations of Language Processing)ORCID-id: 0000-0003-0278-9757
2022 (Engelska)Konferensbidrag, Enbart muntlig presentation (Refereegranskat)
Abstract [en]

Despite the fact that the gender-neutral pro-noun hen was officially added to the Swedish language in 2014, state of the art part of speech taggers still routinely fail to identify it as a pronoun. We retrain both efselab and spaCy models with augmented (semi-synthetic) data, where instances of gendered pronouns are replaced by hen to correct for the lack of representation in the original training data. Our results show that adding such data works to correct for the disparity in performance

Ort, förlag, år, upplaga, sidor
2022.
Nyckelord [en]
Part-of-Speech, gendered pronouns, neopronouns
Nationell ämneskategori
Språkteknologi (språkvetenskaplig databehandling)
Forskningsämne
datorlingvistik
Identifikatorer
URN: urn:nbn:se:umu:diva-201268OAI: oai:DiVA.org:umu-201268DiVA, id: diva2:1713349
Konferens
Swedish Language Technology Conference 2022, Stockholm, Sweden, November 23-25, 2022
Tillgänglig från: 2022-11-24 Skapad: 2022-11-24 Senast uppdaterad: 2022-11-28Bibliografiskt granskad

Open Access i DiVA

fulltext(174 kB)93 nedladdningar
Filinformation
Filnamn FULLTEXT01.pdfFilstorlek 174 kBChecksumma SHA-512
22a4b377609ef01729f9b4ec1da3127028a290267698fc1d3a652deca00dfa0fc1871501b40d6e2e17a431c6bdf665c241a30023346558f2fc5cc4eccbd81882
Typ fulltextMimetyp application/pdf

Övriga länkar

https://2022.sltc.se/papers/SLTC22_paper_918.pdf

Person

Björklund, HenrikDevinney, Hannah

Sök vidare i DiVA

Av författaren/redaktören
Björklund, HenrikDevinney, Hannah
Av organisationen
Institutionen för datavetenskapUmeå centrum för genusstudier (UCGS)
Språkteknologi (språkvetenskaplig databehandling)

Sök vidare utanför DiVA

GoogleGoogle Scholar
Totalt: 93 nedladdningar
Antalet nedladdningar är summan av nedladdningar för alla fulltexter. Det kan inkludera t.ex tidigare versioner som nu inte längre är tillgängliga.

urn-nbn

Altmetricpoäng

urn-nbn
Totalt: 377 träffar
RefereraExporteraLänk till posten
Permanent länk

Direktlänk
Referera
Referensformat
  • apa
  • ieee
  • modern-language-association-8th-edition
  • vancouver
  • Annat format
Fler format
Språk
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Annat språk
Fler språk
Utmatningsformat
  • html
  • text
  • asciidoc
  • rtf