Umeå University's logo

umu.sePublikasjoner
Endre søk
RefereraExporteraLink to record
Permanent link

Direct link
Referera
Referensformat
  • apa
  • ieee
  • modern-language-association-8th-edition
  • vancouver
  • Annet format
Fler format
Språk
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Annet språk
Fler språk
Utmatningsformat
  • html
  • text
  • asciidoc
  • rtf
Improving Swedish part-of-speech tagging for hen
Umeå universitet, Teknisk-naturvetenskapliga fakulteten, Institutionen för datavetenskap. (Foundations of Language Processing)ORCID-id: 0000-0002-4696-9787
Umeå universitet, Teknisk-naturvetenskapliga fakulteten, Institutionen för datavetenskap. Umeå universitet, Samhällsvetenskapliga fakulteten, Umeå centrum för genusstudier (UCGS). (Foundations of Language Processing)ORCID-id: 0000-0003-0278-9757
2022 (engelsk)Konferansepaper, Oral presentation only (Fagfellevurdert)
Abstract [en]

Despite the fact that the gender-neutral pro-noun hen was officially added to the Swedish language in 2014, state of the art part of speech taggers still routinely fail to identify it as a pronoun. We retrain both efselab and spaCy models with augmented (semi-synthetic) data, where instances of gendered pronouns are replaced by hen to correct for the lack of representation in the original training data. Our results show that adding such data works to correct for the disparity in performance

sted, utgiver, år, opplag, sider
2022.
Emneord [en]
Part-of-Speech, gendered pronouns, neopronouns
HSV kategori
Forskningsprogram
datorlingvistik
Identifikatorer
URN: urn:nbn:se:umu:diva-201268OAI: oai:DiVA.org:umu-201268DiVA, id: diva2:1713349
Konferanse
Swedish Language Technology Conference 2022, Stockholm, Sweden, November 23-25, 2022
Tilgjengelig fra: 2022-11-24 Laget: 2022-11-24 Sist oppdatert: 2022-11-28bibliografisk kontrollert

Open Access i DiVA

fulltext(174 kB)93 nedlastinger
Filinformasjon
Fil FULLTEXT01.pdfFilstørrelse 174 kBChecksum SHA-512
22a4b377609ef01729f9b4ec1da3127028a290267698fc1d3a652deca00dfa0fc1871501b40d6e2e17a431c6bdf665c241a30023346558f2fc5cc4eccbd81882
Type fulltextMimetype application/pdf

Andre lenker

https://2022.sltc.se/papers/SLTC22_paper_918.pdf

Person

Björklund, HenrikDevinney, Hannah

Søk i DiVA

Av forfatter/redaktør
Björklund, HenrikDevinney, Hannah
Av organisasjonen

Søk utenfor DiVA

GoogleGoogle Scholar
Totalt: 93 nedlastinger
Antall nedlastinger er summen av alle nedlastinger av alle fulltekster. Det kan for eksempel være tidligere versjoner som er ikke lenger tilgjengelige

urn-nbn

Altmetric

urn-nbn
Totalt: 377 treff
RefereraExporteraLink to record
Permanent link

Direct link
Referera
Referensformat
  • apa
  • ieee
  • modern-language-association-8th-edition
  • vancouver
  • Annet format
Fler format
Språk
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Annet språk
Fler språk
Utmatningsformat
  • html
  • text
  • asciidoc
  • rtf