Umeå University's logo

umu.sePublications
Change search
CiteExportLink to record
Permanent link

Direct link
Cite
Citation style
  • apa
  • ieee
  • vancouver
  • Other style
More styles
Language
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Other locale
More languages
Output format
  • html
  • text
  • asciidoc
  • rtf
Acoustic cues to femininity and masculinity in spontaneous speech
Umeå University, Faculty of Medicine, Department of Clinical Sciences, Speech and Language Therapy.ORCID iD: 0000-0003-3373-0934
Umeå University, Faculty of Medicine, Department of Clinical Sciences, Speech and Language Therapy.ORCID iD: 0000-0001-8618-4987
Division of Speech and Language Pathology, Department of Clinical Science, Intervention and Technology, Karolinska Institutet, Stockholm, Sweden; Medical Unit Allied Health Professionals, Section Speech and Language Pathology, Karolinska University Hospital, Stockholm, Sweden.ORCID iD: 0000-0003-2520-4520
2024 (English)In: Journal of the Acoustical Society of America, ISSN 0001-4966, E-ISSN 1520-8524, Vol. 155, no 5, p. 3090-3100Article in journal (Refereed) Published
Abstract [en]

The perceived level of femininity and masculinity is a prominent property by which a speaker’s voice is indexed, and a vocal expression incongruent with the speaker’s gender identity can greatly contribute to gender dysphoria. Our understanding of the acoustic cues to the levels of masculinity and femininity perceived by listeners in voices is not well developed, and an increased understanding of them would benefit communication of therapy goals and evaluation in gender-affirming voice training. We developed a voice bank with 132 voices with a range of levels of femininity and masculinity expressed in the voice, as rated by 121 listeners in independent, individually randomized perceptual evaluations. Acoustic models were developed from measures identified as markers of femininity or masculinity in the literature using penalized regression and tenfold cross-validation procedures. The 223 most important acoustic cues explained 89% and 87% of the variance in the perceived level of femininity and masculinity in the evaluation set, respectively. The median fo was confirmed to provide the primary cue, but other acoustic properties must be considered in accurate models of femininity and masculinity perception. The developed models are proposed to afford communication and evaluation of gender-affirming voice training goals and improve voice synthesis efforts.

Place, publisher, year, edition, pages
American Institute of Physics (AIP), 2024. Vol. 155, no 5, p. 3090-3100
National Category
Other Medical Sciences not elsewhere specified
Research subject
Oto-Rhino-Laryngology; language studies; Physics
Identifiers
URN: urn:nbn:se:umu:diva-224137DOI: 10.1121/10.0025932ISI: 001215860700004PubMedID: 38717212Scopus ID: 2-s2.0-85192627110OAI: oai:DiVA.org:umu-224137DiVA, id: diva2:1856918
Available from: 2024-05-08 Created: 2024-05-08 Last updated: 2025-01-07Bibliographically approved
In thesis
1. On voice dysphoria: placing the transgender and gender diverse client at the centre of gender-affirming voice training
Open this publication in new window or tab >>On voice dysphoria: placing the transgender and gender diverse client at the centre of gender-affirming voice training
2025 (English)Doctoral thesis, comprehensive summary (Other academic)
Alternative title[sv]
Röstdysfori hos transpersoner : med patienten i centrum i könsbekräftande röstbehandling
Abstract [en]

Introduction: Gender dysphoria describes the stress and discomfort that transgender and gender diverse (TGD) people may experience when their gender identity is not aligned with their birth-assigned sex. A mismatch between voice and gender identity, voice dysphoria, can be a prominent part of gender dysphoria and may lead to limited participation in social life. Gender-affirming voice training provided by speech and language pathologists (SLPs) aims to assist TGD voice clients to reach their preferred gender expression in voice. The training is mainly based on research on voice and speech features most influential for the perception of femininity and masculinity in cisgender naive listeners, that is, people whose gender identity aligns with their birth-assigned sex and who have no professional training in voice assessments. The overall purpose of this thesis was to adopt a client-centred perspective by focusing on TGD people’s perception of voices and voice modification.

Method: To increase the understanding of TGD people’s motives and perceived barriers to voice modification, semi-structured interviews were conducted with 15 TGD voice clients considering gender-affirming voice training (Study I). To explore TGD people’s perceptions of voices in relation to cisgender naive listeners and SLPs, a listening experiment was constructed in which 132 voices representing a variety of gender expressions were rated according to the degree of femininity and masculinity, respectively. (Study II). The listener ratings were combined with a comprehensive set of acoustic voice and speech features using a penalized regression model to identify the relative strength of acoustic features most salient for listeners’ perception of femininity and masculinity in voice (Study IV). A rating protocol for standardised auditory-perceptual assessment of voice and speech features influencing the perception of gender expression in voice was developed and evaluated regarding consistency and agreement in six SLP listeners (Study III).

Results: Study I: The interviews showed that the TGD voice clients’ expected gains of modifying the voice included increased well-being, participation in social life, and control over the voice. Anticipated barriers included fears of not reaching one’s set goals and that the modified voice would no longer be an efficient tool for communication. Study II: The results of the listening experiment indicated that while TGD and cisgender naive listeners did not differ in their perceptions of femininity and masculinity, SLPs rated the voices as less feminine, and less masculine compared to the other two groups. Study IV: The acoustic models that best predicted the listener ratings explained 89% and 86% of the variance of the rated femininity and masculinity in voices, respectively. While fundamental frequency was seen to be the single most influential acoustic feature, the results verified the co-contribution of 222 other acoustic properties of articulation, intonation and resonance. Study III: The evaluation of the auditory-perceptual rating protocol provided support for structured clinical ratings within gender-affirming voice training to be meaningful. The protocol items were rated overall in a consistent manner by the SLPs, but the level of agreement among SLPs was lower.

Conclusions: The project places the TGD voice client in focus, taking a stance on the importance of applying a client-centred approach in both voice training and research. The results showed the need to address motivational and constraining factors for voice modification as these may affect TGD clients’ adherence to voice training and their satisfaction with training results. SLPs should be attentive to how their professional training may influence their perception of voices and encourage explorations of the TGD voice client’s perceptions of femininity and masculinity to ensure that goal setting and evaluation of training outcomes reflect the perceptions of the client. The voice training should consider the combined influence of pitch, intonation, resonance and articulation to target the client’s preferred gender expression in voice, measures which are also possible to analyse acoustically. To promote consensus among SLPs when performing auditory-perceptual assessments of these voice and speech aspects, joint listener training is recommended on a regular basis.

The project provides methodological alternatives for how listener experiments can be conducted to lessen the impact of normative assumptions about gender expression in voice as binary and equalled with the gender categories man and woman. The project advocates for a non-binary presentation of femininity and masculinity to be considered in future research on the perception of voices.

Abstract [sv]

Introduktion: Könsdysfori innebär stress och obehag som transpersoner kan uppleva när könsidentiteten inte överensstämmer med det kön personen tilldelats vid födseln. Personer med könsdysfori kan i varierande grad uppleva negativa känslor inför röstens könsuttryck, röstdysfori. Att könsidentiteten inte speglas i rösten kan göra att personen av andra inte uppfattas och bemöts i enlighet med sin könsidentitet, vilket kan leda till försämrat psykiskt mående och att personen undviker samtalssituationer. Könsbekräftande röstbehandling hos logoped syftar till att patienten ska nå en röst som bättre överensstämmer med könsidentiteten. Röstbehandlingen baseras till stora delar på forskning som försökt kartlägga vilka egenskaper i röst och tal som inverkar på lyssnares uppfattningar av femininitet och maskulinitet i rösten. I dessa studier har deltagarna främst varit otränade lyssnare och cispersoner, d v s personer vars könsidentitet överensstämmer med det kön de tilldelats vid födseln. Det övergripande syftet med den här avhandlingen var att sätta patienternas perspektiv i centrum genom att fokusera på transpersoners uppfattningar av röster och av könsbekräftande röstbehandling.

Metod: För att öka förståelsen kring transpersoners förhoppningar och eventuellt upplevda hinder för att förändra rösten genomfördes semi-strukturerade intervjuer med 15 transpersoner inför könsbekräftande röstbehandling (delstudie I). För att utforska transpersoners uppfattning av röster utfördes ett lyssnarexperiment där ett stort antal röster med varierande könsuttryck skattades utifrån upplevd grad av femininitet respektive upplevd grad av maskulinitet. Utöver transpersoner deltog även cispersoner utan träning i att bedöma röster och logopeder för att utforska eventuella skillnader mellan de tre lyssnargruppernas skattningar (delstudie II). Därtill kombinerades lyssnarnas skattningar med ett stort antal akustiska mått som i tidigare forskning visats påverka uppfattningen av femininitet och maskulinitet i rösten. En regressionsmodell skapades för att identifiera akustiska mått med störst inverkan på lyssnarnas uppfattningar av femininitet respektive maskulinitet (delstudie IV). Vidare utvecklades och utvärderades ett bedömningsverktyg för auditivt-perceptuella röstanalyser att användas inom könsbekräftande röstbehandling (delstudie III).

Resultat: Intervjuerna visade att deltagarnas mål med att förändra rösten inkluderade ett förbättrat mående och ökat deltagande i sociala sammanhang, samt att kunna kontrollera vad rösten kommunicerar om den egna personen. Upplevda hinder för att påbörja röstbehandling inkluderade rädslor för att inte nå sina uppsatta mål, att rösten skulle låta konstlad, svag eller på andra sätt inte längre vara ett välfungerande kommunikativt verktyg.

Resultaten från lyssnarexperimentet visade att transpersoner och cispersoner inte skiljde sig åt i sina skattningar av femininitet respektive maskulinitet i röster. Logopederna visade däremot en tendens till lägre skattningar av både femininitet och maskulinitet jämfört med de andra två lyssnargrupperna.

De akustiska modellerna som bäst predicerade lyssnarskattningarna innefattade 223 akustiska mått och förklarade 89% och 86% av variansen i femininitetsrespektive maskulinitetsskattningarna. Grundtonsfrekvensen i rösten var den akustiska egenskap som främst inverkade på lyssnarnas uppfattningar av både grad av femininitet och grad av maskulinitet. Även andra akustiska mått relaterade till artikulation, intonation och resonans bidrog till att förklara lyssnarnas skattningar.

Utvärderingen av det kliniska bedömningsverktyget visade att de inkluderade röst- och talaspekterna skattades på ett konsekvent sätt av logopederna, men att samstämmigheten mellan logopedernas bedömningar var lägre.

Slutsatser: Genom att utgå från transpersoners uppfattningar och erfarenheter förordar avhandlingen ett patientcentrerat perspektiv i både kliniskt arbete och forskning. Avhandlingen visar på behovet av att både motiverande och hindrande faktorer uppmärksammas då dessa kan påverka patienternas genomförande av röstträningen liksom nöjdhet med behandlingsresultaten. Vidare bör logopeder reflektera över hur deras medicinska utbildning och träning kan medföra att uppfattningen av röster skiljer sig något mot transpersoners uppfattningar. Logoped och patient bör därför tillsammans utforska patientens uppfattning av femininitet och maskulinitet i rösten för att säkerställa att behandlingsmål och utvärderingen av röstträningen baseras på patientens uppfattningar. Vidare behöver träning av både röstläge, intonation, resonans och artikulation övervägas i röstbehandlingen för att nå patientens önskade uttryck i rösten. För samstämmiga och tillförlitliga auditivt-perceptuella bedömningar av dessa röstoch talaspekter rekommenderas logopeder regelbundet genomföra gemensamma lyssnarövningar.

Avhandlingen visar på alternativa metoder för hur lyssnarexperiment kan genomföras för att undvika normativa och binära antaganden om könsuttryck i rösten som likställda med könskategorierna man och kvinna. Projektets utgångspunkt att femininitet och maskulinitet är relaterade men separata aspekter i rösten bör övervägas även i framtida forskning om könsuttryck i röster.

Place, publisher, year, edition, pages
Umeå: Umeå University, 2025. p. 80
Series
Umeå University medical dissertations, ISSN 0346-6612 ; 2338
Keywords
Voice dysphoria, Transgender, Gender diverse, Gender-affirming, Voice training, Intonation, Resonance, Articulation, Speech and Language Pathology, Auditory-perceptual, Acoustic, Client-centred
National Category
Other Clinical Medicine
Research subject
Medicine
Identifiers
urn:nbn:se:umu:diva-233766 (URN)978-91-8070-573-8 (ISBN)978-91-8070-574-5 (ISBN)
Public defence
2025-01-31, Umeälven (byggnad 9B NUS) samt Zoom, Norrlands universitetetssjukhus, Umeå, 13:00 (English)
Opponent
Supervisors
Note

För att delta digitalt via Zoom: Mötes-ID: 659 8669 7223, Lösenkod: 090786

Available from: 2025-01-10 Created: 2025-01-07 Last updated: 2025-01-08Bibliographically approved

Open Access in DiVA

fulltext(1026 kB)139 downloads
File information
File name FULLTEXT01.pdfFile size 1026 kBChecksum SHA-512
bb24af5aae960054bdc71d0fee00910df755e9d2114c75d5b5c017d11c7c1e8dfff8180b8eee437f44eee0d3a66e4ac9a5729e77a6591c3b3076e1b8a1e2f12d
Type fulltextMimetype application/pdf

Other links

Publisher's full textPubMedScopus

Authority records

Nylén, FredrikHolmberg, Jenny

Search in DiVA

By author/editor
Nylén, FredrikHolmberg, JennySödersten, Maria
By organisation
Speech and Language Therapy
In the same journal
Journal of the Acoustical Society of America
Other Medical Sciences not elsewhere specified

Search outside of DiVA

GoogleGoogle Scholar
Total: 139 downloads
The number of downloads is the sum of all downloads of full texts. It may include eg previous versions that are now no longer available

doi
pubmed
urn-nbn

Altmetric score

doi
pubmed
urn-nbn
Total: 556 hits
CiteExportLink to record
Permanent link

Direct link
Cite
Citation style
  • apa
  • ieee
  • vancouver
  • Other style
More styles
Language
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Other locale
More languages
Output format
  • html
  • text
  • asciidoc
  • rtf