Umeå universitets logga

umu.sePublikationer
Ändra sökning
RefereraExporteraLänk till posten
Permanent länk

Direktlänk
Referera
Referensformat
  • apa
  • ieee
  • vancouver
  • Annat format
Fler format
Språk
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Annat språk
Fler språk
Utmatningsformat
  • html
  • text
  • asciidoc
  • rtf
Beyond Adjacency Pairs: Hierarchical Clustering of Long Sequences for Human-Machine Dialogues
Umeå universitet, Teknisk-naturvetenskapliga fakulteten, Institutionen för datavetenskap.ORCID-id: 0000-0002-3036-6519
2020 (Engelska)Ingår i: Proceedings of the First Workshop on Computational Approaches to Discourse / [ed] Chloé Braud, Christian Hardmeier, Junyi Jessy Li, Annie Louis, Michael Strube, 2020, s. 11-19Konferensbidrag, Publicerat paper (Refereegranskat)
Abstract [en]

This work proposes a framework to predict sequences in dialogues, using turn based syntactic features and dialogue control functions. Syntactic features were extracted using dependency parsing, while dialogue control functions were manually labelled. These features were transformed using tf-idf and word embedding; feature selection was done using Principal Component Analysis (PCA). We ran experiments on six combinations of features to predict sequences with Hierarchical Agglomerative Clustering. An analysis of the clustering results indicate that using word embeddings and syntactic features, significantly improved the results.

Ort, förlag, år, upplaga, sidor
2020. s. 11-19
Nyckelord [en]
Syntactic Features, Semnatic Features, Communicative Features, Agglomerative Clustering, Dialogue Structuring, Longer Regularities, N-gram of Features, Dependency Prsing, Dimension Reduction.
Nationell ämneskategori
Datorsystem
Forskningsämne
datalogi; människa-datorinteraktion; lingvistik
Identifikatorer
URN: urn:nbn:se:umu:diva-175486DOI: 10.18653/v1/2020.codi-1.2OAI: oai:DiVA.org:umu-175486DiVA, id: diva2:1471769
Konferens
Computational Approaches to Discourse (CODI), held in conjunction with Empirical Methods in Natural language processing (EMNLP), Virtual meeting, November 16-20, 2020
Tillgänglig från: 2020-09-29 Skapad: 2020-09-29 Senast uppdaterad: 2021-02-11Bibliografiskt granskad

Open Access i DiVA

fulltext(794 kB)269 nedladdningar
Filinformation
Filnamn FULLTEXT01.pdfFilstorlek 794 kBChecksumma SHA-512
b19f5c04f56d60d321555c4b2780467de11c808c14890b0667dea08d6ebc05c2b260f76e8340e6dcc7aed0177620e6f94b3a1d2d4a27e37d8c5a56e609d93500
Typ fulltextMimetyp application/pdf

Övriga länkar

Förlagets fulltext

Person

Tewari, Maitreyee

Sök vidare i DiVA

Av författaren/redaktören
Tewari, Maitreyee
Av organisationen
Institutionen för datavetenskap
Datorsystem

Sök vidare utanför DiVA

GoogleGoogle Scholar
Totalt: 269 nedladdningar
Antalet nedladdningar är summan av nedladdningar för alla fulltexter. Det kan inkludera t.ex tidigare versioner som nu inte längre är tillgängliga.

doi
urn-nbn

Altmetricpoäng

doi
urn-nbn
Totalt: 793 träffar
RefereraExporteraLänk till posten
Permanent länk

Direktlänk
Referera
Referensformat
  • apa
  • ieee
  • vancouver
  • Annat format
Fler format
Språk
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Annat språk
Fler språk
Utmatningsformat
  • html
  • text
  • asciidoc
  • rtf