Umeå universitets logga

umu.sePublikationer
Ändra sökning
RefereraExporteraLänk till posten
Permanent länk

Direktlänk
Referera
Referensformat
  • apa
  • ieee
  • modern-language-association-8th-edition
  • vancouver
  • Annat format
Fler format
Språk
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Annat språk
Fler språk
Utmatningsformat
  • html
  • text
  • asciidoc
  • rtf
Speech Recognition Software and Vidispine
Umeå universitet, Teknisk-naturvetenskapliga fakulteten, Institutionen för datavetenskap.
2013 (Engelska)Självständigt arbete på avancerad nivå (masterexamen), 20 poäng / 30 hpStudentuppsats (Examensarbete)
Abstract [en]

To evaluate libraries for continuous speech recognition, a test based on TED-talk videos was created. The different speech recognition libraries PocketSphinx, Dragon NaturallySpeaking and Microsoft Speech API were part of the evaluation. From the words that the libraries recognized, Word Error Rate (WER) was calculated and the results show that Microsoft SAPI performed worst with a WER of 60.8%, PocketSphinx at second place with 59.9% and Dragon NaturallySpeaking as the best with 42.6%. These results were all achieved with a Real Time Factor (RTF) of less than 1.0.

PocketSphinx was chosen as the best candidate for the intended system on the basis that it is open-source, free and would be a better match to the system. By modifying the language model and dictionary to closer resemble typical TED-talk contents, it was also possible to improve the WER for PocketSphinx to a value of 39.5%, however with the cost of RTF which passed the 1.0 limit,making it less useful for live video.

Ort, förlag, år, upplaga, sidor
2013.
Serie
UMNAD ; 937
Nationell ämneskategori
Teknik och teknologier
Identifikatorer
URN: urn:nbn:se:umu:diva-71428OAI: oai:DiVA.org:umu-71428DiVA, id: diva2:623908
Externt samarbete
CodeMill
Utbildningsprogram
Civilingenjörsprogrammet i Teknisk datavetenskap
Uppsök
teknik
Handledare
Examinatorer
Tillgänglig från: 2013-05-29 Skapad: 2013-05-29 Senast uppdaterad: 2013-05-29Bibliografiskt granskad

Open Access i DiVA

fulltext(712 kB)2208 nedladdningar
Filinformation
Filnamn FULLTEXT01.pdfFilstorlek 712 kBChecksumma SHA-512
6d705f6048fa1b0af0f8616002fa56c18d1635187f3e643b200f845db03e097e249c44b6fc82fbcad5a26c506814bf2a4488c8ba94b642bf1c0eaf7faac533fe
Typ fulltextMimetyp application/pdf

Av organisationen
Institutionen för datavetenskap
Teknik och teknologier

Sök vidare utanför DiVA

GoogleGoogle Scholar
Totalt: 2211 nedladdningar
Antalet nedladdningar är summan av nedladdningar för alla fulltexter. Det kan inkludera t.ex tidigare versioner som nu inte längre är tillgängliga.

urn-nbn

Altmetricpoäng

urn-nbn
Totalt: 1041 träffar
RefereraExporteraLänk till posten
Permanent länk

Direktlänk
Referera
Referensformat
  • apa
  • ieee
  • modern-language-association-8th-edition
  • vancouver
  • Annat format
Fler format
Språk
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Annat språk
Fler språk
Utmatningsformat
  • html
  • text
  • asciidoc
  • rtf