umu.sePublikationer
Ändra sökning
RefereraExporteraLänk till posten
Permanent länk

Direktlänk
Referera
Referensformat
  • apa
  • ieee
  • modern-language-association-8th-edition
  • vancouver
  • Annat format
Fler format
Språk
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Annat språk
Fler språk
Utmatningsformat
  • html
  • text
  • asciidoc
  • rtf
Ensemble of Streamlined Bilinear Visual Question Answering Models for the ImageCLEF 2019 Challenge in the Medical Domain
Umeå universitet, Medicinska fakulteten, Institutionen för strålningsvetenskaper, Radiofysik.
ARTORG Center, University of Bern, Bern, Switzerland.
Umeå universitet, Medicinska fakulteten, Institutionen för strålningsvetenskaper, Radiofysik.
Umeå universitet, Medicinska fakulteten, Institutionen för strålningsvetenskaper, Radiofysik. Umeå universitet, Teknisk-naturvetenskapliga fakulteten, Kemiska institutionen.ORCID-id: 0000-0001-7119-7646
2019 (Engelska)Ingår i: CLEF 2019: Working Notes of CLEF 2019 - Conference and Labs of the Evaluation Forum / [ed] Linda Cappellato, Nicola Ferro, David E. Losada, and Henning Müller, 2019, Vol. 2380Konferensbidrag, Publicerat paper (Övrigt vetenskapligt)
Abstract [en]

This paper describes the contribution by participants from Umeå University, Sweden, in collaboration with the University of Bern, Switzerland, for the Medical Domain Visual Question Answering challenge hosted by ImageCLEF 2019. We proposed a novel Visual Question Answering approach that leverages a bilinear model to aggregateand synthesize extracted image and question features. While we did not make use of any additional training data, our model used an attention scheme to focus on the relevant input context and was further boosted by using an ensemble of trained models. We show here that the proposed approach performs at state-of-the-art levels, and provides an improvement over several existing methods. The proposed method was ranked 3rd in the Medical Domain Visual Question Answering challenge of ImageCLEF 2019.

Ort, förlag, år, upplaga, sidor
2019. Vol. 2380
Nationell ämneskategori
Datorseende och robotik (autonoma system) Medicin och hälsovetenskap
Identifikatorer
URN: urn:nbn:se:umu:diva-166758OAI: oai:DiVA.org:umu-166758DiVA, id: diva2:1381723
Konferens
CLEF 2019 - Conference and Labs of the Evaluation Forum, Lugano, Switzerland, Sept 9-12, 2019
Tillgänglig från: 2019-12-27 Skapad: 2019-12-27 Senast uppdaterad: 2020-01-02Bibliografiskt granskad

Open Access i DiVA

fulltext(951 kB)22 nedladdningar
Filinformation
Filnamn FULLTEXT01.pdfFilstorlek 951 kBChecksumma SHA-512
ab1c4db1eb2dd39fdf1d3eacb34c6546f3e2761d99ea629e7cc617ab6bc321e91bbc6a0a1488395bac7719c52d1823defb9ae711eaa533599a997e2bb289473b
Typ fulltextMimetyp application/pdf

Övriga länkar

URL

Personposter BETA

Nyholm, TufveLöfstedt, Tommy

Sök vidare i DiVA

Av författaren/redaktören
Nyholm, TufveLöfstedt, Tommy
Av organisationen
RadiofysikKemiska institutionen
Datorseende och robotik (autonoma system)Medicin och hälsovetenskap

Sök vidare utanför DiVA

GoogleGoogle Scholar
Totalt: 22 nedladdningar
Antalet nedladdningar är summan av nedladdningar för alla fulltexter. Det kan inkludera t.ex tidigare versioner som nu inte längre är tillgängliga.

urn-nbn

Altmetricpoäng

urn-nbn
Totalt: 71 träffar
RefereraExporteraLänk till posten
Permanent länk

Direktlänk
Referera
Referensformat
  • apa
  • ieee
  • modern-language-association-8th-edition
  • vancouver
  • Annat format
Fler format
Språk
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Annat språk
Fler språk
Utmatningsformat
  • html
  • text
  • asciidoc
  • rtf