Umeå universitets logga

umu.sePublikationer
Driftmeddelande
För närvarande är det driftstörningar. Felsökning pågår.
Ändra sökning
RefereraExporteraLänk till posten
Permanent länk

Direktlänk
Referera
Referensformat
  • apa
  • ieee
  • vancouver
  • Annat format
Fler format
Språk
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Annat språk
Fler språk
Utmatningsformat
  • html
  • text
  • asciidoc
  • rtf
A Question-Centric Model for Visual Question Answering in Medical Imaging
Umeå universitet, Medicinska fakulteten, Institutionen för strålningsvetenskaper, Radiofysik.ORCID-id: 0000-0002-2391-1419
Umeå universitet, Medicinska fakulteten, Institutionen för strålningsvetenskaper, Radiofysik.ORCID-id: 0000-0001-7119-7646
Umeå universitet, Medicinska fakulteten, Institutionen för strålningsvetenskaper, Radiofysik.ORCID-id: 0000-0002-8971-9788
ARTORG Center, University of Bern, 3008 Bern, Switzerland.ORCID-id: 0000-0001-6791-4753
2020 (Engelska)Ingår i: IEEE Transactions on Medical Imaging, ISSN 0278-0062, E-ISSN 1558-254X, Vol. 39, nr 9, s. 2856-2868Artikel i tidskrift (Refereegranskat) Published
Abstract [en]

Deep learning methods have proven extremely effective at performing a variety of medical image analysis tasks. With their potential use in clinical routine, their lack of transparency has however been one of their few weak points, raising concerns regarding their behavior and failure modes. While most research to infer model behavior has focused on indirect strategies that estimate prediction uncertainties and visualize model support in the input image space, the ability to explicitly query a prediction model regarding its image content offers a more direct way to determine the behavior of trained models. To this end, we present a novel Visual Question Answering approach that allows an image to be queried by means of a written question. Experiments on a variety of medical and natural image datasets show that by fusing image and question features in a novel way, the proposed approach achieves an equal or higher accuracy compared to current methods.

Ort, förlag, år, upplaga, sidor
IEEE, 2020. Vol. 39, nr 9, s. 2856-2868
Nyckelord [en]
Visual question answering, deep learning, medical images, medical questions and answers
Nationell ämneskategori
Datorgrafik och datorseende Språkbehandling och datorlingvistik Övrig annan medicin och hälsovetenskap
Forskningsämne
datalogi; datoriserad bildanalys
Identifikatorer
URN: urn:nbn:se:umu:diva-174694DOI: 10.1109/TMI.2020.2978284ISI: 000566339800013Scopus ID: 2-s2.0-85090173541OAI: oai:DiVA.org:umu-174694DiVA, id: diva2:1463481
Forskningsfinansiär
Cancerforskningsfonden i NorrlandRegion VästerbottenVinnovaTillgänglig från: 2020-09-02 Skapad: 2020-09-02 Senast uppdaterad: 2025-02-01Bibliografiskt granskad

Open Access i DiVA

Fulltext saknas i DiVA

Övriga länkar

Förlagets fulltextScopus

Person

Vu, Minh HoangLöfstedt, TommyNyholm, Tufve

Sök vidare i DiVA

Av författaren/redaktören
Vu, Minh HoangLöfstedt, TommyNyholm, TufveSznitman, Raphael
Av organisationen
Radiofysik
I samma tidskrift
IEEE Transactions on Medical Imaging
Datorgrafik och datorseendeSpråkbehandling och datorlingvistikÖvrig annan medicin och hälsovetenskap

Sök vidare utanför DiVA

GoogleGoogle Scholar

doi
urn-nbn

Altmetricpoäng

doi
urn-nbn
Totalt: 341 träffar
RefereraExporteraLänk till posten
Permanent länk

Direktlänk
Referera
Referensformat
  • apa
  • ieee
  • vancouver
  • Annat format
Fler format
Språk
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Annat språk
Fler språk
Utmatningsformat
  • html
  • text
  • asciidoc
  • rtf