Umeå universitets logga

umu.sePublikationer
Ändra sökning
RefereraExporteraLänk till posten
Permanent länk

Direktlänk
Referera
Referensformat
  • apa
  • ieee
  • vancouver
  • Annat format
Fler format
Språk
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Annat språk
Fler språk
Utmatningsformat
  • html
  • text
  • asciidoc
  • rtf
Fine-Grained Bulge-Chasing Kernels for Strongly Scalable Parallel QR Algorithms
Umeå universitet, Teknisk-naturvetenskapliga fakulteten, Institutionen för datavetenskap. Umeå universitet, Teknisk-naturvetenskapliga fakulteten, Högpresterande beräkningscentrum norr (HPC2N).ORCID-id: 0000-0002-4675-7434
Umeå universitet, Teknisk-naturvetenskapliga fakulteten, Institutionen för datavetenskap. Umeå universitet, Teknisk-naturvetenskapliga fakulteten, Högpresterande beräkningscentrum norr (HPC2N).
Umeå universitet, Teknisk-naturvetenskapliga fakulteten, Institutionen för datavetenskap. Umeå universitet, Teknisk-naturvetenskapliga fakulteten, Högpresterande beräkningscentrum norr (HPC2N).
2014 (Engelska)Ingår i: Parallel Computing, ISSN 0167-8191, E-ISSN 1872-7336, nr 7, s. 271-288Artikel i tidskrift (Refereegranskat) Published
Abstract [en]

The bulge-chasing kernel in the small-bulge multi-shift QR algorithm for the non-symmetric dense eigenvalue problem becomes a sequential bottleneck when the QR algorithm is run in parallel on a multicore platform with shared memory. The duration of each kernel invocation is short, but the critical path of the QR algorithm contains a long sequence of calls to the bulge-chasing kernel. We study the problem of parallelizing the bulge-chasing kernel itself across a handful of processor cores in order to reduce the execution time of the critical path. We propose and evaluate a sequence of four algorithms with varying degrees of complexity and verify that a pipelined algorithm with a slowly shifting block column distribution of the Hessenberg matrix is superior. The load-balancing problem is non-trivial and computational experiments show that the load-balancing scheme has a large impact on the overall performance. We propose two heuristics for the load-balancing problem and also an effective optimization method based on local search. Numerical experiments show that speed-ups are obtained for problems as small as 40-by-40 on two different multicore architectures.

Ort, förlag, år, upplaga, sidor
Elsevier, 2014. nr 7, s. 271-288
Nyckelord [en]
Fine-grained parallelism, Scalability, Load-balancing, Load-balance optimization, Auto-tuning
Nationell ämneskategori
Datavetenskap (datalogi)
Forskningsämne
administrativ databehandling
Identifikatorer
URN: urn:nbn:se:umu:diva-79742DOI: 10.1016/j.parco.2014.04.003ISI: 000339598400010Scopus ID: 2-s2.0-84903385019OAI: oai:DiVA.org:umu-79742DiVA, id: diva2:644471
Konferens
7th International Workshop on Parallel Matrix Algorithms and Applications, London, June 28-30, 2012
Anmärkning

Volume: 40 Issue: 7 Pages: 271-288 Special Issue: SI

Tillgänglig från: 2013-08-30 Skapad: 2013-08-30 Senast uppdaterad: 2023-03-24Bibliografiskt granskad

Open Access i DiVA

PARCO-D-12-00193.pdf(703 kB)611 nedladdningar
Filinformation
Filnamn FULLTEXT01.pdfFilstorlek 703 kBChecksumma SHA-512
75e219e892de22965b1cde4fc7605e62992118db65cd2dd2cee87a0b057ffb6776391474e8a5549019a395330d30c736ca627a468a57addc8a6a56b7f86bffff
Typ fulltextMimetyp application/pdf

Övriga länkar

Förlagets fulltextScopus

Person

Karlsson, LarsKågström, BoWadbro, Eddie

Sök vidare i DiVA

Av författaren/redaktören
Karlsson, LarsKågström, BoWadbro, Eddie
Av organisationen
Institutionen för datavetenskapHögpresterande beräkningscentrum norr (HPC2N)
I samma tidskrift
Parallel Computing
Datavetenskap (datalogi)

Sök vidare utanför DiVA

GoogleGoogle Scholar
Totalt: 611 nedladdningar
Antalet nedladdningar är summan av nedladdningar för alla fulltexter. Det kan inkludera t.ex tidigare versioner som nu inte längre är tillgängliga.

doi
urn-nbn

Altmetricpoäng

doi
urn-nbn
Totalt: 759 träffar
RefereraExporteraLänk till posten
Permanent länk

Direktlänk
Referera
Referensformat
  • apa
  • ieee
  • vancouver
  • Annat format
Fler format
Språk
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Annat språk
Fler språk
Utmatningsformat
  • html
  • text
  • asciidoc
  • rtf