Umeå universitets logga

umu.sePublikationer
Ändra sökning
RefereraExporteraLänk till posten
Permanent länk

Direktlänk
Referera
Referensformat
  • apa
  • ieee
  • vancouver
  • Annat format
Fler format
Språk
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Annat språk
Fler språk
Utmatningsformat
  • html
  • text
  • asciidoc
  • rtf
Enabling mixed-precision in spectral element codes
Umeå universitet, Teknisk-naturvetenskapliga fakulteten, Institutionen för datavetenskap.ORCID-id: 0009-0003-5512-254X
Université Paris-Saclay, UVSQ, LI-PaRAD, France.
KTH - Royal Institute of Technology, Sweden.
Visa övriga samt affilieringar
2026 (Engelska)Ingår i: Future Generation Computer Systems, ISSN 0167-739X, E-ISSN 1872-7115, Vol. 174, artikel-id 107990Artikel i tidskrift (Refereegranskat) Published
Abstract [en]

Mixed-precision computing has the potential to significantly reduce the cost of exascale computations, but determining when and how to implement it in programs can be challenging. In this article, we propose a methodology for enabling mixed-precision with the help of computer arithmetic tools, roofline model, and computer arithmetic techniques. As case studies, we consider Nekbone (Nek5000 developers), a mini-application for the Computational Fluid Dynamics (CFD) solver Nek5000 (Fischer et al.), and a modern Neko (Jansson et al., 2024) CFD application. With the help of the Verificarlo (Denis et al., 2016) tool and computer arithmetic techniques, we introduce a strategy to address stagnation issues in the preconditioned Conjugate Gradient method in Nekbone and apply these insights to implement a mixed-precision version of Neko. We evaluate the derived mixed-precision versions of these codes by combining metrics in three dimensions: accuracy, time-to-solution, and energy-to-solution. Notably, mixed-precision in Nekbone reduces time-to-solution by roughly 1.62x and energy-to-solution by 2.43x on MareNostrum 5, while in the real-world Neko application, the gain is up to 1.3x in both time and energy, with the accuracy that matches double-precision results.

Ort, förlag, år, upplaga, sidor
Elsevier, 2026. Vol. 174, artikel-id 107990
Nyckelord [en]
Computer arithmetic tool, Conjugate gradient, Energy-to-solution, Mixed-precision, Neko, Roofline model, Verificarlo
Nationell ämneskategori
Datavetenskap (datalogi)
Identifikatorer
URN: urn:nbn:se:umu:diva-242183DOI: 10.1016/j.future.2025.107990Scopus ID: 2-s2.0-105009726439OAI: oai:DiVA.org:umu-242183DiVA, id: diva2:1983971
Tillgänglig från: 2025-07-14 Skapad: 2025-07-14 Senast uppdaterad: 2025-07-14Bibliografiskt granskad

Open Access i DiVA

fulltext(1858 kB)58 nedladdningar
Filinformation
Filnamn FULLTEXT01.pdfFilstorlek 1858 kBChecksumma SHA-512
2f839894bd2c29fa28d2ad0dd9963a349fb89054aeba8e538e7215639bd25cdee71db1be51a17cd1642a66e9e5797acd8a2aaa0dedba8e57fbced3cd94ff588e
Typ fulltextMimetyp application/pdf

Övriga länkar

Förlagets fulltextScopus

Person

Chen, YanxiangBientinesi, PaoloIakymchuk, Roman

Sök vidare i DiVA

Av författaren/redaktören
Chen, YanxiangBientinesi, PaoloIakymchuk, Roman
Av organisationen
Institutionen för datavetenskap
I samma tidskrift
Future Generation Computer Systems
Datavetenskap (datalogi)

Sök vidare utanför DiVA

GoogleGoogle Scholar
Totalt: 60 nedladdningar
Antalet nedladdningar är summan av nedladdningar för alla fulltexter. Det kan inkludera t.ex tidigare versioner som nu inte längre är tillgängliga.

doi
urn-nbn

Altmetricpoäng

doi
urn-nbn
Totalt: 372 träffar
RefereraExporteraLänk till posten
Permanent länk

Direktlänk
Referera
Referensformat
  • apa
  • ieee
  • vancouver
  • Annat format
Fler format
Språk
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Annat språk
Fler språk
Utmatningsformat
  • html
  • text
  • asciidoc
  • rtf