Umeå universitets logga

umu.sePublikationer
Ändra sökning
RefereraExporteraLänk till posten
Permanent länk

Direktlänk
Referera
Referensformat
  • apa
  • ieee
  • vancouver
  • Annat format
Fler format
Språk
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Annat språk
Fler språk
Utmatningsformat
  • html
  • text
  • asciidoc
  • rtf
Optimization dynamics of equivariant and augmented neural networks
Umeå universitet, Teknisk-naturvetenskapliga fakulteten, Institutionen för matematik och matematisk statistik.
Umeå universitet, Teknisk-naturvetenskapliga fakulteten, Umeå forskningscentrum för matematikdidaktik (UFM). Umeå universitet, Teknisk-naturvetenskapliga fakulteten, Institutionen för matematik och matematisk statistik.ORCID-id: 0000-0002-3165-6999
Umeå universitet, Teknisk-naturvetenskapliga fakulteten, Institutionen för matematik och matematisk statistik.
2025 (Engelska)Ingår i: Transactions on Machine Learning Research, E-ISSN 2835-8856Artikel i tidskrift (Refereegranskat) Published
Abstract [en]

We investigate the optimization of neural networks on symmetric data, and compare the strategy of constraining the architecture to be equivariant to that of using data augmentation. Our analysis reveals that the relative geometry of the admissible and the equivariant layers, respectively, plays a key role. Under natural assumptions on the data, network, loss, and group of symmetries, we show that compatibility of the spaces of admissible layers and equivariant layers, in the sense that the corresponding orthogonal projections commute, implies that the sets of equivariant stationary points are identical for the two strategies. If the linear layers of the network also are given a unitary parametrization, the set of equivariant layers is even invariant under the gradient flow for augmented models. Our analysis however also reveals that even in the latter situation, stationary points may be unstable for augmented training although they are stable for the manifestly equivariant models.

Ort, förlag, år, upplaga, sidor
2025.
Nyckelord [en]
Equivariance, data augmentation, neural networks, dynamical systems
Nationell ämneskategori
Datavetenskap (datalogi) Beräkningsmatematik
Forskningsämne
matematik
Identifikatorer
URN: urn:nbn:se:umu:diva-234734Scopus ID: 2-s2.0-85219534158OAI: oai:DiVA.org:umu-234734DiVA, id: diva2:1932370
Forskningsfinansiär
Wallenberg AI, Autonomous Systems and Software Program (WASP)
Anmärkning

Submission number: 3153

Published: 2025-01-16

Tillgänglig från: 2025-01-29 Skapad: 2025-01-29 Senast uppdaterad: 2025-03-19Bibliografiskt granskad

Open Access i DiVA

fulltext(2891 kB)94 nedladdningar
Filinformation
Filnamn FULLTEXT01.pdfFilstorlek 2891 kBChecksumma SHA-512
e55ce8615a0aa2619fcdbd0fb53dd3ec5522689d354da59772567de558cb394e0f0fa5f9cee2fe7828d54a1bad4e886de1ddcd077d29bf698728ac362e1a963b
Typ fulltextMimetyp application/pdf

Övriga länkar

ScopusPublisher's full text

Person

Nordenfors, OskarOhlsson, FredrikFlinth, Axel

Sök vidare i DiVA

Av författaren/redaktören
Nordenfors, OskarOhlsson, FredrikFlinth, Axel
Av organisationen
Institutionen för matematik och matematisk statistikUmeå forskningscentrum för matematikdidaktik (UFM)
I samma tidskrift
Transactions on Machine Learning Research
Datavetenskap (datalogi)Beräkningsmatematik

Sök vidare utanför DiVA

GoogleGoogle Scholar
Totalt: 94 nedladdningar
Antalet nedladdningar är summan av nedladdningar för alla fulltexter. Det kan inkludera t.ex tidigare versioner som nu inte längre är tillgängliga.

urn-nbn

Altmetricpoäng

urn-nbn
Totalt: 600 träffar
RefereraExporteraLänk till posten
Permanent länk

Direktlänk
Referera
Referensformat
  • apa
  • ieee
  • vancouver
  • Annat format
Fler format
Språk
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Annat språk
Fler språk
Utmatningsformat
  • html
  • text
  • asciidoc
  • rtf