Umeå universitets logga

umu.sePublikationer
Ändra sökning
RefereraExporteraLänk till posten
Permanent länk

Direktlänk
Referera
Referensformat
  • apa
  • ieee
  • vancouver
  • Annat format
Fler format
Språk
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Annat språk
Fler språk
Utmatningsformat
  • html
  • text
  • asciidoc
  • rtf
Shortcut Transformers and the Learnability of Automata
Umeå universitet, Teknisk-naturvetenskapliga fakulteten, Institutionen för datavetenskap.
2023 (Engelska)Självständigt arbete på avancerad nivå (masterexamen), 20 poäng / 30 hpStudentuppsats (Examensarbete)
Abstract [en]

Transformers have emerged as a powerful architecture for various tasks in natural language processing, computer vision, and multi-modal domains. Despite their success, understanding the computational capabilities and limitations of transformers remains a challenge. This work focuses on relating transformers to deterministic finite automata (DFAs) and empirically investigates the architecture's ability to simulate DFAs of varying complexities. We empirically explore the simulation of DFAs by transformers, specifically focusing on the solvable A4-DFA and the non-solvable A5-DFA. We conduct experiments to evaluate the in-distribution and out-of-distribution accuracy of sub-linear depth transformers with positive results on both accounts. Additionally, we examine the impact of widening the transformer to find even shallower transformers for the  A4-DFA. While no significant improvements are observed compared to the sub-linear depth transformers, further exploration of hyperparameters is needed for more reliable results.

Ort, förlag, år, upplaga, sidor
2023. , s. 53
Serie
UMNAD ; 1404
Nyckelord [en]
transformers, modern neural networks, automata, expressivity, learnability, regular languages, solvable groups
Nationell ämneskategori
Datavetenskap (datalogi)
Identifikatorer
URN: urn:nbn:se:umu:diva-210546OAI: oai:DiVA.org:umu-210546DiVA, id: diva2:1773419
Utbildningsprogram
Masterprogrammet i datavetenskap
Handledare
Examinatorer
Tillgänglig från: 2023-06-27 Skapad: 2023-06-22 Senast uppdaterad: 2023-06-27Bibliografiskt granskad

Open Access i DiVA

fulltext(1741 kB)556 nedladdningar
Filinformation
Filnamn FULLTEXT01.pdfFilstorlek 1741 kBChecksumma SHA-512
d567bc60ea8977d1bfc2111f85c3d85bec2cd18fe0bd35a5a5b57e2740f99cb75c7d6c9accd3392c2ec868dcc79d237de1334f63d4fc85fd67119560ef270047
Typ fulltextMimetyp application/pdf

Sök vidare i DiVA

Av författaren/redaktören
Martens, Willeke
Av organisationen
Institutionen för datavetenskap
Datavetenskap (datalogi)

Sök vidare utanför DiVA

GoogleGoogle Scholar
Totalt: 556 nedladdningar
Antalet nedladdningar är summan av nedladdningar för alla fulltexter. Det kan inkludera t.ex tidigare versioner som nu inte längre är tillgängliga.

urn-nbn

Altmetricpoäng

urn-nbn
Totalt: 698 träffar
RefereraExporteraLänk till posten
Permanent länk

Direktlänk
Referera
Referensformat
  • apa
  • ieee
  • vancouver
  • Annat format
Fler format
Språk
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Annat språk
Fler språk
Utmatningsformat
  • html
  • text
  • asciidoc
  • rtf