Umeå universitets logga

umu.sePublikationer
Ändra sökning
RefereraExporteraLänk till posten
Permanent länk

Direktlänk
Referera
Referensformat
  • apa
  • ieee
  • vancouver
  • Annat format
Fler format
Språk
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Annat språk
Fler språk
Utmatningsformat
  • html
  • text
  • asciidoc
  • rtf
Comparing Transformer-Based and Bag-of-Words Approaches for Phishing Email Detection Under Text Obfuscation
Umeå universitet, Teknisk-naturvetenskapliga fakulteten, Institutionen för datavetenskap.
2025 (Engelska)Självständigt arbete på grundnivå (kandidatexamen), 10 poäng / 15 hpStudentuppsats (Examensarbete)
Abstract [en]

Phishing emails are still a problem in cybersecurity, and attackers keep finding new ways to bypass filters. One common trick is text obfuscation, where words are changed using techniques like leetspeak, Unicode characters, or invisible symbols. In this thesis, we compare classical Bag-of-Words models (Naïve Bayes, Logistic Regression, Random Forest), fastText, and transformer-based models (DeBERTa-v3, CANINE-S, ByT5) on clean and obfuscated phishing emails. The results show that transformer models perform best overall and are more stable when the text is manipulated, while traditional models and fastText lose more accuracy under obfuscation. Among transformers, DeBERTa-v3 and ByT5 showed strong robustness, but CANINE-S was more sensitive to obfuscation. These findings suggest that models which rely less on exact tokens and more on context are better suited for detecting phishing emails in real-world conditions.

Ort, förlag, år, upplaga, sidor
2025. , s. 27
Serie
UMNAD ; 1581
Nyckelord [en]
LLM, Artificial Inteligence, Transformers, Phishing Email
Nationell ämneskategori
Artificiell intelligens Datavetenskap (datalogi)
Identifikatorer
URN: urn:nbn:se:umu:diva-243824OAI: oai:DiVA.org:umu-243824DiVA, id: diva2:1994486
Utbildningsprogram
Kandidatprogrammet i Datavetenskap
Presentation
, Umeå universitet, Umeå (Engelska)
Handledare
Examinatorer
Tillgänglig från: 2025-09-09 Skapad: 2025-09-02 Senast uppdaterad: 2025-09-09Bibliografiskt granskad

Open Access i DiVA

fulltext(3049 kB)86 nedladdningar
Filinformation
Filnamn FULLTEXT01.pdfFilstorlek 3049 kBChecksumma SHA-512
6b5625d3d469e0adccb16f2c18fe2148d7064d956f9a4ffab3c805d835527d59a12e5ec54a8e010f9ec22014ad68ca9d14dc3fdb67d6a1f070bf712b1559b854
Typ fulltextMimetyp application/pdf

Av organisationen
Institutionen för datavetenskap
Artificiell intelligensDatavetenskap (datalogi)

Sök vidare utanför DiVA

GoogleGoogle Scholar
Totalt: 88 nedladdningar
Antalet nedladdningar är summan av nedladdningar för alla fulltexter. Det kan inkludera t.ex tidigare versioner som nu inte längre är tillgängliga.

urn-nbn

Altmetricpoäng

urn-nbn
Totalt: 312 träffar
RefereraExporteraLänk till posten
Permanent länk

Direktlänk
Referera
Referensformat
  • apa
  • ieee
  • vancouver
  • Annat format
Fler format
Språk
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Annat språk
Fler språk
Utmatningsformat
  • html
  • text
  • asciidoc
  • rtf