Umeå universitets logga

umu.sePublikationer
Ändra sökning
RefereraExporteraLänk till posten
Permanent länk

Direktlänk
Referera
Referensformat
  • apa
  • ieee
  • vancouver
  • Annat format
Fler format
Språk
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Annat språk
Fler språk
Utmatningsformat
  • html
  • text
  • asciidoc
  • rtf
Sim-to-real transfer of active suspension control using deep reinforcement learning
Umeå universitet, Teknisk-naturvetenskapliga fakulteten, Institutionen för fysik. Algoryx Simulation AB, Umeå, Sweden. (Digital Physics)ORCID-id: 0000-0001-6565-3123
Umeå universitet, Teknisk-naturvetenskapliga fakulteten, Institutionen för fysik. (Digital Physics)ORCID-id: 0000-0001-6266-4740
Umeå universitet, Teknisk-naturvetenskapliga fakulteten, Institutionen för fysik.ORCID-id: 0009-0000-9267-1140
Skogforsk (the Forestry Research Institute of Sweden), Uppsala, Sweden.
Visa övriga samt affilieringar
2024 (Engelska)Ingår i: Robotics and Autonomous Systems, ISSN 0921-8890, E-ISSN 1872-793X, Vol. 179, artikel-id 104731Artikel i tidskrift (Refereegranskat) Published
Abstract [en]

We explore sim-to-real transfer of deep reinforcement learning controllers for a heavy vehicle with active suspensions designed for traversing rough terrain. While related research primarily focuses on lightweight robots with electric motors and fast actuation, this study uses a forestry vehicle with a complex hydraulic driveline and slow actuation. We simulate the vehicle using multibody dynamics and apply system identification to find an appropriate set of simulation parameters. We then train policies in simulation using various techniques to mitigate the sim-to-real gap, including domain randomization, action delays, and a reward penalty to encourage smooth control. In reality, the policies trained with action delays and a penalty for erratic actions perform nearly at the same level as in simulation. In experiments on level ground, the motion trajectories closely overlap when turning to either side, as well as in a route tracking scenario. When faced with a ramp that requires active use of the suspensions, the simulated and real motions are in close alignment. This shows that the actuator model together with system identification yields a sufficiently accurate model of the actuators. We observe that policies trained without the additional action penalty exhibit fast switching or bang–bang control. These present smooth motions and high performance in simulation but transfer poorly to reality. We find that policies make marginal use of the local height map for perception, showing no indications of predictive planning. However, the strong transfer capabilities entail that further development concerning perception and performance can be largely confined to simulation.

Ort, förlag, år, upplaga, sidor
Elsevier, 2024. Vol. 179, artikel-id 104731
Nationell ämneskategori
Elektroteknik och elektronik Annan fysik
Forskningsämne
fysik; data- och systemvetenskap
Identifikatorer
URN: urn:nbn:se:umu:diva-226893DOI: 10.1016/j.robot.2024.104731ISI: 001260733600001Scopus ID: 2-s2.0-85196769514OAI: oai:DiVA.org:umu-226893DiVA, id: diva2:1875672
Projekt
Mistra Digital Forest
Forskningsfinansiär
Mistra - Stiftelsen för miljöstrategisk forskning, Grant DIA 2017/14 #6Wallenberg AI, Autonomous Systems and Software Program (WASP)Tillgänglig från: 2024-06-23 Skapad: 2024-06-23 Senast uppdaterad: 2025-04-24Bibliografiskt granskad

Open Access i DiVA

fulltext(5087 kB)192 nedladdningar
Filinformation
Filnamn FULLTEXT01.pdfFilstorlek 5087 kBChecksumma SHA-512
a811ea9aba1a690598bbea5dcc87131c03129527b96b1a0a9327a9ae88721b3bb7cdea42471c6aff393a4eac678104cfcd65f14e552ac421f0e6d950b0211118
Typ fulltextMimetyp application/pdf

Övriga länkar

Förlagets fulltextScopus

Person

Wiberg, ViktorWallin, ErikFälldin, ArvidWadbro, EddieServin, Martin

Sök vidare i DiVA

Av författaren/redaktören
Wiberg, ViktorWallin, ErikFälldin, ArvidRossander, MorganWadbro, EddieServin, Martin
Av organisationen
Institutionen för fysikInstitutionen för datavetenskap
I samma tidskrift
Robotics and Autonomous Systems
Elektroteknik och elektronikAnnan fysik

Sök vidare utanför DiVA

GoogleGoogle Scholar
Totalt: 192 nedladdningar
Antalet nedladdningar är summan av nedladdningar för alla fulltexter. Det kan inkludera t.ex tidigare versioner som nu inte längre är tillgängliga.

doi
urn-nbn

Altmetricpoäng

doi
urn-nbn
Totalt: 436 träffar
RefereraExporteraLänk till posten
Permanent länk

Direktlänk
Referera
Referensformat
  • apa
  • ieee
  • vancouver
  • Annat format
Fler format
Språk
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Annat språk
Fler språk
Utmatningsformat
  • html
  • text
  • asciidoc
  • rtf