Tytuł projektu:
Uczenie maszynowe ze wzmocnieniem w zagadnieniach półaktywnego sterowania konstrukcjami i zdecentralizowanego tłumienia drgań: opracowanie nowych algorytmów i ocena ich efektywności


Umowa:
UMO-2020/39/B/ST8/02615

Czas realizacji:
2021-07-12 / 2025-07-11

Konsorcjum:
Jedyny wykonawca

Sponsor:
NCN

Typ:
OPUS

Konkurs:
20


Lista wykonawców:
1 dr hab. inż.Bartłomiej Błachowski
2 dr hab. inż.Łukasz Jankowski
3 mgr inż.Aleksandra Jedlińska
4 dr inż.Grzegorz Mikułowski
5 dr hab.Dominik Pisarski
kierownik

Streszczenie:
The idea that we learn by interacting with our environment is probably the first to occur to us when we think about the nature of learning /Sutton & Barto, 2020/ Opis projektu: Celem projektu jest rozwój i weryfikacja fundamentalnie nowego i dotychczas nierozpo-znanego podejścia do sterownia konstrukcjami: 1) Opracowanie, adaptacja i zastosowanie algorytmów maszynowego uczenia ze wzmocnieniem do zagadnień sterowania konstrukcjami. 2) Analiza i optymalizacja ich efektywności i odporności w zadaniach półaktywnego, globalnego i zdecentralizowanego tłumienia drgań konstrukcji. 3) Weryfikacja efektywności opracowanych metod (numeryczna i eksperymentalna). *Motywacja* Aktywne sterowanie konstrukcjami można skrótowo określić jako – potencjalnie niebezpieczne – przeciwdziałanie siłami zewnętrznymi. Sterowania półaktywne polega natomiast na fundamentalnie innej, zainspirowanej przyrodą idei dynamicznej samo-adaptacji, tj. energooszczędnej adaptacji lokalnych własności konstrukcji. Układy sterowania konstrukcjami projektuje się zazwyczaj z wykorzystaniem klasycznych technik analitycznych. Takie techniki są efektywne w zagadnieniach aktywnego sterowania konstrukcjami liniowymi. Znacznie trudniej jest je jednak zastosować w wypadku sterowania półaktywnego. Wynika to z istoty półaktywnych aktuatorów, które są energooszczędne i zwykle bezpieczne w razie awarii, ale trudne w efektywnym opisie metodami klasycznymi. Główną motywacją projektu jest potrzeba nowych, efektywnych i odpornych technik półaktywnego sterowania konstrukcjami. *Metoda* Uczenie ze wzmocnieniem (RL), nurt uczenia maszynowego, polega na idei uczenia się poprzez bezpośrednią interakcję z otoczeniem. Zastosowanie technik RL umożliwiło ostatnio osiągnięcie niezwykłych wyników: począwszy od nadludzkiego poziomu gry w szachy i Go, poprzez wznoszenie termiczne szybowców i pływanie falowaniem ciała, aż po autonomiczną jazdę samochodów. Dwie cechy algorytmicznej struktury RL (poszukiwanie metodą prób i błędów oraz wykorzystanie opóźnionego wzmocnienia) sprawiają, że RL doskonale nadaje się do zastosowania w trudnych problemach sterowania konstrukcjami. RL w tym obszarze jest jednak w dużym stopniu ignorowane! Dotychczas opublikowano zaledwie kilka prac, które – choć pionierskie – są ograniczone i dotyczą sterowania aktywnego oraz relatywnie prostych konstrukcji lub architektur RL. Celem projektu jest wypełnienie tej luki. *Badania* Zamiast projektować algorytmy sterowania wprost, wykorzystamy techniki RL do autonomicznej nauki algorytmów metodą prób i błędów, poprzez wielokrotną interakcję z symulowanymi środowiskami wirtualnymi. Podstawowe narzędzia zbudujemy zaczynając od prostych konstrukcji i celów sterowania. Następnie rozważymy zdecentralizowane sterowanie konstrukcjami modularnymi i uogólnimy algorytmy tak, aby były skuteczne w różnych geometrycznych konfiguracjach modułów oraz wykorzystywały czujniki jedynie ze swojego najbliższego otoczenia. Doprowadzi to do sterowanych konstrukcji modularnych "plug-and-play". Dalszym celem będzie opracowanie sterowania na tyle odpornego na błędy, by być stosowalne do konstrukcji rzeczywistych. W trakcie badań dostosujemy, zaproponujemy i wykorzystamy szereg koncepcji: uczenie i sterowanie zespołowe, architekturę typu „actor-critic” itp. Efektywność algorytmów zostanie oceniona numerycznie i eksperymentalnie oraz porównana do wybranych algorytmów klasycznych. *Spodziewane efekty* Drgania konstrukcji to problem powszechny. Projekt przyczyni się do rozwoju efektywnych, lekkich i bezpiecznych konstrukcji poprzez opracowanie odpornych algorytmów energooszczędnego sterowania półaktywnego. W szczególności opracujemy 1) Nowe techniki RL uczące się odpornych algorytmów sterowania, stosowalnych globalnie i lokalnie do złożonych konstrukcji, w tym konstrukcji modularnych. 2) Nowe algorytmy półaktywnego sterowania konstrukcjami. 3) Specyficzne techniki RL promujące uogólnione, odporne algorytmy sterowania (uczenie i sterowanie zespołowe).

Obszar, dziedziny i dyscypliny naukowej:
5.1.12:obszar nauk technicznych, dziedzina nauk technicznych, dyscyplina informatyka
5.1.17:obszar nauk technicznych, dziedzina nauk technicznych, dyscyplina mechanika