Використання методів навчання з підкріпленням для розробки моделі роботизованого засобу моніторингу інтелектуальних динамічних об'єктів
DOI:
https://doi.org/10.33099/2311-7249/2023-48-3-115-121Ключові слова:
моніторинг, інтелектуальний динамічний об’єкт, роботизований засіб, штучний інтелект, машинне навчання, навчання з підкріпленням (reinforcement learning), динамічне середовище, моделюванняАнотація
Стаття присвячена вдосконаленню моделей роботизованих засобів для ефективного моніторингу інтелектуальних динамічних об'єктів. У контексті розвитку роботизованих систем моніторингу, особливо в умовах, де роботизовані засоби мають справу з інтелектуальними динамічними об'єктами моніторингу, що активно ухиляються від виявлення та ідентифікації, виникає новий виклик, що полягає у потребі розроблення складних моделей, здатних ефективно моделювати роботизовані засоби з метою протидії такій поведінці об’єктів моніторингу. Традиційні підходи до моделювання часто виявляються недостатньо гнучкими для вирішення таких завдань. Мета статті полягає у розробленні моделі роботизованих засобів для забезпечення ефективного моніторингу інтелектуальних динамічних об'єктів на основі використання методів навчання з підкріпленням. Під час проведеного дослідження були застосовані методи навчання з підкріпленням для адаптації поведінки роботизованих систем до динамічно змінюваних умов, комп’ютерного зору та згорткових нейронних мереж для визначення параметрів роботизованих засобів залежно від розташування в середовищі моделювання. Це дає змогу розробити моделі, здатні до самонавчання та самовдосконалення в реальному часі, що є ключовим для ефективного моніторингу та протидії з інтелектуальними динамічними об'єктами. Отримані результати включають розроблення моделі та відповідних алгоритмів, що демонструють здатність до швидкої адаптації, точності прогнозування поведінки об'єктів та ефективної протидії. На основі створеної моделі, був проведений експеримент, у межах якого роботизовані засоби та інтелектуальні об'єкти з випадково заданими параметрами протидіяли у контрольованому середовищі, що дало змогу зробити висновки про працездатність запропонованої моделі. Наукова новизна дослідження полягає у впровадженні сучасних методів навчання з підкріпленням для створення гнучких та адаптивних моделей роботизованих засобів для систем моніторингу, здатних до ефективної протидії з інтелектуальними об'єктами у різних умовах. Теоретична значущість полягає у розширенні розуміння можливостей машинного навчання у сфері робототехніки, а практична значущість – у потенціалі застосування розроблених моделей у військовій та технічній галузях для підвищення ефективності моніторингу та управління. В цілому, стаття розкриває важливі аспекти використання методів навчання з підкріпленням для оптимізації протидії роботизованих засобів з інтелектуальними динамічними об'єктами та надає практичні рекомендації для подальших досліджень у цій області.
Посилання
Imtiaz M. B., Qiao Y. and Lee B. Prehensile and non-prehensile robotic pick-and-place of objects in clutter using deep reinforcement learning. Sensors. 2023. Т. 23. № 3. С. 1513. DOI: https://doi.org/10.3390/s23031513.
Seongwon J., Hyemi J. and Hyunseok Y. Vision-based reinforcement learning: moving object grasping with a single active-view camera. 2022 22nd international conference on control, automation and systems (ICCAS). 232–237. DOI: 10.23919/ICCAS55662.2022.10003899.
Wang G., Wei F., Jiang Y., Zhao M., Wang K. and Qi H. A multi-auv maritime target search method for moving and invisible objects based on multi-agent deep reinforcement learning. Sensors. 2022. Т. 22. № 21. С. 8562. DOI: https://doi.org/10.3390/s22218562.
Каратанов О. В., Устименко О. В., Єна М. В., Бова Є. А., Калашнікова В. І. Використання алгоритмів ройового інтелекту при проектуванні систем управління груп безпілотних літальних апаратів. Харків : Молодий вчений 2021. № 10 (98). С. 98–103.
Цмоц І. Г., Опотяк Ю. В., Штогрінець Б. В., Дзюба А. О., Олійник Ю. Ю. Базова структура нейронечіткої системи керування групою мобільних роботизованих платформ. Український журнал інформаційних технологій. 2023. Том 5. № 1. С. 77–85.
Yingqi L., Xiaomei W. and Ka-Wai K. Towards adaptive continuous control of soft robotic manipulator using reinforcement learning. 2022 IEEE/RSJ international conference on intelligent robots and systems (IROS). 2022. P. 7074–7081. DOI: https://doi.org/10.1109/IROS47612.2022.9981335.
Kuang W. Fundamentals of reinforcement learning. Texas : University of Texas Rio Grande Valley. 2021. 111 p. URL: https://faculty.utrgv.edu/weidong.kuang/book/RL.pdf (accessed: 15 September 2023).
##submission.downloads##
Опубліковано
Як цитувати
Номер
Розділ
Ліцензія
Автори, які публікуються у цьому журналі, погоджуються з наступними умовами:
1. Автори залишають за собою право на авторство своєї роботи та передають журналу право першої публікації цієї роботи на умовах ліцензії Creative Commons Attribution License, котра дозволяє іншим особам вільно розповсюджувати опубліковану роботу з обов'язковим посиланням на авторів оригінальної роботи та першу публікацію роботи у цьому журналі.
2. Автори мають право укладати самостійні додаткові угоди щодо неексклюзивного розповсюдження роботи у тому вигляді, в якому вона була опублікована цим журналом (наприклад, розміщувати роботу в електронному сховищі установи або публікувати як монографію), за умови збереження посилання на першу публікацію роботи у цьому журналі.
3. Політика журналу дозволяє і заохочує розміщення авторами в мережі Інтернет (наприклад, у сховищах установ або на особистих веб-сайтах) рукопису роботи, як до подання цього рукопису до редакції, так і під час його редакційного опрацювання, оскільки це сприяє виникненню продуктивної наукової дискусії та позитивно позначається на оперативності та динаміці цитування опублікованої роботи (див. The Effect of Open Access).
4. Персональні дані і метадані, які наводяться у статтях, надаються для їх зберігання і оброблення в різноманітних базах даних і інформаційних системах, включення їх в аналітичні і статистичні звітності, створення обгрунтованих взаємозв'язків об'єктів творів науки, літератури і мистецтва з персональними даними і т.п. на території, яка не обмежена.