Методологічні засади нейромережевої скаляризації багатокритеріальних задач управління динамічними системами військового призначення
DOI:
https://doi.org/10.33099/2311-7249/2026-55-1-126-134Ключові слова:
штучний інтелект, машинне навчання, штучні нейронні мережі, навчання з підкріпленням, оцінка ефективності, багатокритеріальна оптимізація, нейромережева скаляризація, теорія управління, обробка даних, управління динамічними системами військового управлінняАнотація
Мета зводиться до розроблення методологічних засад стан-залежної нейромережевої скаляризації (State-Dependent Neural Scalarization (SDNS)) як універсального диференційованого оператора скаляризації багатокритеріальних цільових функцій для ефективного управління динамічними системами військового призначення.
Методи дослідження. Під час проведення дослідження застосовано методи системного аналізу, теорії багатокритеріальної оптимізації, теорії Парето, функціонального аналізу та тензорної алгебри, а також спеціальні методи глибокого навчання і багатоцільового навчання з підкріпленням (Multi-Objective Reinforcement Learning (MORL)), доповнені аналізом диференційованості нелінійних функцій агрегації.
Отримані результати дослідження. Показано обмеження класичних методів скаляризації багатокритеріальних задач динамічних систем військового призначення, зокрема, встановлено їх непридатність для роботи з неопуклими множинами Парето та умовами високодинамічного середовища. Формалізовано постановку задачі як перетворення векторної цільової функції у скалярну форму, придатну для інтеграції в алгоритми навчання з підкріпленням. Запропоновано математичну архітектуру стан-залежної нейромережевої скаляризації, що базується на тензорній конкатенації вектора локальних критеріїв та вектора фазового стану системи. Розроблено диференційований оператор агрегації, який забезпечує динамічну зміну пріоритетів критеріїв через механізм граничної норми заміщення як функції стану. Подано алгоритмічну процедуру навчання стан-залежної нейромережевої скаляризації із застосуванням багатоцільового навчання з підкріпленням.
Елементи наукової новизни. Вперше запропоновано методологію стан-залежної нейромережевої скаляризації багатокритеріальних задач управління динамічними системами військового призначення, що реалізує перетворення векторної цільової функції у скалярну форму як диференційований оператор, параметризований фазовим станом системи.
Теоретичне та практичне значення викладеного у статті. Теоретичне значення зводиться до формалізації стан-залежної нейромережевої скаляризації як диференційованого оператора агрегації критеріїв у задачах багатокритеріального моделювання динамічними системами військового призначення. Запропонований метод забезпечує математично коректне перетворення векторної цільової функції у скалярну форму з урахуванням фазового стану об’єкта, що розширює методологію багатокритеріальної оптимізації та створює основу для інтеграції нейромережевих методів у контури адаптивного керування. Практичне значення зумовлює можливості безпосереднього впровадження методу стан-залежної нейромережевої скаляризації у системи управління типу Command and Control, автономні безпілотні платформи, системи протидії радіоелектронному впливу та автономного кіберзахисту. Використання запропонованого підходу дає змогу забезпечити адаптивне перемикання пріоритетів між ефективністю виконання завдання, безпекою та ресурсними обмеженнями в режимі реального часу, підвищити стійкість алгоритмів навчання з підкріпленням до зміни тактичної обстановки та зменшити ризик некоректної поведінки автономних агентів.
Посилання
Artificial intelligence in the military domain and its implications for international peace and security: the UN General Assembly on 24 December 2024 № 79/239. URL https://docs-library.unoda.org/General_Assembly_First_Committee_-Eightieth_session_%282025%29/79-239-Ukraine-EN.pdf?utm_source=chatgpt.com (дата звернення: 14.02.2026).
Miettinen K. М. Nonlinear Multiobjective Optimization. Boston: Kluwer Academic Publishers, 1999. 324 p.
Deb K. Multi-Objective Optimization Using Evolutionary Algorithms. Boston: Springer, 2001. 497 р.
Sutton R. S., Barto A. G. Reinforcement Learning: An Introduction. 2nd ed, Cambridge, MA: The MIT Press, 2018. 552 p.
Про затвердження плану заходів з реалізації Концепції розвитку штучного інтелекту в Україні на 2021–2024 роки. Постанова КМ України від 12.05.2021 № 438-р. URL: https://zakon.rada.gov.ua/laws/main/438-2021-%D1%80?utm_source=chatgpt.com#Text (дата звернення: 14.02.2026).
Political Declaration on Responsible Military Use of Artificial Intelligence and Autonomy. Washington, D.C.: U.S. Department of State, 2023. URL: https://www.state.gov/wp-content/uploads/2023/10/Latest-Version-Political-Declaration-on-Responsible-Military-Use-of-AI-and-Autonomy.pdf (дата звернення: 25.02.2026).
Калачова В. В., Ткачук С. С., Меренті Є. О., Третяк Д. В. Багатокритеріальний синтез організаційної структури білінгової інформаційної системи методом аналізу ієрархій. Системи обробки інформації. 2020. № 2(161). С. 22–28. DOI: https://doi.org/10.30748/soi.2020.161.03.
Крайнов В., Грозовський Р., Кравчук А. Методика оцінки якості інформаційно-аналітичного забезпечення роботи автоматизованих інформаційних систем органів управління військового призначення. Сучасні інформаційні технології у сфері безпеки та оборони. 2019. № 3(36). С. 69–74. DOI: https://doi.org/10.33099/2311-7249/2019-36-3-69-74.
Кучук А. О. Моделі штучного інтелекту для управління та оптимізації peer-to-peer мереж. Радіоелектроніка та молодь у ХХІ столітті: матеріали 27-го Міжнар. молодіж. форуму, Харків, 10–12 травня 2023 р. ХНУРЕ, Харків, 2023. Т. 6. Ч. 1. С. 27–28.
Lin X., Zhang X., Yang Z., Liu F., Wang Z., Zhang Q. Smooth Tchebycheff Scalarization for Multi-Objective Optimization. Proceedings of the 41st International Conference on Machine Learning (ICML 2024). New York, NY, USA: ACM, 2024. DOI: https://doi.org/10.5555/3692070.3693297.
Peng N., Tian M., Fain B. Multi-objective Reinforcement Learning with Nonlinear Preferences: Provable Approximation for Maximizing Expected Scalarized Return. Proceedings of the 24th International Conference on Autonomous Agents and Multiagent Systems (AAMAS 2025). Detroit, MI, USA: International Foundation for Autonomous Agents and Multiagent Systems, 2025. URL: https://www.ifaamas.org/Proceedings/aamas2025/pdfs/p1632.pdf (дата звернення: 14.02.2026).
Ichihara Y., Jinnai Y., Morimura T., Sakamoto M., Mitsuhashi R., Uchibe E. MO GRPO: Mitigating Reward Hacking of Group Relative Policy Optimization on Multi-Objective Problems. 2025. (Preprint. arXiv:2509.22047). URL: https://arxiv.org/abs/2509.22047 (дата звернення: 25.02.2026).
Cybenko G. Approximation by superpositions of a sigmoidal function. Mathematics of Control, Signals, and Systems. 1989. Vol. 2. P. 303–314. DOI: https://doi.org/10.1007/BF02551274.
Hornik K., Stinchcombe M., White H. Multilayer feedforward networks are universal approximators. Neural Networks. 1989. Vol. 2. No. 5. P. 359–366. DOI: https://doi.org/10.1016/0893-6080(89)90020-8.
##submission.downloads##
Опубліковано
Як цитувати
Номер
Розділ
Ліцензія
Авторське право (c) 2026 Олена Іванівна Лифар , Роман Антонович Миколайчук

Ця робота ліцензується відповідно до Creative Commons Attribution 4.0 International License.
Автори, які публікуються у цьому журналі, погоджуються з наступними умовами:
1. Автори залишають за собою право на авторство своєї роботи та передають журналу право першої публікації цієї роботи на умовах ліцензії Creative Commons Attribution License, котра дозволяє іншим особам вільно розповсюджувати опубліковану роботу з обов'язковим посиланням на авторів оригінальної роботи та першу публікацію роботи у цьому журналі.
2. Автори мають право укладати самостійні додаткові угоди щодо неексклюзивного розповсюдження роботи у тому вигляді, в якому вона була опублікована цим журналом (наприклад, розміщувати роботу в електронному сховищі установи або публікувати як монографію), за умови збереження посилання на першу публікацію роботи у цьому журналі.
3. Політика журналу дозволяє і заохочує розміщення авторами в мережі Інтернет (наприклад, у сховищах установ або на особистих веб-сайтах) рукопису роботи, як до подання цього рукопису до редакції, так і під час його редакційного опрацювання, оскільки це сприяє виникненню продуктивної наукової дискусії та позитивно позначається на оперативності та динаміці цитування опублікованої роботи (див. The Effect of Open Access).
4. Персональні дані і метадані, які наводяться у статтях, надаються для їх зберігання і оброблення в різноманітних базах даних і інформаційних системах, включення їх в аналітичні і статистичні звітності, створення обгрунтованих взаємозв'язків об'єктів творів науки, літератури і мистецтва з персональними даними і т.п. на території, яка не обмежена.