Методологічні засади нейромережевої скаляризації багатокритеріальних задач управління динамічними системами військового призначення

Роман Антонович Миколайчук; Олена Іванівна Лифар

doi:10.33099/2311-7249/2026-55-1-126-134

Автор(и)

Роман Антонович Миколайчук Національний університет оборони України, Україна https://orcid.org/0000-0001-5349-4487
Олена Іванівна Лифар Національний університет оборони України, Україна https://orcid.org/0009-0004-4894-2184

DOI:

https://doi.org/10.33099/2311-7249/2026-55-1-126-134

Ключові слова:

штучний інтелект, машинне навчання, штучні нейронні мережі, навчання з підкріпленням, оцінка ефективності, багатокритеріальна оптимізація, нейромережева скаляризація, теорія управління, обробка даних, управління динамічними системами військового управління

Анотація

Мета зводиться до розроблення методологічних засад стан-залежної нейромережевої скаляризації (State-Dependent Neural Scalarization (SDNS)) як універсального диференційованого оператора скаляризації багатокритеріальних цільових функцій для ефективного управління динамічними системами військового призначення.

Методи дослідження. Під час проведення дослідження застосовано методи системного аналізу, теорії багатокритеріальної оптимізації, теорії Парето, функціонального аналізу та тензорної алгебри, а також спеціальні методи глибокого навчання і багатоцільового навчання з підкріпленням (Multi-Objective Reinforcement Learning (MORL)), доповнені аналізом диференційованості нелінійних функцій агрегації.

Отримані результати дослідження. Показано обмеження класичних методів скаляризації багатокритеріальних задач динамічних систем військового призначення, зокрема, встановлено їх непридатність для роботи з неопуклими множинами Парето та умовами високодинамічного середовища. Формалізовано постановку задачі як перетворення векторної цільової функції у скалярну форму, придатну для інтеграції в алгоритми навчання з підкріпленням. Запропоновано математичну архітектуру стан-залежної нейромережевої скаляризації, що базується на тензорній конкатенації вектора локальних критеріїв та вектора фазового стану системи. Розроблено диференційований оператор агрегації, який забезпечує динамічну зміну пріоритетів критеріїв через механізм граничної норми заміщення як функції стану. Подано алгоритмічну процедуру навчання стан-залежної нейромережевої скаляризації із застосуванням багатоцільового навчання з підкріпленням.

Елементи наукової новизни. Вперше запропоновано методологію стан-залежної нейромережевої скаляризації багатокритеріальних задач управління динамічними системами військового призначення, що реалізує перетворення векторної цільової функції у скалярну форму як диференційований оператор, параметризований фазовим станом системи.

Теоретичне та практичне значення викладеного у статті. Теоретичне значення зводиться до формалізації стан-залежної нейромережевої скаляризації як диференційованого оператора агрегації критеріїв у задачах багатокритеріального моделювання динамічними системами військового призначення. Запропонований метод забезпечує математично коректне перетворення векторної цільової функції у скалярну форму з урахуванням фазового стану об’єкта, що розширює методологію багатокритеріальної оптимізації та створює основу для інтеграції нейромережевих методів у контури адаптивного керування. Практичне значення зумовлює можливості безпосереднього впровадження методу стан-залежної нейромережевої скаляризації у системи управління типу Command and Control, автономні безпілотні платформи, системи протидії радіоелектронному впливу та автономного кіберзахисту. Використання запропонованого підходу дає змогу забезпечити адаптивне перемикання пріоритетів між ефективністю виконання завдання, безпекою та ресурсними обмеженнями в режимі реального часу, підвищити стійкість алгоритмів навчання з підкріпленням до зміни тактичної обстановки та зменшити ризик некоректної поведінки автономних агентів.

Біографія автора

Роман Антонович Миколайчук , Національний університет оборони України

доктор технічних наук, доцент

Посилання

Artificial intelligence in the military domain and its implications for international peace and security: the UN General Assembly on 24 December 2024 № 79/239. URL https://docs-library.unoda.org/General_Assembly_First_Committee_-Eightieth_session_%282025%29/79-239-Ukraine-EN.pdf?utm_source=chatgpt.com (дата звернення: 14.02.2026).

Miettinen K. М. Nonlinear Multiobjective Optimization. Boston: Kluwer Academic Publishers, 1999. 324 p.

Deb K. Multi-Objective Optimization Using Evolutionary Algorithms. Boston: Springer, 2001. 497 р.

Sutton R. S., Barto A. G. Reinforcement Learning: An Introduction. 2nd ed, Cambridge, MA: The MIT Press, 2018. 552 p.

Про затвердження плану заходів з реалізації Концепції розвитку штучного інтелекту в Україні на 2021–2024 роки. Постанова КМ України від 12.05.2021 № 438-р. URL: https://zakon.rada.gov.ua/laws/main/438-2021-%D1%80?utm_source=chatgpt.com#Text (дата звернення: 14.02.2026).

Political Declaration on Responsible Military Use of Artificial Intelligence and Autonomy. Washington, D.C.: U.S. Department of State, 2023. URL: https://www.state.gov/wp-content/uploads/2023/10/Latest-Version-Political-Declaration-on-Responsible-Military-Use-of-AI-and-Autonomy.pdf (дата звернення: 25.02.2026).

Калачова В. В., Ткачук С. С., Меренті Є. О., Третяк Д. В. Багатокритеріальний синтез організаційної структури білінгової інформаційної системи методом аналізу ієрархій. Системи обробки інформації. 2020. № 2(161). С. 22–28. DOI: https://doi.org/10.30748/soi.2020.161.03.

Крайнов В., Грозовський Р., Кравчук А. Методика оцінки якості інформаційно-аналітичного забезпечення роботи автоматизованих інформаційних систем органів управління військового призначення. Сучасні інформаційні технології у сфері безпеки та оборони. 2019. № 3(36). С. 69–74. DOI: https://doi.org/10.33099/2311-7249/2019-36-3-69-74.

Кучук А. О. Моделі штучного інтелекту для управління та оптимізації peer-to-peer мереж. Радіоелектроніка та молодь у ХХІ столітті: матеріали 27-го Міжнар. молодіж. форуму, Харків, 10–12 травня 2023 р. ХНУРЕ, Харків, 2023. Т. 6. Ч. 1. С. 27–28.

Lin X., Zhang X., Yang Z., Liu F., Wang Z., Zhang Q. Smooth Tchebycheff Scalarization for Multi-Objective Optimization. Proceedings of the 41st International Conference on Machine Learning (ICML 2024). New York, NY, USA: ACM, 2024. DOI: https://doi.org/10.5555/3692070.3693297.

Peng N., Tian M., Fain B. Multi-objective Reinforcement Learning with Nonlinear Preferences: Provable Approximation for Maximizing Expected Scalarized Return. Proceedings of the 24th International Conference on Autonomous Agents and Multiagent Systems (AAMAS 2025). Detroit, MI, USA: International Foundation for Autonomous Agents and Multiagent Systems, 2025. URL: https://www.ifaamas.org/Proceedings/aamas2025/pdfs/p1632.pdf (дата звернення: 14.02.2026).

Ichihara Y., Jinnai Y., Morimura T., Sakamoto M., Mitsuhashi R., Uchibe E. MO GRPO: Mitigating Reward Hacking of Group Relative Policy Optimization on Multi-Objective Problems. 2025. (Preprint. arXiv:2509.22047). URL: https://arxiv.org/abs/2509.22047 (дата звернення: 25.02.2026).

Cybenko G. Approximation by superpositions of a sigmoidal function. Mathematics of Control, Signals, and Systems. 1989. Vol. 2. P. 303–314. DOI: https://doi.org/10.1007/BF02551274.

Hornik K., Stinchcombe M., White H. Multilayer feedforward networks are universal approximators. Neural Networks. 1989. Vol. 2. No. 5. P. 359–366. DOI: https://doi.org/10.1016/0893-6080(89)90020-8.

Методологічні засади нейромережевої скаляризації багатокритеріальних задач управління динамічними системами військового призначення

Автор(и)

DOI:

Ключові слова:

Анотація

Біографія автора

Роман Антонович Миколайчук , Національний університет оборони України

Посилання

##submission.downloads##

Опубліковано

Версії

Як цитувати

Номер

Розділ

Ліцензія

Інформація