Модифікований ієрархічний трансформер для інтелектуальних систем підтримки прийняття рішень військового призначення
DOI:
https://doi.org/10.33099/2311-7249/2025-54-3-122-129Ключові слова:
трансформери, когнітивні карти, системи підтримки прийняття рішень, мультимодальна обробка даних, механізм самоуваги, штучний інтелект, ієрархічна інтеграція даних, темпоральна синхронізаціяАнотація
Мета статті. Побудова модифікованого ієрархічного трансформера (архітектури глибокого навчання нейронної мережі, що побудована на механізмі самоуваги) завдяки додаванню когнітивних карт контексту для покращення процесу оброблення різнорідної інформації в інтелектуальних системах підтримки прийняття рішень військового призначення.
Методи дослідження. Під час дослідження було застосовано: метод аналізу механізмів роботи уваги в трансформерах, метод математичного моделювання взаємодії об’єктів у бойовому просторі, а також метод формалізації когнітивних карт на основі концепцій з нейронауки. Ці методи дали змогу теоретично обґрунтувати побудову ієрархічного трансформера з інтегрованими когнітивними картами контексту.
Отримані результати дослідження. Сформульовано теоретичні підходи до модифікації ієрархічного трансформера з інтегрованими когнітивними картами контексту. Запропоновано формальну математичну модель когнітивної карти контексту як структури, що описує множину станів тактичної (оперативної) обстановки, причинно-наслідкові зв’язки між ними, їх векторне подання та динаміку переходів. Розроблено модифікований механізм самоуваги (self-attention) з інтеграцією матриці когнітивних впливів. Обґрунтовано ієрархічну організацію когнітивних карт контексту з механізмом узгодження розмірностей просторів між рівнями. Запропоновано механізм темпоральної синхронізації для обробки асинхронних потоків даних.
Елементи наукової новизни. Вперше запропоновано модифікацію механізму самоуваги трансформерів через інтеграцію формалізованих когнітивних карт контексту. Такий підхід забезпечує інтерпретованість прийнятих рішень через явне подання причинно-наслідкових зв’язків між елементами бойової обстановки, а також дає змогу однотипно обробити різнорідну інформацію: геопросторові координати об’єктів, темпоральні залежності з ефектами згасання впливу різних факторів та дискретних подій на об’єкти у часі. Для ієрархічної організації когнітивних карт запропоновано застосувати механізм узгодження розмірностей просторів між різними рівнями для забезпечення просторово-контекстуальної агрегації інформації.
Теоретичне та практичне значення викладеного у статті зводиться до створення математичного та алгоритмічного фундаменту для розробки інтелектуальних систем підтримки прийняття рішень військового призначення. Одним із основних призначень таких систем є оброблення гетерогенних інформаційних потоків різних джерел у реальному часі. Запропонований трансформер забезпечує високий рівень інтерпретованості рішень через механізм декомпозиції тактичної (оперативної) обстановки. Ця модифікована архітектура з інтегрованими когнітивними картами забезпечує розуміння командуванням причинно-наслідкових зв’язків між елементами обстановки та запропонованими системою рішеннями. Запропонований модифікований трансформер з інтегрованими когнітивними картами забезпечує ефективну обробку різнорідної інформації через модифікацію механізму самоуваги, ієрархічну організацію когнітивних карт та темпоральну синхронізацію асинхронних інформаційних потоків. Інтеграція експертних знань через матрицю когнітивних впливів забезпечує інтерпретованість рішень і можливість багатокритеріальної декомпозиції. Перспективами подальших досліджень є: експериментальна валідація запропонованого трансформера на реальних або синтетичних датасетах бойових тактичних (оперативних) епізодів, а також розроблення методів автоматизованого вилучення когнітивних карт контексту з історичних даних.
Посилання
Ceruti M. G., O’Brien J. J. Data management challenges and development for military information systems. Proceedings of the 1996 ACM SIGMOD International Conference on Management of Data (Montreal, Canada, June 4-6, 1996). New York: ACM, 1996. P. 435–445.
Shortland N. D., Alison L. J., Moran J. M. Military decision-making: Doctrine, rationality, and field-based approaches. Conflict: How soldiers make impossible decisions/ed. by P. T. Bartone, W. H. Johnston, M. V. Majchrzak. New York : Oxford University Press, 2019. P. 1–20.
Bengio Y., Simard P. Y., Frasconi P. Learning Long-Term Dependencies with Gradient Descent Is Difficult. IEEE Transactions on Neural Networks. 1994. Vol. 5, No. 2. P. 157–166. DOI: 10.1109/72.279181.
Gehring J., Auli M., Grangier D., Yarats D., Dauphin Y. N. Convolutional Sequence to Sequence Learning. Proceedings of the 34th International Conference on Machine Learning (ICML 2017). Sydney, Australia, 2017. Vol. 70. P. 1243–1252. DOI: 10.48550/arXiv.1705.03122.
Vaswani A., Shazeer N., Parmar N., Uszkoreit J., Jones L., Gomez N., Kaiser Ł., Polosukhin I. Attention is all you need. Advances in Neural Information Processing Systems. 2017. Vol. 30. P. 5998–6008. DOI: 10.48550/arXiv.1706.03762.
Alam F. S., Al Mamun M. A. Transformers and large language models for efficient intrusion detection systems: A comprehensive survey. Information Fusion. 2025. Vol. 113. 102567.
Tolman E. C. Cognitive maps in rats and men. Psychological Review. 1948. Vol. 55. № 4. P. 189–208. URL: https://personal.utdallas.edu/~tres/spatial/tolman.pdf (accessed: 15 September 2025).
Dosovitskiy A., Beyer L., Kolesnikov A., Weissenborn D., Zhai X., Unterthiner T., Dehghani M., Minderer M., Heigold G., Gelly S., Uszkoreit J., Houlsby N. An image is worth 16x16 words: Transformers for image recognition at scale. International Conference on Learning Representations (ICLR). 2021. DOI: 10.48550/arXiv.2010.11929.
Radford A., Kim J. W., Hallacy C., Ramesh A., Goh G., Agarwal S., Sastry G., Askell A., Mishkin P., Clark J., Krueger G., Sutskever I. Learning transferable visual models from natural language supervision. International Conference on Machine Learning. 2021. Vol. 139. P. 8748–8763. DOI: https://doi.org/10.48550/arXiv.2103.00020.
Wang S., Li B., Khabsa M., Fang H., Ma H. Linformer: Self-Attention with Linear Complexity. 2020. DOI: 10.48550/arXiv.2006.04768.
Garcez A. d’A., Lamb L. C. Neurosymbolic AI: The 3rd wave. Artificial Intelligence Review. 2023. Vol. 56. № 11. P. 12387–12406. DOI: 10.1007/s10462-023-10448-w.
Summary of the NATO Artificial Intelligence Strategy. NATO. 2021. URL: https://nato.int/en/about-us/official-texts-and-resources/official-texts/2021/10/22/summary-of-the-nato-artificial-intelligence-strategy (accessed: 15 September 2025).
O’Keefe J., Nadel L. The Hippocampus as a Cognitive Map. Oxford: Clarendon Press, 1978. 570 p. URL: https://www.cmor-faculty.rice.edu/~cox/neuro/HCMComplete.pdf (accessed: 15 September 2025).
Whittington J., Muller T., Mark S., Chen G., Barry C., Burgess N., Behrens T. The Tolman-Eichenbaum machine: Unifying space and relational memory through generalisation in the hippocampal formation. Cell. 2020. Vol. 183. № 5. P. 1249–1263. DOI: 10.1016/j.cell.2020.10.024.
Kosko B. Fuzzy cognitive maps. International Journal of Man-Machine Studies. 1986. Vol. 24. P. 65–75. DOI: 10.1016/S0020-7373(86)80040 2.
Diehl P. A Study of Causality in Military Planning: Master's thesis. Fort Leavenworth, KS: U.S. Army Command and General Staff College, 2012. URL: https://apps.dtic.mil/sti/tr/pdf/ADA563134.pdf (accessed: 15 September 2025).
Zgurovsky M., Pankratova N. System Analysis & Intelligent Computing: Theory and Applications. Cham: Springer, 2022. 419 p. DOI: 10.1007/978-3-030-94910-5.
Згуровський М. З., Бідюк П. І., Терентьєв О. М., Просянкіна-Жарова Т. І. Байєсівські мережі в системах підтримки прийняття рішень. Київ: ТОВ «ВП “Едельвейс”», 2015. 300 с.
Panibratov R., Bidyuk P. Applying Bayesian networks in analysis of actuarial risks. Problems of Control and Informatics. 2025. № 3. DOI: 10.34229/1028-0979-2025-3-3.
Tan M., Pang R., Le Q. EfficientDet: Scalable and Efficient Object Detection. Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR). 2020. P. 10781–10790.
Child R., Gray S., Radford A., Sutskever I. Generating Long Sequences with Sparse Transformers. 2019. DOI: 10.48550/arXiv.1904.10509.
##submission.downloads##
Опубліковано
Як цитувати
Номер
Розділ
Ліцензія
Автори, які публікуються у цьому журналі, погоджуються з наступними умовами:
1. Автори залишають за собою право на авторство своєї роботи та передають журналу право першої публікації цієї роботи на умовах ліцензії Creative Commons Attribution License, котра дозволяє іншим особам вільно розповсюджувати опубліковану роботу з обов'язковим посиланням на авторів оригінальної роботи та першу публікацію роботи у цьому журналі.
2. Автори мають право укладати самостійні додаткові угоди щодо неексклюзивного розповсюдження роботи у тому вигляді, в якому вона була опублікована цим журналом (наприклад, розміщувати роботу в електронному сховищі установи або публікувати як монографію), за умови збереження посилання на першу публікацію роботи у цьому журналі.
3. Політика журналу дозволяє і заохочує розміщення авторами в мережі Інтернет (наприклад, у сховищах установ або на особистих веб-сайтах) рукопису роботи, як до подання цього рукопису до редакції, так і під час його редакційного опрацювання, оскільки це сприяє виникненню продуктивної наукової дискусії та позитивно позначається на оперативності та динаміці цитування опублікованої роботи (див. The Effect of Open Access).
4. Персональні дані і метадані, які наводяться у статтях, надаються для їх зберігання і оброблення в різноманітних базах даних і інформаційних системах, включення їх в аналітичні і статистичні звітності, створення обгрунтованих взаємозв'язків об'єктів творів науки, літератури і мистецтва з персональними даними і т.п. на території, яка не обмежена.