Експериментальне оцінювання алгоритмів машинного навчання для прогнозування виробничих показників оборонно-промислового комплексу в середовищі Orange Data Mining

Автор(и)

DOI:

https://doi.org/10.33099/2311-7249/2025-54-3-130-140

Ключові слова:

машинне навчання, Naive Bayes classifier, Logistic Regression, Random Forest, Orange Data Mining, дисбаланс даних, оборонно-промисловий комплекс

Анотація

У статті розглянуто прогнозування виробничих потужностей оборонно-промислового комплексу із застосуванням алгоритмів машинного навчання як інструментів інтелектуального аналізу даних у середовищі Orange Data Mining.

Мета. Визначення доцільності використання, експериментальна перевірка та оцінювання точності алгоритмів наївного баєсівського класифікатора, логістичної регресії та методу випадкових лісів для прогнозування виробничих потужностей оборонно-промислового комплексу із використанням машинного навчання у середовищі Orange Data Mining.

Методи дослідження. Застосовано методи системного аналізу, інтелектуального аналізу даних та крос-валідації у середовищі Orange Data Mining. Використано алгоритми наївного баєсівського класифікатора, логістичної регресії та методу випадкових лісів. Оцінювання точності здійснено за метриками AUC, точність, F1 та коефіцієнт кореляції Метьюса.

Отримані результати дослідження. Сформовано експериментальний набір даних, що враховує вплив зовнішніх та внутрішніх факторів на виробничі процеси. Проведено порівняння алгоритмівашинного навчання, результати якого свідчать про суттєву перевагу алгоритму випадкових лісів, який досяг найвищих значень точності та збалансованості класифікації. Порівняння проводилося за допомогою крос-валідації та стандартних метрик точності. Матриці помилок засвідчили обмеження наївного баєсівського класифікатора та логістичної регресії при дисбалансі даних.

Елементи наукової новизни. Вперше для цієї предметної області показано відмінності у роботі алгоритмів наївного баєсівського класифікатора, логістичної регресії та випадкових лісів в умовах дисбалансу даних, що дало змогу визначити найбільш ефективний алгоритм прогнозування виробничих потужностей.

Теоретичне та практичне значення викладеного у статті. Теоретичне значення проведеного дослідження полягає у розширенні методологічних основ застосування алгоритмів машинного навчання для прогнозування виробничих процесів з урахуванням впливу зовнішніх та внутрішніх факторів. У роботі уточнено можливості використання інтегральних метрик оцінювання моделей, що підвищує достовірність результатів у випадках дисбалансу даних. Практичне значення отриманих результатів визначається можливістю використання алгоритму випадкових лісів як базового інструменту для прогнозування виробничих потужностей підприємств оборонно-промислового комплексу. Запропонований підхід дає змогу підвищити обґрунтованість управлінських рішень у сфері планування виробництва, оптимізації використання ресурсів та забезпечення стійкості оборонно-промислових процесів у складних умовах.

Посилання

Jain A., Dubes R. Algorithms for Clustering Data. Englewood Cliffs: Prentice Hall, 1988. 320 p. URL: https://homepages.inf.ed.ac.uk/rbf/BOOKS/JAIN/Clustering_Jain_Dubes.pdf (accessed: 10.08.2025).

Kaufman L., Rousseeuw P. Finding Groups in Data: An Introduction to Cluster Analysis. Wiley, 1990. 368 p. DOI: 10.2307/2532178.

Bishop C. Pattern Recognition and Machine Learning. New York : Springer, 2006. 738 p. DOI: 10.1117/1.2819119.

Domingos P., Pazzani M. On the Optimality of the Simple Bayesian Classifier under Zero-One Loss. Machine Learning. 1997. Vol. 29. № 2–3. P. 103–130. DOI: 10.1023/A:1007413511361.

Liu Y., Li Z., Xiong H., Gao X., Wu J. Understanding of Internal Clustering Validation Measures. Proceedings of the IEEE International Conference on Data Mining. Sydney, 2010. P. 911–916. DOI: 10.1109/ICDM.2010.35.

Breiman L. Random Forests. Machine Learning. 2001. Vol. 45. P. 5–32. DOI: 10.1023/A:1010933404324.

Mitchell T. Machine Learning. New York : McGraw-Hill, 1997. 414 p. URL: https://www.cs.cmu.edu/~tom/files/MachineLearningTomMitchell.pdf (дата звернення: 25.08.2025).

Texty.org.ua. Статистика повітряних тривог в Україні. 2025. URL: https://texty.org.ua (дата звернення: 16.09.2025).

Institute for the Study of War (ISW). Daily Campaign Assessments. 2025. URL: https://www.understandingwar.org (дата звернення: 15.09.2025).

НЕК «Укренерго». Офіційні повідомлення про роботу енергосистеми. URL: https://ua.energy (дата звернення: 10.09.2025).

Міністерство оборони України. Офіційні публікації та прес-релізи щодо розвитку виробництва БПЛА. URL: https://www.mil.gov.ua (дата звернення: 01.09.2025).

Torrijos J., Cao D., Casado-Vara R., Prieto J. Federated Learning with Discriminative Naive Bayes Classifier. Lecture Notes in Computer Science. 2025. Vol. 15347. P. 355–369. DOI: 10.1007/978-3-031-77738-7_27.

Hosmer D., Lemeshow S., Sturdivant R. Applied Logistic Regression. Wiley, 2013. DOI:10.1002/9781118548387.

Liaw A., Wiener M. Classification and Regression by randomForest. R News. 2002. Vol. 2(3). P. 18–22. URL: https://cran.r-project.org/doc/Rnews/Rnews_2002-3.pdf (дата звернення: 05.09.2025).

Arlot S., Celisse A. A survey of cross-validation procedures for model selection. Statistics Surveys. 2010. Vol. 4. P. 40–79. DOI: 10.1214/09-SS054.

Chicco D., Jurman G. The advantages of the Matthews correlation coefficient (MCC) over F1 score and accuracy in binary classification evaluation. BMC Genomics. 2020. Vol. 21(6). P. 1 13. DOI: 10.1186/s12864-019-6413-7.

Correll M. Teru Teru Bōzu: Defensive Raincloud Plots. Computer Graphics Forum. 2023. Vol. 42, Is. 3. P. 235–246. DOI: 10.1111/cgf.14826.

Quadri G. J., Wong L., Dunne C., Lee B. Automatic Scatterplot Design Optimization for Clustering Identification. IEEE Transactions on Visualization and Computer Graphics. 2022. Vol. 29. No. 10. P. 4312–4327. DOI: 10.1109/TVCG.2022.3189883.

Tharwat A. Classification assessment methods. Applied Computing and Informatics. 2021. Vol. 17. No. 1. P. 168–192. DOI: 10.1016/j.aci.2018.08.003.

##submission.downloads##

Опубліковано

2025-12-30

Як цитувати

Коваль, І. М. і Головня , С. А. (2025) «Експериментальне оцінювання алгоритмів машинного навчання для прогнозування виробничих показників оборонно-промислового комплексу в середовищі Orange Data Mining », Сучасні інформаційні технології у сфері безпеки та оборони. Київ, Україна, 54(3), с. 130–140. doi: 10.33099/2311-7249/2025-54-3-130-140.

Номер

Розділ

Інтелектуальні ІТ та робототехніка у сфері безпеки та оборони