МОДЕЛЬ КАСКАДУ ГІБРИДНОЇ СЕГМЕНТАЦІЇ ДЛЯ АВТОМАТИЧНОГО ДЕШИФРУВАННЯ ОБ’ЄКТІВ НА АЕРОЗНІМКАХ

Автор(и)

  • Serhiy Kovbasiuk Житомирський військовий інститут імені С.П.Корольова, Житомир, Україна, Україна
  • Leonid Kanevskyy Житомирський військовий інститут імені С.П.Корольова, Житомир, Україна, Україна
  • Mykola Romanchuk Житомирський військовий інститут імені С.П.Корольова, Житомир, Україна, Україна

DOI:

https://doi.org/10.33099/2311-7249/2019-35-2-65-70

Ключові слова:

нейромережі, сегментація, аерознімок, безпілотні авіаційні комплекси, каскад гібридної сегментації

Анотація

Актуальним завданням на сьогодні є пошук та удосконалення методів автоматичного детального дешифрування об'єктів на аерознімках, отриманих з безпілотних авіаційних комплексів,  які б забезпечували достатню точність виявлення та розпізнавання дрібнозернистих об’єктів в складних топографічних умовах місцевості над якими отримуються аерознімки.

З метою вирішення даного завдання в статті проведений аналіз методів автоматичної обробки зображень та моделей нейронних мереж, побудованих на їх основі. З проведеного аналізу виділено багатостадійний конвеєр обробки аерознімків, що об’єднує підходи виявлення, елементної сегментації та семантичну сегментацію для отримання контексту. Удосконалена моделі каскаду сегментації враховує геометричні розміри об’єктів та їх співвідношення, зміну масштабу, умови знімання. Використання моделі каскаду сегментації для автоматичного дешифрування об’єктів на аерознімках дозволить підвищити точність виявлення та розпізнавання таких об’єктів.

Посилання

H. Zhao, J. Shi, X. Qi, X. Wang, and J. Jia. Pyramid scene parsing network. available at: https://arxiv.org/ abs/1612.01105.pdf.

L.-C. Chen, G. Papandreou, I. Kokkinos, K. Murphy and A. L. Yuille. Semantic image segmentation with deep convolutional nets and fully connected CRFs. available at: https://arxiv.org/abs/ 1412.7062.pdf.

F. Yu, V. Koltun. Multi-scale context aggregation by dilated convolutions. available at: https://arxiv.org/abs/1511.07122.pdf.

T. Xiao, Y. Liu, B. Zhou, Y. Jiang, and J. Sun. Unified perceptual parsing for scene understanding. available at: https://arxiv.org/abs/ 1711.10370.pdf.

T.-Y. Lin, P. Dollár, R. Girshick, K. He, B. Hariharan, S. Belongie. Feature Pyramid Networks for Object Detection. available at: https://arxiv.org/ abs/1612.03144.pdf.

R. Girshick, J. Donahue, T. Darrell and J. Malik. Rich feature hierarchies for accurate object detection and semantic segmentation. available at: https://arxiv.org/abs/1311.2524.pdf.

J. R. Uijlings, K. E. V. D. Sande, T. Gevers, and A. W. Smeulders. Selective search for object recognition. available at: https://arxiv.org/abs/1807.05511.pdf.

J. Dai, K. He, Y. Li, S. Ren, J. Sun. Instance-sensitive fully convolutional networks. available at: https://arxiv.org/abs/1603.08678.pdf.

Q. Haozhi, D. Jifeng, J. Xiangyang , W. Yichen. Fully Convolutional Instance-aware Semantic Segmentation. available at: https://arxiv.org/abs/1611.07709.pdf.

J. Hosang, R. Benenson, P. Doll´ar, B. Schiele. What makes for effective detection proposals? available at: https://arxiv.org/abs/1502.05082.pdf.

J. Long, E. Shelhamer, T. Darrell. Fully convolutional networks for semantic segmentation. available at: https://arxiv.org/abs/ 1411.4038.pdf.

K. He, G. Gkioxari, P. Doll´ar, R. Girshick. Mask R-CNN. available at: https://arxiv.org/abs/ 1703.06870.pdf.

L.-C. Chen, G. Papandreou, I. Kokkinos, K. Murphy, A. L. Yuille. DeepLab: Semantic image segmentation with deep convolutional nets, atrous convolution, and fully connected CRFs. available at: https://arxiv.org/abs/1606.00915.pdf.

S. Ren, K. He, R. Girshick, J. Sun. Faster R-CNN: Towards realtime object detection with region proposal networks. available at: https://arxiv.org/abs/1506.01497.pdf.

J. Tighe, M. Niethammer, S. Lazebnik. Scene parsing with object instances and occlusion ordering. available at: https://arxiv.org/abs/1806.03772.pdf.

Z. Tu, X. Chen, A. L. Yuille, S.-C. Zhu. Image parsing: Unifying segmentation, detection, and recognition. available at: https://arxiv.org/ abs/0502172.pdf.

J. Yao, S. Fidler, R. Urtasun. Describing the scene as a whole: Joint object detection, scene classification and semantic segmentation. available at: https://arxiv.org/abs/1207.0372.pdf.

M. Sun, B.-S. Kim, P. Kohli, S. Savarese. Relating things and stuff via object property interactions. available at: http://svl.stanford.edu /assets/papers/pami14_acrf.pdf.

J. Yao, S. Fidler, and R. Urtasun. Describing the scene as a whole: Joint object detection, scene classification and semantic segmentation. available at: https://ttic.uchicago.edu/~rurtasun/publications/ yaoetal_cvpr12.pdf.

S. Zhang, L. Wen, X. Bian, Z. Lei, S. Z. Li. Single-shot refinement neural network for object detection. available at: https://arxiv.org/abs/ 1711.06897.pdf.

J. Redmon, S. Divvala, R. Girshick, A. Farhadi. You Only Look Once: Unified, Real-Time Object Detection. available at: https://arxiv.org/abs/ 1506.02640.pdf.

S. Gidaris, N. Komodakis. Object detection via a multiregion and semantic segmentation-aware CNN model. available at: https://arxiv.org/abs/ 1711.06897.pdf.

Z. Cai, N. Vasconcelos. Cascade R-CNN: Delving into high quality object detection. available at: https://arxiv.org/ abs/1712.00726.pdf.

Z. Cai, N. Vasconcelos. Aggregated residual transformations for deep neural networks. available at: https://arxiv.org/abs/ 1611.05431.pdf.

J. Dai, H. Qi, Y. Xiong, Y. Li, G. Zhang, H. Hu, Y. Wei. Deformable convolutional networks. available at: https://arxiv.org/abs/1703.06211.pdf.

K. Chen, J. Pang, J. Wang and other. Hybrid Task Cascade for Instance Segmentation. available at: https://arxiv.org/abs/ 1901.07518.pdf.

T.-Y. Lin, P. Goyal, R. Girshick, K. He, P. Dollár. Focal Loss for Dense Object Detection. available at: https://arxiv.org/abs/1708.02002.pdf

##submission.downloads##

Опубліковано

2019-09-02

Номер

Розділ

Військово-космічні та геоінформаційні технології