МОДЕЛЬ КАСКАДУ ГІБРИДНОЇ СЕГМЕНТАЦІЇ ДЛЯ АВТОМАТИЧНОГО ДЕШИФРУВАННЯ ОБ’ЄКТІВ НА АЕРОЗНІМКАХ
DOI:
https://doi.org/10.33099/2311-7249/2019-35-2-65-70Ключові слова:
нейромережі, сегментація, аерознімок, безпілотні авіаційні комплекси, каскад гібридної сегментаціїАнотація
Актуальним завданням на сьогодні є пошук та удосконалення методів автоматичного детального дешифрування об'єктів на аерознімках, отриманих з безпілотних авіаційних комплексів, які б забезпечували достатню точність виявлення та розпізнавання дрібнозернистих об’єктів в складних топографічних умовах місцевості над якими отримуються аерознімки.
З метою вирішення даного завдання в статті проведений аналіз методів автоматичної обробки зображень та моделей нейронних мереж, побудованих на їх основі. З проведеного аналізу виділено багатостадійний конвеєр обробки аерознімків, що об’єднує підходи виявлення, елементної сегментації та семантичну сегментацію для отримання контексту. Удосконалена моделі каскаду сегментації враховує геометричні розміри об’єктів та їх співвідношення, зміну масштабу, умови знімання. Використання моделі каскаду сегментації для автоматичного дешифрування об’єктів на аерознімках дозволить підвищити точність виявлення та розпізнавання таких об’єктів.
Посилання
H. Zhao, J. Shi, X. Qi, X. Wang, and J. Jia. Pyramid scene parsing network. available at: https://arxiv.org/ abs/1612.01105.pdf.
L.-C. Chen, G. Papandreou, I. Kokkinos, K. Murphy and A. L. Yuille. Semantic image segmentation with deep convolutional nets and fully connected CRFs. available at: https://arxiv.org/abs/ 1412.7062.pdf.
F. Yu, V. Koltun. Multi-scale context aggregation by dilated convolutions. available at: https://arxiv.org/abs/1511.07122.pdf.
T. Xiao, Y. Liu, B. Zhou, Y. Jiang, and J. Sun. Unified perceptual parsing for scene understanding. available at: https://arxiv.org/abs/ 1711.10370.pdf.
T.-Y. Lin, P. Dollár, R. Girshick, K. He, B. Hariharan, S. Belongie. Feature Pyramid Networks for Object Detection. available at: https://arxiv.org/ abs/1612.03144.pdf.
R. Girshick, J. Donahue, T. Darrell and J. Malik. Rich feature hierarchies for accurate object detection and semantic segmentation. available at: https://arxiv.org/abs/1311.2524.pdf.
J. R. Uijlings, K. E. V. D. Sande, T. Gevers, and A. W. Smeulders. Selective search for object recognition. available at: https://arxiv.org/abs/1807.05511.pdf.
J. Dai, K. He, Y. Li, S. Ren, J. Sun. Instance-sensitive fully convolutional networks. available at: https://arxiv.org/abs/1603.08678.pdf.
Q. Haozhi, D. Jifeng, J. Xiangyang , W. Yichen. Fully Convolutional Instance-aware Semantic Segmentation. available at: https://arxiv.org/abs/1611.07709.pdf.
J. Hosang, R. Benenson, P. Doll´ar, B. Schiele. What makes for effective detection proposals? available at: https://arxiv.org/abs/1502.05082.pdf.
J. Long, E. Shelhamer, T. Darrell. Fully convolutional networks for semantic segmentation. available at: https://arxiv.org/abs/ 1411.4038.pdf.
K. He, G. Gkioxari, P. Doll´ar, R. Girshick. Mask R-CNN. available at: https://arxiv.org/abs/ 1703.06870.pdf.
L.-C. Chen, G. Papandreou, I. Kokkinos, K. Murphy, A. L. Yuille. DeepLab: Semantic image segmentation with deep convolutional nets, atrous convolution, and fully connected CRFs. available at: https://arxiv.org/abs/1606.00915.pdf.
S. Ren, K. He, R. Girshick, J. Sun. Faster R-CNN: Towards realtime object detection with region proposal networks. available at: https://arxiv.org/abs/1506.01497.pdf.
J. Tighe, M. Niethammer, S. Lazebnik. Scene parsing with object instances and occlusion ordering. available at: https://arxiv.org/abs/1806.03772.pdf.
Z. Tu, X. Chen, A. L. Yuille, S.-C. Zhu. Image parsing: Unifying segmentation, detection, and recognition. available at: https://arxiv.org/ abs/0502172.pdf.
J. Yao, S. Fidler, R. Urtasun. Describing the scene as a whole: Joint object detection, scene classification and semantic segmentation. available at: https://arxiv.org/abs/1207.0372.pdf.
M. Sun, B.-S. Kim, P. Kohli, S. Savarese. Relating things and stuff via object property interactions. available at: http://svl.stanford.edu /assets/papers/pami14_acrf.pdf.
J. Yao, S. Fidler, and R. Urtasun. Describing the scene as a whole: Joint object detection, scene classification and semantic segmentation. available at: https://ttic.uchicago.edu/~rurtasun/publications/ yaoetal_cvpr12.pdf.
S. Zhang, L. Wen, X. Bian, Z. Lei, S. Z. Li. Single-shot refinement neural network for object detection. available at: https://arxiv.org/abs/ 1711.06897.pdf.
J. Redmon, S. Divvala, R. Girshick, A. Farhadi. You Only Look Once: Unified, Real-Time Object Detection. available at: https://arxiv.org/abs/ 1506.02640.pdf.
S. Gidaris, N. Komodakis. Object detection via a multiregion and semantic segmentation-aware CNN model. available at: https://arxiv.org/abs/ 1711.06897.pdf.
Z. Cai, N. Vasconcelos. Cascade R-CNN: Delving into high quality object detection. available at: https://arxiv.org/ abs/1712.00726.pdf.
Z. Cai, N. Vasconcelos. Aggregated residual transformations for deep neural networks. available at: https://arxiv.org/abs/ 1611.05431.pdf.
J. Dai, H. Qi, Y. Xiong, Y. Li, G. Zhang, H. Hu, Y. Wei. Deformable convolutional networks. available at: https://arxiv.org/abs/1703.06211.pdf.
K. Chen, J. Pang, J. Wang and other. Hybrid Task Cascade for Instance Segmentation. available at: https://arxiv.org/abs/ 1901.07518.pdf.
T.-Y. Lin, P. Goyal, R. Girshick, K. He, P. Dollár. Focal Loss for Dense Object Detection. available at: https://arxiv.org/abs/1708.02002.pdf
##submission.downloads##
Опубліковано
Номер
Розділ
Ліцензія
Автори, які публікуються у цьому журналі, погоджуються з наступними умовами:
1. Автори залишають за собою право на авторство своєї роботи та передають журналу право першої публікації цієї роботи на умовах ліцензії Creative Commons Attribution License, котра дозволяє іншим особам вільно розповсюджувати опубліковану роботу з обов'язковим посиланням на авторів оригінальної роботи та першу публікацію роботи у цьому журналі.
2. Автори мають право укладати самостійні додаткові угоди щодо неексклюзивного розповсюдження роботи у тому вигляді, в якому вона була опублікована цим журналом (наприклад, розміщувати роботу в електронному сховищі установи або публікувати як монографію), за умови збереження посилання на першу публікацію роботи у цьому журналі.
3. Політика журналу дозволяє і заохочує розміщення авторами в мережі Інтернет (наприклад, у сховищах установ або на особистих веб-сайтах) рукопису роботи, як до подання цього рукопису до редакції, так і під час його редакційного опрацювання, оскільки це сприяє виникненню продуктивної наукової дискусії та позитивно позначається на оперативності та динаміці цитування опублікованої роботи (див. The Effect of Open Access).
4. Персональні дані і метадані, які наводяться у статтях, надаються для їх зберігання і оброблення в різноманітних базах даних і інформаційних системах, включення їх в аналітичні і статистичні звітності, створення обгрунтованих взаємозв'язків об'єктів творів науки, літератури і мистецтва з персональними даними і т.п. на території, яка не обмежена.