Моніторинг динаміки міської забудови, інвентаризація земель та оцінка площ об'єктів нерухомості за даними дистанційного зондування Землі (ДЗЗ) є актуальними задачами геоінформаційних систем. Традиційні методи ручного дешифрування аерокосмічних знімків характеризуються високою трудомісткістю [1, c.1-4], що зумовлює необхідність впровадження інтелектуальних систем автоматизації на основі глибокого машинного навчання. Задачі попіксельного виділення контурів будівель вимагають від алгоритмів високої точності геометричних меж та високої швидкості обробки великих масивів растрових даних.
Метою роботи є розробка нейромережевого підходу для сегментації та підрахунку кількості будівель на аерокосмічних знімках з використанням архітектури YOLO11-seg та розробкою інтерактивного графічного інтерфейсу користувача.
У роботі використано модель YOLO11-seg (конфігурація Nano) [2], яка оптимізована для роботи в режимі реального часу. Функціональна структура архітектури містить модуль YOLO Head [3] на базі концепції Feature Pyramid Network (FPN), що дозволяє здійснювати багатомасштабне прогнозування об'єктів різної площі. Вихідний тензор моделі формує координати обмежувальних рамок (bounding boxes) та оцінки впевненості класів, які після фільтрації алгоритмом придушення не-максимумів (Non-Maximum Suppression, NMS) [4, c.88] використовуються як області інтересу (ROI) для генерації фінальних масок сегментації. Програмну реалізацію системи виконано мовою Python із розробкою GUI-додатка.
Для оцінки ефективності запропонованого в роботі підходу програмного рішення було проведено комплексне навчання нейромережевої архітектури YOLO11n-seg та її подальше тестування на незалежних растрових даних дистанційного зондування Землі. Процес навчання тривав 120 епох і зайняв 1.625 години на обчислювальних потужностях центрального процесора AMD Ryzen 5 7520U з інтегрованою графікою Radeon Graphics, що підкреслює низьку апаратну вимогливість обраної Nano-конфігурації моделі. У результаті оптимізації вага фінальної моделі (як для файлу last.pt, так і для best.pt) склала лише 6.0 МБ, роблячи її придатною для інтеграції в мобільні та вбудовані системи. За результатами валідації на незалежній вибірці було досягнуто високих показників точності, які представлено в табл.1.
Таблиця 1. Метрики ефективності моделі сегментації будівель YOLO11n-seg
Порівняльний аналіз отриманих метрик дозволяє зробити висновок про збалансованість навченої моделі. Значення середньої точності розпізнавання об’єктів забудови рамок (Bounding Boxes) (mAP50 = 0.87) та попіксельної сегментації (mAP50mask = 0.84) демонструють мінімальний розрив (лише 3%).
Показники повноти (R = 0.87) та повноти маскування (Rmask = 0.87) підтверджують, що тривале навчання дозволило нейромережі накопичити достатньо ознак для ідентифікації об'єктів із нестандартною архітектурою дахів, низьким рівнем контрасту відносно землі та частково затінених промислових зон. Крім того, точність маскування (Pmask = 0.86) гарантує відсутність поширення "шуму" або помилкового захоплення елементів дорожнього покриття чи рослинності в контур будівлі.
Метрика геометричної відповідності масок (mAP50-95mask = 0.85) підтверджує, що запропонований підхід може бути рекомендована не лише для простого підрахунку кількості споруд (кількісного аналізу), а й для автоматизованого розрахунку загальної площі забудови міських кварталів та виявлення несанкціонованого капітального будівництва за даними ДЗЗ.
Висновки. Запропонований в роботі нейромережевої підхід підтвердив високу ефективність застосування архітектури YOLO11-seg для задач архітектурно-містобудівного моніторингу. Отримана модель поєднує компактний розмір (6.0 МБ) із високою швидкістю обробки, що дозволяє інтегрувати її у мобільні системи або веб-сервіси ДЗЗ для оперативного аналізу великих площ територій у режимі, близькому до реального часу.
Список літератури:
1. Chen H., Qi Z., Shi Z. Remote Sensing Image Change Detection With Transformers. IEEE Transactions on Geoscience and Remote Sensing. 2022. Vol. 60. P. 1–14. DOI: https://doi.org/10.1109/TGRS.2021.3095166.
2. Sharma A., Kumar V., Longchamps L. Comparative Performance of YOLOv8, YOLOv9, YOLOv10, YOLOv11 and Faster R-CNN Models for Detection of Multiple Weed Species. Smart Agricultural Technology. 2024. Vol. 9. Art. 100648. DOI: https://doi.org/10.1016/j.atech.2024.100648.
3. Ultralytics YOLO (Ultralytics Repository) : GitHub repository. URL: https://github.com/ultralytics/ultralytics/ (дата звернення: 13.05.2026).
4. Каштан В. Ю., Радіонов Є. Д. Порівняння методів глибокого навчання в задачах розпізнавання літаків за даними аерокосмічної зйомки. Електротехнічні та інформаційні системи. 2024. № 106. С. 87–91. DOI: https://doi.org/10.32782/EIS/2024-106-15.
|