Багатоагентне навчання з глибоким підкріпленням у задачі планування шляху рою БПЛА

В. М. Синєглазов; І. О. Юденко

doi:10.31548/energiya1(83).2026.101

Автор(и)

В. М. Синєглазов Національний технічний університет України «Київський політехнічний інститут імені Ігоря Сікорського»
І. О. Юденко Національний технічний університет України «Київський політехнічний інститут імені Ігоря Сікорського»

DOI:

https://doi.org/10.31548/energiya1(83).2026.101

Ключові слова:

безпілотні літальні апарати, точне землеробство, мультиагентні системи

Анотація

Робота присвячена багатоагентному навчанню з глибоким підкріпленням у задачі планування шляху. Обгрунтовано використання роїв БПЛА в точному землеробстві. Показано, що для використання роїв дронів необхідно застосовувати штучний інтелект, зокрема навчання з підкріпленням. Поставлена задача планування шляху при наявності поганої якості або вітсутності GPS навігації. Запропоновано використання методу Multi-Agent Proximal Policy Optimization. Отримані результати показали високу якість планування шляху в умовах наявності перешкод та поганої якості або вітсутності GPS навігації.

Отримано 2025-12-27

Доопрацьовано 2026-02-02

Прийнято 2026-02-11

Посилання

1. Atalla S, Tarapiah S, Gawanmeh A, Daradkeh M, Mukhtar H, Himeur Y, Mansoor W, Hashim KFB, Daadoo M. (2023). IoT-Enabled Precision Agriculture: Developing an Ecosystem for Optimized Crop Management. Information, 14(4):205. https://doi.org/10.3390/info14040205

2. Puente-Castro, A.; Rivero, D.; Pazos, A.; Fernandez-Blanco, E. (2022). A review of artiﬁcial intelligence applied to path planning in UAVswarms. Neural Comput. Appl. 34, 153–170. [CrossRef]

3. Iqbal, M.M.; Ali, Z.A.; Khan, R.; Shaﬁq, M. (2022). Motion Planning of UAV Swarm: Recent Challenges and Approaches. In Aeronautics-New Advances; IntechOpen: London, UK .

4. Zhu, X.; Liu, Z.; Yang, J. (2015). Model of collaborative UAV swarm toward coordination and control mechanisms study. Procedia Comput.Sci., 51, 493–502. [CrossRef]

5. Paulsson, M. (2017). High-Level Control of UAV Swarms with RSSI Based Position Estimation. Master’s Thesis, Lund University, Lund,Sweden.

6. Arshid, K., Krayani, A., Marcenaro, L., Gomez, D. M., & Regazzoni, C. (2025). Toward Autonomous UAV Swarm Navigation: A Review of Trajectory Design Paradigms. Sensors, 25(18), 5877. https://doi.org/10.3390/s25185877.

7. Poudel, S.; Moh, S. (2022). Task assignment algorithms for unmanned aerial vehicle networks: A comprehensive survey. Veh. Commun., 35, 100469.

8. Khatib, O. (1986). Real-time bstacle avoidance for manipulators and mobile robots. Int. J. Robot. Res., 5, 90–98.

9. Pan, Z.; Zhang, C.; Xia, Y.; Xiong, H.; Shao, X. (2022). An improved artificial potential field method for path planning and formation control of the multi-UAV systems. IEEE Trans. Circuits Syst. II Express Briefs, 69, 1129–1133.

10. Wei, R.; Xu, Z.; Wang, S.; Lv, M. (2015). Self-optimization A-star algorithm for UAV path planning based on Laguerre diagram. Syst. Eng. Electron, 37, 577–582.

11. Holland, J.H. (1975). Adaptation in Natural and Artificial Systems: An Introductory Analysis with Applications to Biology, Control, and Artificial Intelligence; MIT Press: Cambridge, MA, USA

12. Zhenhua, P.; Hongbin, D.; Li, D. (2021). A multilayer graph for multi-agent formation and trajectory tracking control based on MPC algorithm. IEEE Trans. Cybern, 50, 12.

13. Yolov (2022). Available online: https://github.com/ultralytics/yolov5

14. Sutton, R.S.; Barto, A.G.(2018). Reinforcement Learning, 2nd ed.; An Introduction; MIT Press: Cambridge, MA, USA.

15. Jiang, J.; Contributors, M. MARLlib (2023). Documentation: PPO Family of Algorithms. 2023. Available at: https://marllib.readthedocs.io/en/latest/algorithm/ppo_family.html

Багатоагентне навчання з глибоким підкріпленням у задачі планування шляху рою БПЛА

Автор(и)

DOI:

Ключові слова:

Анотація

Посилання

Завантаження

Опубліковано

Номер

Розділ

Ліцензія

Як цитувати

Розроблено

Мова

Інформація