Deep reinforcement learning for simulated autonomous drone control

Pimenta, Arthur Moriggi; Tannuri, Eduardo Aoun

Deep reinforcement learning for simulated autonomous drone control (2020)

Authors:
- Pimenta, Arthur Moriggi
- Tannuri, Eduardo Aoun (Orientador)
USP affiliated author: PIMENTA, ARTHUR MORIGGI - EP
School: EP
Sigla do Departamento: PMR
Subjects: AERONAVES NÃO TRIPULADAS; SIMULINK
Language: Inglês
Abstract: Com o aumento recenete no número de aplicações envolvendo drones, algoritmos dedicados ao controle de quadricópteros ganharam relevância. Um dos algoritmos de controle mais comum é o Proporcional, Integrativo e Derivativo, o PID. No entanto, pesquisas recentes afirmam que algoritmos de Deep Reinforcement Learning, como o Proximal Policy Optimization (PPO), apresentam resultados satisfatórios na tarefa de controle, podendo ser ainda melhores que o PID para condições extremas. Nesse contexto, desenvolvemos e comparamos os modelos de PID e PPO com o objetivo de controlar a atitude de um drone. Os ganhos do PID foram calculados através do método Lugar das Raízes e o modelo foi desenvolvido e simulado no software SIMULINK. O modelo PPO foi desenvolvido em python com a biblioteca Stable Baselines e o ambiente de treinamento do agente foi implementado com base nos padrões de ambiente GYM. O conjunto de hiperparâmetros e a função de recompensa utilizados no treinamento do modelo PPO foram inspirados no conjunto utilizado para treinar o ambiente Pendulum disponível no GYM. Os resultados obtidos mostram que em situações que exigem pequenas variações angulares, ambos modelos obtiveram resultados bons e similares, enquanto que em condições extremas, como partir de cabeça para baixo até 30 graus de atitude, o PPO se mostrou consideravelmente melhor e mais robusto do que o PID.
Imprenta:
- Place of publication: São Paulo
- Date published: 2020

Download do texto completo

Tipo	Nome	Link
	ARTHUR MORIGGI PIMENTA TC...	Direct link

How to cite

A citação é gerada automaticamente e pode não estar totalmente de acordo com as normas

ABNT

PIMENTA, Arthur Moriggi. Deep reinforcement learning for simulated autonomous drone control. 2020. Trabalho de Conclusão de Curso (Graduação) – Escola Politécnica, Universidade de São Paulo, São Paulo, 2020. Disponível em: https://bdta.abcd.usp.br/directbitstream/a95f38c4-11a0-444a-a6e3-078da6424e8d/ARTHUR%20MORIGGI%20PIMENTA%20TCC20.pdf. Acesso em: 27 abr. 2024.
APA

Pimenta, A. M. (2020). Deep reinforcement learning for simulated autonomous drone control (Trabalho de Conclusão de Curso (Graduação). Escola Politécnica, Universidade de São Paulo, São Paulo. Recuperado de https://bdta.abcd.usp.br/directbitstream/a95f38c4-11a0-444a-a6e3-078da6424e8d/ARTHUR%20MORIGGI%20PIMENTA%20TCC20.pdf
NLM

Pimenta AM. Deep reinforcement learning for simulated autonomous drone control [Internet]. 2020 ;[citado 2024 abr. 27 ] Available from: https://bdta.abcd.usp.br/directbitstream/a95f38c4-11a0-444a-a6e3-078da6424e8d/ARTHUR%20MORIGGI%20PIMENTA%20TCC20.pdf
Vancouver

Pimenta AM. Deep reinforcement learning for simulated autonomous drone control [Internet]. 2020 ;[citado 2024 abr. 27 ] Available from: https://bdta.abcd.usp.br/directbitstream/a95f38c4-11a0-444a-a6e3-078da6424e8d/ARTHUR%20MORIGGI%20PIMENTA%20TCC20.pdf

BDTA

Exportar registro bibliográfico

Deep reinforcement learning for simulated autonomous drone control (2020)

Download do texto completo

How to cite

Últimas obras dos mesmos autores vinculados com a USP cadastradas na BDPI:

USP Schools

BDTA

Exportar registro bibliográfico

Deep reinforcement learning for simulated autonomous drone control (2020)

Download do texto completo

How to cite

Últimas obras dos mesmos autores vinculados com a USP cadastradas na BDPI: