Exportar registro bibliográfico

Deep reinforcement learning for simulated autonomous drone control (2020)

  • Authors:
  • USP affiliated author: PIMENTA, ARTHUR MORIGGI - EP
  • School: EP
  • Sigla do Departamento: PMR
  • Subjects: AERONAVES NÃO TRIPULADAS; SIMULINK
  • Language: Inglês
  • Abstract: Com o aumento recenete no número de aplicações envolvendo drones, algoritmos dedicados ao controle de quadricópteros ganharam relevância. Um dos algoritmos de controle mais comum é o Proporcional, Integrativo e Derivativo, o PID. No entanto, pesquisas recentes afirmam que algoritmos de Deep Reinforcement Learning, como o Proximal Policy Optimization (PPO), apresentam resultados satisfatórios na tarefa de controle, podendo ser ainda melhores que o PID para condições extremas. Nesse contexto, desenvolvemos e comparamos os modelos de PID e PPO com o objetivo de controlar a atitude de um drone. Os ganhos do PID foram calculados através do método Lugar das Raízes e o modelo foi desenvolvido e simulado no software SIMULINK. O modelo PPO foi desenvolvido em python com a biblioteca Stable Baselines e o ambiente de treinamento do agente foi implementado com base nos padrões de ambiente GYM. O conjunto de hiperparâmetros e a função de recompensa utilizados no treinamento do modelo PPO foram inspirados no conjunto utilizado para treinar o ambiente Pendulum disponível no GYM. Os resultados obtidos mostram que em situações que exigem pequenas variações angulares, ambos modelos obtiveram resultados bons e similares, enquanto que em condições extremas, como partir de cabeça para baixo até 30 graus de atitude, o PPO se mostrou consideravelmente melhor e mais robusto do que o PID.
  • Imprenta:

  • Download do texto completo

    Tipo Nome Link
    Versão Publicada ARTHUR MORIGGI PIMENTA TC... Direct link
    How to cite
    A citação é gerada automaticamente e pode não estar totalmente de acordo com as normas

    • ABNT

      PIMENTA, Arthur Moriggi. Deep reinforcement learning for simulated autonomous drone control. 2020. Trabalho de Conclusão de Curso (Graduação) – Escola Politécnica, Universidade de São Paulo, São Paulo, 2020. Disponível em: https://bdta.abcd.usp.br/directbitstream/a95f38c4-11a0-444a-a6e3-078da6424e8d/ARTHUR%20MORIGGI%20PIMENTA%20TCC20.pdf. Acesso em: 27 abr. 2024.
    • APA

      Pimenta, A. M. (2020). Deep reinforcement learning for simulated autonomous drone control (Trabalho de Conclusão de Curso (Graduação). Escola Politécnica, Universidade de São Paulo, São Paulo. Recuperado de https://bdta.abcd.usp.br/directbitstream/a95f38c4-11a0-444a-a6e3-078da6424e8d/ARTHUR%20MORIGGI%20PIMENTA%20TCC20.pdf
    • NLM

      Pimenta AM. Deep reinforcement learning for simulated autonomous drone control [Internet]. 2020 ;[citado 2024 abr. 27 ] Available from: https://bdta.abcd.usp.br/directbitstream/a95f38c4-11a0-444a-a6e3-078da6424e8d/ARTHUR%20MORIGGI%20PIMENTA%20TCC20.pdf
    • Vancouver

      Pimenta AM. Deep reinforcement learning for simulated autonomous drone control [Internet]. 2020 ;[citado 2024 abr. 27 ] Available from: https://bdta.abcd.usp.br/directbitstream/a95f38c4-11a0-444a-a6e3-078da6424e8d/ARTHUR%20MORIGGI%20PIMENTA%20TCC20.pdf

    Últimas obras dos mesmos autores vinculados com a USP cadastradas na BDPI:

    Digital Library of Academic Works of Universidade de São Paulo     2012 - 2024