Olá, eu sou
HPC Software Engineer &
Mestrando em Ciência da Computação
Um pouco sobre mim
Desenvolvedor e pesquisador na área de computação de alto desempenho, atuando como HPC Software Engineer no CESAR. Engenheiro de Computação formado pela UFRGS com Láurea Acadêmica e mestrando em Computação pela UFRGS, na área de Computação de Alto Desempenho e Sistemas Distribuídos, tem foco em paralelismo, computação em GPU, escalabilidade e otimização de aplicações.
Desenvolvimento e otimização de aplicações HPC com foco em paralelismo, escalabilidade e eficiência energética em ambientes de produção de alta complexidade.
Programação paralela com CUDA e HIP. Otimização de kernels, Unified Memory, prefetch e aceleração multi-GPU em NVIDIA e AMD.
Simulações sísmicas de alto desempenho (RTM, Fletcher) para Oil & Gas em GPUs P100, V100, A100, H200 e RX 7900 XT.
Avaliação de ML-KEM, Dilithium, Falcon e HQC integrados ao QUIC/TLS 1.3. Aceleração GPU com speedup de até 186× sobre CPU.
Arquitetura de sistemas robustos e escaláveis. Pipelines, APIs e automação com foco em qualidade e desempenho.
Pipelines com Python e Pandas, paralelização de SQL e APIs escaláveis com FastAPI para ambientes de alta demanda.
CESAR - Petrobras
Concordia University, Mitacs Globalink · Canadá
Aprix
INF/UFRGS, Projeto Exaflop II (Petrobras)
Universidade Federal do Rio Grande do Sul, UFRGS
2026 - Presente
Foco em Computação de Alto Desempenho (HPC) e Sistemas Distribuídos.
Universidade Federal do Rio Grande do Sul, UFRGS
JUN/2020 - DEZ/2025
Graduado em Engenharia de Computação pela UFRGS com Láurea Acadêmica, possui formação sólida em computação, matemática, física, eletrônica, algoritmos, sistemas computacionais, IA/ML, programação paralela e fundamentos de HPC. Durante a graduação, atuou em iniciação científica em HPC, realizou pesquisa internacional na Concordia University, no Canadá, e desenvolveu seu TCC sobre criptografia pós-quântica aplicada ao protocolo QUIC.
Mitacs Globalink Research, Concordia University, Montreal, Canadá
MAR/25 - JUL/25
Pesquisa internacional na Concordia University, em Montreal, pelo programa Mitacs Globalink, com foco em criptografia pós-quântica aplicada ao QUIC/TLS 1.3. Avaliou algoritmos do NIST em CPU e GPU, comparando abordagens clássicas, pós-quânticas e híbridas, com resultados publicados na IEEE CNS 2025.
Publicações em conferências nacionais e internacionais de alta relevância nas áreas de High Performance Computing (HPC) e Criptografia Pós-Quântica.
Nosso trabalho foi aprovado para apresentação na IEEE CNS 2025. O estudo avalia a adoção de criptografia pós-quântica no protocolo QUIC, comparando KEMs e assinaturas digitais do NIST em variantes puras e híbridas. Os resultados mostram que o ML-KEM oferece o melhor equilíbrio entre desempenho, baixo consumo de recursos e segurança, enquanto abordagens híbridas adicionam proteção com impacto mínimo.
Unified Memory e prefetch para otimizar desempenho e eficiência energética em simulações sísmicas. Ganhos de até 62,2% em performance e 78,1% em eficiência energética em P100, V100, A100, H200 e RX 7900 XT.
Otimização multi-GPU do Fletcher com paralelização compute-comunicação. Até 40% de redução no overhead de sincronização.
Implementação multi-GPU do método RTM (Reverse Time Migration) para processamento sísmico em HPC com múltiplas GPUs NVIDIA via CUDA.
Trabalho publicado nos Anais da XXIII Escola Regional de Alto Desempenho da Região Sul (ERAD-RS 2023). O estudo compara o desempenho da execução da Modelagem de Fletcher entre ambientes de computação em nuvem e servidor local, analisando métricas de tempo de execução, consumo de energia e escalabilidade em contextos de HPC.
Artigo apresentado na 32nd Euromicro International Conference on Parallel, Distributed and Network-Based Processing (PDP 2024), Dublin. O BTO usa algoritmo genético para otimizar automaticamente configurações de blocos e threads em GPUs. Avaliado em arquiteturas NVIDIA e AMD, demonstrou melhorias de até 83,8% no energy-delay product (EDP) e convergência ótima em 96,4% dos cenários.
Publicado nos Anais da XXIV Escola Regional de Alto Desempenho da Região Sul (ERAD-RS 2024). O artigo apresenta estratégia exaustiva de otimização das configurações de threads por bloco em kernels GPU aplicada ao Método de Fletcher. Resultados demonstram ganhos médios superiores a 20% no EDP em relação às execuções padrão.
Projetos de HPC, colaborações acadêmicas e desenvolvimento de software de alto desempenho. Aberto a ideias e colaborações. Vamos conversar!