Um curso completo e direto ao ponto feito para você compreender tudo o que fundamenta a tecnologia Apache Spark, como ela funciona, e quais são as principais formas de uso.
• Sr. Cloud Consultant e Big Data Engineer
• CEO e Fundador da Engenharia de Dados Academy
Aperte o play e veja tudo o que você vai aprender:_
Repositório de Código
Desenhos no Excalidraw
Certificado de Conclusão
20 horas de Conteúdo
01 ano de acesso à gravação
100% Online
Você tem acesso a um cupom de desconto no valor de R$200,00 para iniciar sua jornada com Apache Spark na Engenharia de Dados Academy.
Maximize o seu conhecimento e entendimento sobre Apache Spark com este conteúdo exclusivo!
Descubra como o Apache Spark transforma a maneira de resolver problemas complexos ao permitir o processamento de gigabytes e até terabytes de dados. Veja no desenho uma ilustração da arquitetura robusta do Spark e como sua compreensão pode capacitar você a desvendar e enfrentar desafios de dados complexos de forma eficiente e escalável.
Entenda a dualidade das APIs do Spark, projetadas para abranger tanto desenvolvedores experientes quanto analistas de dados que preferem linguagens como Python e SQL.
No desenho você pode ver como as APIs de alto nível (DataFrames) e de baixo nível (RDDs) do Spark trabalham juntas para fornecer uma plataforma unificada e poderosa, facilitando o desenvolvimento e a execução de projetos analíticos complexos.
Visualize como seu código desenvolvido localmente pode ser escalado para processar terabytes de dados através de plataformas de Spark gerenciadas disponíveis no mercado. Este desenho destaca a facilidade e a eficiência com que o Spark permite a expansão de projetos de dados, garantindo performance e adaptabilidade em ambientes de cloud.
Este desenho demonstra como as modernas aplicações Spark estão adotando o conceito de Data Lakehouse, integrando tecnologias como Delta Lake e Apache Iceberg.
Aprenda sobre o impacto dessas tecnologias no aprimoramento das suas entregas com Spark, transformando o armazenamento de dados em uma ferramenta estratégica para análises avançadas e governança de dados.
Sr. Cloud Consultant e Big Data Engineer CEO e Fundador da Engenharia de Dados Academy
Explore os conceitos fundamentais e as vantagens das arquiteturas de Data Lakehouse, juntamente com uma visão aprofundada sobre a tecnologia Delta Lake e suas aplicações práticas em ambientes de dados modernos.
Mergulhe nas operações distribuídas que são possíveis com a engine do Spark. Aprenda como o Spark otimiza e distribui computação em larga escala, transformando teoria em prática com exemplos de sistemas distribuídos em ação.
Aprenda um dos conceitos vitais de como trabalhar com partições: Esse entendimento irá mudar a forma como você escreve suas pipelines. Nesta sessão você entenderá como a eficácia do processamento é maximizada através dessas técnicas, e como aplicá-las para melhorar significativamente a performance dos seus pipelines de dados.
Veja como iniciar no Spark: aprenda, passo a passo, como configurar o seu ambiente local de desenvolvimento.
Domine as APIs do Spark através de uma imersão em PySpark e Spark SQL, além de integrações com Pandas e Structured Streaming. Esta sessão oferece uma visão detalhada das diferentes interfaces de programação disponíveis, permitindo-lhe escolher a melhor ferramenta para cada tarefa.
Ganhe experiência prática no deployment de aplicações Spark em ambientes de nuvem gerenciados. Esta sessão abrange desde a preparação do seu código até a execução eficiente em clusters gerenciados pelos principais provedores de serviços de nuvem do mercado.
Entenda porque o Spark e Delta Lake são componentes cruciais para o desenvolvimento de seus pipelines assim como a implementação de um Data Lakehouse. Você compreenderá, nesta sessão, o papel crítico do Spark no desenvolvimento de soluções de armazenamento modernas como Data Lakehouses, Delta Lake e Apache Iceberg e aprenderá como estas tecnologias transformam o armazenamento e a gestão de dados em larga escala, proporcionando eficiência e escalabilidade.
Você irá descobrir que dominar os fundamentos e conceitos essenciais sobre sistemas distribuídos é uma das principais chaves para o sucesso do desenvolvimento com Apache Spark.
Veja como utilizar o Apache Spark rotineiramente, integrando teoria e prática sem perder tempo.
Conhecer as melhores práticas, além de aprimorar as suas habilidades com a engine Spark, te ajudarão a criar aplicações robustas e eficientes.
Reduza erros básicos por falta de compreensão de como o Apache Spark opera por debaixo dos panos.
Saiba como desenvolver aplicações de alto volume, capazes de processar milhões de registros, seguindo as melhores práticas do mercado.
Aprenda como maximizar a qualidade de suas entregas integrando o Apache Spark a sistemas de análise de dados, melhorando a eficiência e a eficácia.
Abra novas oportunidades para sua carreira.
Pra você aprender a usar as melhores tecnologias open source e multi-cloud para criar poderosas pipelines modernas.
Nossos métodos comprovados facilitam o entendimento de conceitos complexos e permitem a aplicação prática imediata de suas novas habilidades.
Estude com especialistas que estão na linha de frente do setor, trazendo resultados reais para empresas de ponta.
Revise as aulas e consolide seu aprendizado assistindo aos vídeos quantas vezes precisar, no seu próprio ritmo.
20 horas de conteúdo e hands-on
Ao finalizar o curso, receba um certificado que valorizará tanto o seu currículo quanto o seu perfil profissional.
Luan é Big Data Engineer e Cloud Architect e, há 10 anos, trabalha como Sr. Cloud Consultant na multinacional canadense Pythian, implementando soluções de Big Data e Analytics e desenvolvendo projetos com Apache Spark, Apache Kafka, Apache Airflow e Kubernetes nas principais provedoras de nuvem do mercado: AWS, Azure e GCP.
Com 9 premiações Microsoft MVP em Data Platform e Big Data Specialist em Microsoft Azure, certificado como Microsoft Certified Trainer (MCT), GCP Professional Data Engineer e AWS Solutions Architect Associate, ele também é membro StarTree All-Stars e recentemente recebeu um novo reconhecimento: o Confluent Community Catalyst, de Apache Kafka, tornando-se um dos poucos brasileiros a fazer parte desse seleto grupo.
No dia 19 de março de 2024, Luan se tornou o primeiro brasileiro a receber o reconhecimento "Astronomer Champions Program for Apache Airflow", inspirando cada vez mais o crescimento e desenvolvimento de profissionais de dados em todo o país.
Palestrante frequente em conferências globais, incluindo TechEd, SQL Konferenz, SQL Nexus, TugaIT, DB Tech Showcase, Ignite e SQL Pass Summit, Luan está constantemente se aperfeiçoando e ocupando posições de vanguarda na área de dados.
Em 2021, idealizou e implementou um grande sonho: fundar a maior academia de ensino online para profissionais de dados com conteúdos que acompanham os mercados de Big Data nacional e internacional, TOTALMENTE EM PORTUGUÊS.
Assim nasceu a Engenharia de Dados Academy, que hoje já soma mais de 3 mil alunos.
Logo em seguida, veio a Comunidade de Dados The Plumbers, uma confraria que reúne profissionais da área de dados espalhados pelo mundo e conectados todos os dias trocando experiências e conhecimento em uma comunidade secreta no Slack.
“Vamos construir a maior comunidade da área de dados, não só do Brasil. Vamos reunir todos os profissionais que querem conquistar uma carreira de sucesso, e todas essas pessoas terão as suas carreiras impulsionadas pelo aprendizado que a academia proporciona. Profissionalmente, eu já cheguei aonde muitos querem, e ainda tem mais. Mas, enquanto eu percorro o meu caminho quero ajudar a maioria de pessoas que eu puder a também ter sucesso na área de dados. É por isso que eu ensino Data Analytics com tanta paixão.”
LUAN MORENO
Estamos tão seguros da qualidade do conteúdo entregue que você poderá assistir a tudo, quantas vezes quiser, e acessar todos os materiais complementares. Se, dentro de 7 dias após a compra, você decidir desistir do seu investimento, devolveremos 100% do seu dinheiro na hora e sem pedir explicações.
Você tem acesso a um cupom de desconto no valor de R$200,00 para iniciar sua jornada com Apache Spark na Engenharia de Dados Academy.