Na Engenharia de Dados, o objetivo é transformar dados brutos em ativos valiosos. Essa trilha é o ponto de encontro para profissionais e entusiastas que desejam explorar as fronteiras desta área. Vamos explorar desde a captura e processamento de dados até a criação de pipelines robustos e eficientes. Descubra as melhores práticas, ferramentas e estratégias que estão moldando o futuro da engenharia de dados.
Se você é um profissional de dados ou aspira a se tornar um, esta trilha é essencial para você. Participe, aprenda com os especialistas da indústria e amplie sua rede de contatos.
A trilha é um evento híbrido, presencial em São Paulo e remoto na sua casa, que tem a duração de um dia inteiro com sete palestras e um painel de discussão.
Quarta-feira, 18 de Setembro de 2024
09h às 19h
ProMagno
Avenida Professora Ida Kolb - 513 /
Jardim das Laranjeiras
São Paulo -
SP
ACESSO PRESENCIAL OU REMOTO COM TRANSMISSÃO ONLINE
Inscrição online
1 trilha:
de R$ 270
por R$ 165
Inscrição online
1 trilha:
de R$ 270
por R$ 245
Inscrição online
1 trilha: R$ 270
Inscrição híbrida (presencial + online)
1 trilha:
de R$ 435
por R$ 275
Inscrição híbrida (presencial + online)
1 trilha:
de R$ 435
por R$ 375
Inscrição híbrida (presencial + online)
1 trilha: R$ 435
Inscrição híbrida (presencial + online)
2 trilhas:
de R$ 780
por R$ 499
*Economize: R$ 284
3 trilhas:
de R$ 1.107
por R$ 699
*Economize: R$ 408
Inscrição híbrida (presencial + online)
2 trilhas:
de R$ 750
por R$ 650
*Economize: R$ 100
3 trilhas:
de R$ 1.125
por R$ 951
*Economize: R$ 174
Inscrição híbrida (presencial + online)
2 trilhas: R$ 750
3 trilhas: R$ 1.050,00
Faça sua inscrição em qualquer trilha Premium presencial e ganhe um workshop Bônus no mesmo dia! Mas não perca tempo pois as vagas são limitadas. Confira a lista completa de workshops aqui.
Confira as trilhas relacionadas:
Programação Stadium: |
---|
08:00 às 08:55 Credenciamento |
09:00 às 10:00 Abertura do evento e mini keynotes |
Programação desta Trilha: |
---|
10:10 às 10:25 Abertura da trilha pela coordenaçãoAqui os coordenadores se apresentam e fazem uma introdução para a trilha. |
10:30 às 11:05 3 bilhões de registros por dia em near real time com Apache DruidIvan FalcãoO Apache Druid é um banco de dados OLAP NoSQL voltado para big data. Em nosso projeto, utilizando diversas ferramentas open source (Nifi, Kafka, Spark e Druid), conseguimos estruturar um fluxo de dados streaming capaz de transformar e enriquecer mais de 3 bilhões de registros por dia. Nesse cenário, realizamos queries analíticas em mais de 16 bilhões de registros em menos de 10 segundos. O objetivo dessa apresentação é apresentar a arquitetura utilizada e os desafios encontrados nesse projeto. |
11:15 às 11:50 Visão 360: Transformando Dados em Estratégias Personalizadas com IA GenerativaErika Nagaminevamos explorar como a engenharia de dados, combinada com a IA generativa, pode criar uma visão completa e integrada do cliente, conhecida como visão 360. Abordaremos as técnicas e ferramentas essenciais para coletar, integrar e analisar dados provenientes de diversas fontes, como sistemas CRM, redes sociais, interações de atendimento ao cliente e comportamento de compra. Abordaremos os desafios comuns na implementação dessa abordagem, como a integração de dados, a garantia da qualidade e da segurança dos dados, e as questões éticas relacionadas ao uso de IA. |
11:55 às 13:20 Intervalo para almoçoUma excelente oportunidade de todas as pessoas no evento interagirem e trocarem ideias, colaboradores, empresas patrocinadoras e apoiadoras, palestrantes e coordenadores. |
13:20 às 13:30 Abertura da trilha pela coordenaçãoAqui os coordenadores se apresentam e fazem uma introdução para a trilha. |
13:30 às 14:05 Uma Abordagem Moderna de Engenharia de Dados com Microsoft FabricWiliam RosaNesta palestra exploraremos como essa plataforma unifica e simplifica o processo de ingestão, processamento, análise e visualização de dados. Discutiremos as vantagens de automação, escalabilidade e integração oferecidas pelo Microsoft Fabric, destacando casos de uso práticos e melhores práticas para maximizar o valor dos dados nas organizações modernas. |
14:10 às 15:10 Engenheira de dados: Inovação e desafios na era com GenIATais Silva / Aline Pavan / Caroline Pereira da Nóbrega / Thayna Carvalho SilvaPainel de Discussão desta Trilha
|
15:15 às 15:45 Networking e Visitação a StandsIntervalo para fazer networking e conhecer os estandes do evento. |
15:50 às 16:25 Engenharia de Dados na Medicina Diagnóstica: Pipelines de Dados com Smart Data Fabric para Excelência ClínicaMarcio Rodrigo PereiraNeste mundo cada vez mais orientado por dados, a capacidade de integrar, analisar e utilizar informações de diversas fontes é essencial, especialmente em setores críticos como a medicina diagnóstica. Exploraremos como construir uma arquitetura de Data Pipeline eficiente e inovadora, utilizando os conceitos de Smart Data Fabric. Utilizando exemplos reais, mostraremos como essas abordagens podem não apenas melhorar a eficiência operacional, mas também conduzir a avanços significativos em diagnósticos e cuidados com a saúde. Descubra como a combinação de engenharia de dados avançada e inovação tecnológica pode transformar a medicina diagnóstica e gerar impacto positivo na vida dos pacientes. |
16:30 às 17:05 Ingestão em Tempo Real com Flink e Iceberg: Transformando Dados em AçõesReinaldo Yoshiaki ItoAo combinar o poder do Flink para leitura e processamento de dados em tempo real com a capacidade do Iceberg de criar bases de dados com características ACID, podemos desenvolver processos de ingestão robustos, de baixa latência e alta eficiência, garantindo uma maior qualidade dos dados armazenados. O objetivo da nossa palestra é demonstrar como isso pode ser alcançado de maneira simples e com custos controlados. |
17:10 às 17:45 DataOps com Databricks Asset BundleSergio PolimanteAcelere o desenvolvimento e deploy de seus projetos de dados com o poder do Databricks Asset Bundle! Nesta palestra prática, demonstraremos como criar, configurar e implantar um projeto de dados completo em diferentes ambientes (dev, QA e prod), aplicando as melhores práticas de DataOps. Aprenda a gerenciar permissões granulares, automatizar deployment de workflows complexos com parâmetros personalizados com job_clusters e permissões personalizadas. Saia com conhecimento para construir pipelines para fazer deploy de pipelines de engenharia de dados de maneira escalável, confiável e eficientes, prontos para produção! |
17:50 às 18:25 Data Quality em fluxos de dados no BigQueryFernando SedrezAprenda a identificar e prevenir problemas de dados, usando boas práticas para garantir a qualidade de forma contínua em seus dados. Nesta palestra, vamos explorar os desafios de qualidade em fluxos de dados no BigQuery, um dos principais desafios para a construção de pipelines de dados confiáveis. Abordaremos as principais causas de dados de baixa qualidade, como dados inconsistentes, incompletos ou inválidos, e como essas falhas podem impactar negativamente a tomada de decisões. |
Programação da Stadium no final do dia: |
---|
18:30 às 18:35 Encerramento da trilhaOs coordenadores fazem um breve encerramento com agradecimentos. |