TDC 2020
Belo Horizonte
O encontro de comunidades e empresas no Brasil

Trilha BigData e NoSql Discutir e compartilhar experiências sobre arquitetura de dados RDBMS e NoSQL

Nos dias de hoje com a infinidade de tecnologias de armazenamento de dados disponíveis, é imprescindível que tenhamos uma arquitetura bem definida para tirarmos melhor proveito de nossas bases de dados.

Utilizar um conceito ou uma classe específica de banco de dados para uma ou outra aplicação dependendo do que ela se trata!

Palestras

Importante: A grade de palestras está sujeita a alterações sem prévio aviso.
Conteúdo
08:00 às 09:00 Credenciamento e recepção dos participantes

Todas as pessoas inscritas, palestrantes, coordenadores e de imprensa, devem retirar seus crachás e kit do congressista nos balcões de credenciamento localizados na entrada do evento, para obterem acesso às salas e Auditório Principal.

09:00 às 10:00 Abertura do evento no Auditório Principal

Após o credenciamento, convidamos os participantes a comparecerem ao auditório para receberem as boas vindas por parte dos realizadores e patrocinadores.

Neste keynote de abertura, todos serão orientados sobre o funcionamento do evento, destaques e outras novidades.

10:10 às 11:00 Trajetória SQL para NoSQL
Dayvidson Santana

Você já imaginou migrar todo seu ambiente SQL para NoSQL ? Nessa palestra irei apresentar minha trajetória de migrações, esforços e aprendizagens com cases de sucesso.

Processamento e Análise de Dados em Tempo Real com Kafka, ElasticSearch e PySpark
Otávio Calaça Xavier / Cícero Moura

Estamos vivendo na era do Big Data. Segundo pesquisas, a cada dois anos dobramos a quantidade de dados que são produzidos nos anos anteriores. Para conseguir analisar essa quantidade de dados, são necessárias ferramentas eficientes de ingestão, mensageria, armazenamento e processamento dos dados. Essa palestra tem como objetivo apresentar ferramentas eficientes para cada uma dessas tarefas: Kafka, Elastic Search e PySpark. Iremos abordar duas arquiteturas de Big Data: Lambda e Kappa. A palestra ainda contará com um hands-on no qual iremos utilizar as ferramentas propostas para ingestão, armazenamento e processamento de tweets em tempo-real.

11:10 às 12:00 A definir
12:10 às 13:00 Elasticsearch em escala: como indexamos milhões de documentos por minuto na In Loco
Rafael Acevedo

Elasticsearch é uma engine de busca largamente utilizada para busca textual, análise de logs e várias outras aplicações. Na In Loco, nossas instâncias recebem, em horários de pico, até 3 milhões de escritas por minuto, indexando os documentos em near real-time e possibilitando a extração de todo seu potencial como motor de busca.

Chegar nesse patamar exigiu estudar mais a fundo como essa ferramenta funciona, para que pudessem ser feitas otimizações como utilização correta de índices, escolha do hardware mais adequado e configurações avançadas de setup no banco. Nessa talk, iremos expor nossa história com o Elasticsearch e como conseguimos tirar proveito dele.

Fugindo do banco relacional para entregar relatórios performáticos no Cloud com Elasticsearch.
Marcel de Souza Borges

No dia a dia do usuário cada segundo é importante, sendo que esperar muito tempo por uma informação é tão ruim quanto não ter essas informações. O objetivo desta palestra será demonstrar como são realizadas consultas e agregações em um alto volume de dados de forma performática com Elasticsearch e quais estudos, comparações e técnicas aplicadas entre os bancos ORACLE, MongoDB, PostgreSQL e Elasticsearch para decidir qual tecnologia deveria ser utilizada neste cenário.

13:10 às 14:00 Intervalo para Almoço
Uma excelente oportunidade de todas as pessoas no evento interagirem e trocarem ideias, colaboradores, empresas patrocinadoras e apoiadoras, palestrantes e coordenadores.
14:10 às 15:00 Gerenciando 1000+ jobs com qualidade e segurança no Hub Digital da Globo
Gláucia Esppenchutz / Lívia de Azevedo da Silva

Vamos explicar durante a palestra como utilizamos o Azkaban para gerenciar mais de 1000 jobs desde 2018 na área de Big Data & AI. Também abordaremos como solucionamos a dificuldade inicial com a verbosidade e complexidade do Azkaban com duas ferramentas open-source criadas pelo time: Auror e Azkaban CLI. O Auror é uma camada que permite escrever jobs e flows Spark e Python para o Azkaban de uma forma simples. O Azkaban CLI é uma interface via linha de comando que utiliza a API do Azkaban para fazer as integrações sem precisar de uma interface gráfica, simplificando até mesmo pipelines de CI e CD.

SQL Server 2019: Big Data Clusters
Santusa Barbosa / Leonardo Fonseca

Trabalhar e analisar grandes volumes de dados já é um desafio vivenciado nas empresas. Venha conhecer a nova feature do SQL Server 2019, que fornece um ambiente completo para Big Data, incluindo ML e IA.

15:10 às 16:00 Abordagem prática para modernizar o seu data warehouse
Lourenço Barrera Taborda

A estratégia para inteligência analítica nas organizações e a evolução dos principais elementos para uma arquitetura de solução de Analytics, Business Intelligence, Data Warehousing e Data Laking são relevantes na modernização e digitalização dos negócios. Uma abordagem prática para a modernização do seu data warehouse é proposta a partir dos serviços mais recentes disponíveis na Oracle Cloud, levando em consideração aspectos ótimos de software, hardware e computação em nuvem. Tudo isso combinado com o uso de inteligência artificial para a operação e manutenção do seu data warehouse com esforço humano reduzido.

16:00 às 16:30 Coffee-break e Networking

Durante o intervalo de coffee-break, serão entregues kits contendo suco e biscoitos. Um delicioso intervalo para relaxar, conhecer novas pessoas e estreitar contatos.

Neste tempo, também surge a oportunidade de todas as pessoas no evento interagirem entre sí, participantes das trilhas, empresas patrocinadoras e apoiadoras, palestrantes e coordenadores.

16:40 às 17:30 Data Lake Multicloud
Luiz Henrique Garetti

Data Lake Multi-Cloud é uma grande realidade nas empresas atualmente, onde são contratados diversos Cloud's Providers. Nesse cenário sistemas começam a nascer em diversos players e como fica o Analytics? Em um mundo onde precisamos coletar informações de n fontes para compor um algorítimo de Machine Learning, qual é a estratégia e arquitetura que podemos adotar? Virtualização de Dados, Gravidade dos Dados e Linhagem dos Dados, são alguns dos tópicos dessa grande conversa.

JSON + Relacional: Como Usar Modelos de Dados Híbridos
Fernando Melo

Veja como utilizar bancos de dados que aproveitam os benefícios do Modelo Relacional, que oferece profundo suporte a SQL, Transações, e Integridade, com os benefícios do modelo NoSQL de Documentos, que oferece a Simplicidade e Flexibilidade do JSON.

17:40 às 18:30 Desafio: A arte de processar 8 milhões de queries simultaneamente em multiplos databases
Henrique Luiz / Ronaldo Andrade Silva

Falaremos dos desafios encontrados e o planejamento para montar uma arquitetura para processar 8 milhões de queries em múltiplos bancos de dados. Mostraremos como saber se o retorno é performático ou não de acordo com o estudo de normalização dos resultados de performance, auxiliando os devs a obter uma melhor experiencia com os insights gerados e assim, agregando valor ao produto.

18:40 às 19:00 Encerramento e Sorteios

No horário de encerramento, todas as trilhas serão direcionadas de suas salas para o Auditório Principal, mesmo local da abertura.

Após a apresentação de resultados do dia, muitos sorteios fecharão o dia.

Data e Local

Quinta-feira, 5 de Novembro de 2020

10 às 19h

Actuall Convention Hotel

Rod. Fernão Dias, 3443 - Jardim Riacho das Pedras
Belo Horizonte - MG

Informações sobre Data e Local


Público Alvo

Analistas, Cientistas, Arquitetos e Engenheiros de Dados, bem como Desenvolvedores


Investimento

presencial:R$ 420,00

Fazendo sua inscrição presencial, você terá acesso a esta trilha e no mesmo dia também:
TDC Expo: Venha conversar com pessoas e conhecer empresas incríveis.
Trilha Stadium: Você poderá assistir às palestras da trilha Stadium do mesmo dia.


Palestrantes da Trilha BigData e NoSql

Cícero Moura
Cícero Moura
Dadosfera
Dayvidson Santana
Dayvidson Santana
Robbyson Systems SA
Santusa Barbosa
Santusa Barbosa
Localiza Hertz

Patrocinadores


Gold


Silver


Apoio


Patrocinios e Apoios Trilha e Workshop




Realização

TDC Online