TDC 2019
Florianópolis
O encontro de comunidades e empresas no Brasil

Trilha BigData A nova fonte de poder não é o dinheiro na mão de poucos, mas informação na mão de muitos!

Dados relevantes podem vir de qualquer lugar e qualquer aplicação. Esse cenário traz desafios: como analisar todas essas informações de maneira que façam sentido juntas? Como padronizar o formato, sem adicionar complexidade? Como disponibilizar dados em uma arquitetura útil e confiável para atender diferentes públicos e áreas de negócio? Quais ferramentas utilizar?

Entenda as lições aprendidas na construção e governança de datahubs e datalakes desde o modelo de coleta e processamento de grandes volumes, até como garantir a consistência entre eventos e como armazenar as informações para análises exploratórias.

Palestras

Importante: A grade de palestras está sujeita a alterações sem prévio aviso.
Conteúdo
08:00 às 09:00 Credenciamento e recepção dos participantes

Todas as pessoas inscritas, palestrantes, coordenadores e de imprensa, devem retirar seus crachás e kit do congressista nos balcões de credenciamento localizados na entrada do evento, para obterem acesso às salas e Auditório Principal.

09:00 às 10:00 Abertura do evento no Auditório Principal

Após o credenciamento, convidamos os participantes a comparecerem ao auditório para receberem as boas vindas por parte dos realizadores e patrocinadores.

Neste keynote de abertura, todos serão orientados sobre o funcionamento do evento, destaques e outras novidades.

10:10 às 11:00 Passo a Passo para implementar DataOps em seu projeto de Big Data
Eduardo Hahn

Cada vez mais participamos de projetos de Big Data onde a complexidade e a diversidade de dados são cada vez maiores. Ter segurança em todas as etapas do projeto até colocar e manter em produção são grandes desafios. Assim, as práticas de DataOps, soma de boas práticas de Agile e DevOps, auxiliam a melhor gerenciar, publicar e sustentar seu Big Data. Nesta palestra vamos conhecer o passo a passo para você implementar DataOps em seus projetos.

Timeseries - Pipeline para ingestão de eventos em tempo real na Globo.com
Mauro Murari

Pretendo apresentar uma solução/arquitetura utilizada para receber +200k de eventos por segundo, armazenar em um datalake e disponibilizar os dados em tempo real (Delay de no máximo 3 segundos). Vamos falar de Load balancer, Golang, Kafka, Stream e TimeseriesDB.

11:10 às 12:00 Como Inovar e equilibrar a transformação digital com a LGPD (lei geral de proteção de dados)
Elton Conceição

De um lado a proposição de valor para o cliente focada em experiência e personalização, totalmente baseada na análise de dados. Do outro lado as legislações de privacidade que não pretendem inibir a inovação, mas que irão exigir um grau elevado de governança dos responsáveis. Será interessante ver como as organizações irão lidar com a balança Informação X Privacidade. Essa palestra visa elucidar o que é a LGPD e seus impactos nas estratégias digitais atuais.

Visualização de Dados na Era do Big Data
Nilton Kazuyuki Ueda

A visualização de dados é um tema tão relevante nos tempos atuais. Pode definir o sucesso ou fraqueza do seu projeto. Muitos projetos perdem horas de desenvolvimento com estruturação de dados, mas no momento de apresentaçao de resultados deixam a desejar. Como mudar isso?

12:00 às 13:00 Intervalo para Almoço
Uma excelente oportunidade de todas as pessoas no evento interagirem e trocarem ideias, colaboradores, empresas patrocinadoras e apoiadoras, palestrantes e coordenadores.
13:10 às 14:00 O que é uma Plataforma Moderna de Dados
Luiz Carrossoni Neto / Claudio Takamiya
Vamos abordar e mostrar como as soluções open source desde aquisição, tratamento e análise dos dados estão transformando e democratizando a maneira como as empresas tratam o bem que é considerado mais valioso atualmente nas organizações: Dados. Além do detalhamento de cada tecnologia vamos mostrar com casos de uso e um case na prática de como essa revolução está acontecendo não só no mundo corporativo mas também em nossas vidas.
14:10 às 15:00 Data Lakes: da Teoria à Prática
Jorge Gustavo Sandoval Simão

Data Lakes podem ser descritos como enormes repositórios dedados que cobrem uma ampla gama de tópicos heterogêneos e domínios de negócios. Tais repositórios precisam ser efetivamente organizados, para que se possa ganhar valor a partir deles; e os mesmos exigem a aplicação de diversas técnicas para extrair informação e conhecimento, impedindo-os assim de tornarem-se um conjunto de dados inutilizáveis (data swamps). A aplicação prática do conceito também é um desafio, dado que criar um Data Lake é uma tarefa que pode se provar desafiadora. Nesta apresentação, é abordada a teoria básica de um Data Lake e os requisitos para realizar sua implementação.

Dashboards Web com R
Ricardo Martinelli de Oliveira

R é uma linguagem muito usada para cálculos estatisticos e também para visualizações de dados. Além disso, o R permite expor essas visualizações como uma aplicação Web e inclusive produzir dashboards completos. Essa palestra irá mostrar uma introdução à criação de um dashboard, bem como mostrar algumas opções para publicar o dashboard na Internet.

15:00 às 15:30 Coffee-break e Networking

Durante o intervalo de coffee-break, serão entregues kits contendo suco e biscoitos. Um delicioso intervalo para relaxar, conhecer novas pessoas e estreitar contatos.

Neste tempo, também surge a oportunidade de todas as pessoas no evento interagirem entre sí, participantes das trilhas, empresas patrocinadoras e apoiadoras, palestrantes e coordenadores.

15:40 às 16:30 Como o iFood usa o full text search do PostgreSQL
Lucas Viecelli

A Busca Textual tornou-se uma característica importante para muitos tipos de negócios. No iFood isso não é diferente.

Um motor de busca completo, deve ter as seguintes características:

-- Stemming (entregar resultados baseados na fonética da palavra) -- Ranqueamento / Atribuição de peso -- Suporte a vários idiomas -- Pesquisa Fuzzy para erros de ortografia -- Apoio a acentuação

16:40 às 17:30 Migrações de dados sem downtimes! Truques e lições aprendidas com PostgreSQL na Olist
Jéssica Pauli de Castro Bonson

Você tem receio de executar migrações de dados? Tem que rodar elas de madrugada, torcendo para não afetar a performance do sistema? Na Olist tivemos vários problemas em decorrência de migrações em tabelas grandes no PostgreSQL, e também muitos aprendizados de truques de como fazê-las e monitorá-las com segurança.

[Are you afraid of executing data migrations? Do you have to execute them late at night, hoping to don't impact the system's performance? At Olist we had several problems due to big migrations in PostgreSQL, and also many learnings on how to better execute and monitor them safely.]

Data Lakes e a sua Utilização na Segurança Pública
Jorge Gustavo Sandoval Simão
Com o advento do conceito de Big Data, evoluções naturais propagaram-se a partir deste, sendo uma delas os Data Lakes. Como resultado, embora haja uma certa noção acordada da idéia central, não há uma aceitação de quais componentes ou funcionalidades um Data Lake possui. Da mesma forma que Big Data ou Cloud, o termo tem sido utilizado em diversos contextos com diferentes significados, entretanto, a riqueza das informações contida nesta estrutura pode gerar diversas análises e inferências para segurança pública, permitindo desde deduções e induções a respeito de um indivíduo ou grupo, até o seu mapeamento e suas motivações.
17:40 às 18:30 Os desafios na construção do Data Lake do Governo do Estado de SC
Fabio Thomaz
Construir um Data Lake não é uma tarefa fácil. Fazer isso no Governo de um Estado da Federação deixa o desafio um pouco mais divertido. Nessa palestra veremos o que levou os técnicos do CIASC (empresa de TI do Estado de SC) a construir um Data Lake de Governo utilizando tecnologias do ecossistema Hadoop. Veremos também as dificuldades encontradas no caminho, quais foram os resultados obtidos até aqui e quais as perspectivas para o futuro.
Governança de dados - Criando um pipeline de Qualidade de dados
Tatiana Nascimento

Criar um pipeline de qualidade de dados para atender a necessidade de negócio voltado ao analytics e termos assim um data lake e não um data swamp,

18:40 às 19:00 Encerramento e Sorteios

No horário de encerramento, todas as trilhas serão direcionadas de suas salas para o Auditório Principal, mesmo local da abertura.

Após a apresentação de resultados do dia, muitos sorteios fecharão o dia.

Data e Local

Quinta-feira, 25 de Abril de 2019

10 às 19h

CentroSul

Av. Governador Gustavo Richard, 850
Centro | Florianópolis - SC

Informações sobre Data e Local


Público Alvo

Analistas, cientistas e arquitetos de dados, CDO, CTO, DBAs, pessoas interessadas em conhecer mais sobre Big Data, desde iniciantes a profissionais experientes.


Investimento

presencial:R$ 290,00

Fazendo sua inscrição presencial, você terá acesso a esta trilha e no mesmo dia também:
TDC Expo: Venha conversar com pessoas e conhecer empresas incríveis.
Trilha Carreiras: Você poderá assistir às palestras da trilha Carreiras do mesmo dia.
Trilha Stadium: Você poderá assistir às palestras da trilha Stadium do mesmo dia.


Palestrantes desta trilha

Eduardo Hahn
Eduardo Hahn
DataLakers Tecnologia
Mauro Murari
Mauro Murari
Software Engineer

Patrocinadores

Diamond





Patrocinios e Apoios Trilha e Workshop


Programa +Diversidade

TDCOnline


Realização

Internet