Dados relevantes podem vir de qualquer lugar e qualquer aplicação. Esse cenário traz desafios: como analisar todas essas informações de maneira que façam sentido juntas? Como padronizar o formato, sem adicionar complexidade? Como disponibilizar dados em uma arquitetura útil e confiável para atender diferentes públicos e áreas de negócio? Quais ferramentas utilizar?
Entenda as lições aprendidas na construção e governança de datahubs e datalakes desde o modelo de coleta e processamento de grandes volumes, até como garantir a consistência entre eventos e como armazenar as informações para análises exploratórias.
Conteúdo | |
---|---|
08:00 às 09:00 |
Credenciamento e recepção dos participantes
Todas as pessoas inscritas, palestrantes, coordenadores e de imprensa, devem retirar seus crachás e kit do congressista nos balcões de credenciamento localizados na entrada do evento, para obterem acesso às salas e Auditório Principal. |
09:00 às 10:00 |
Abertura do evento no Auditório Principal
Após o credenciamento, convidamos os participantes a comparecerem ao auditório para receberem as boas vindas por parte dos realizadores e patrocinadores. Neste keynote de abertura, todos serão orientados sobre o funcionamento do evento, destaques e outras novidades. |
10:10 às 11:00 |
Passo a Passo para implementar DataOps em seu projeto de Big Data
Eduardo Hahn Cada vez mais participamos de projetos de Big Data onde a complexidade e a diversidade de dados são cada vez maiores. Ter segurança em todas as etapas do projeto até colocar e manter em produção são grandes desafios. Assim, as práticas de DataOps, soma de boas práticas de Agile e DevOps, auxiliam a melhor gerenciar, publicar e sustentar seu Big Data. Nesta palestra vamos conhecer o passo a passo para você implementar DataOps em seus projetos. Mauro Murari Pretendo apresentar uma solução/arquitetura utilizada para receber +200k de eventos por segundo, armazenar em um datalake e disponibilizar os dados em tempo real (Delay de no máximo 3 segundos). Vamos falar de Load balancer, Golang, Kafka, Stream e TimeseriesDB. |
11:10 às 12:00 |
Como Inovar e equilibrar a transformação digital com a LGPD (lei geral de proteção de dados)
Elton Conceição De um lado a proposição de valor para o cliente focada em experiência e personalização, totalmente baseada na análise de dados. Do outro lado as legislações de privacidade que não pretendem inibir a inovação, mas que irão exigir um grau elevado de governança dos responsáveis. Será interessante ver como as organizações irão lidar com a balança Informação X Privacidade. Essa palestra visa elucidar o que é a LGPD e seus impactos nas estratégias digitais atuais. Nilton Kazuyuki Ueda A visualização de dados é um tema tão relevante nos tempos atuais. Pode definir o sucesso ou fraqueza do seu projeto. Muitos projetos perdem horas de desenvolvimento com estruturação de dados, mas no momento de apresentaçao de resultados deixam a desejar. Como mudar isso? |
12:00 às 13:00 |
Intervalo para Almoço
Uma excelente oportunidade de todas as pessoas no evento
interagirem e trocarem ideias, colaboradores, empresas
patrocinadoras e apoiadoras, palestrantes e coordenadores.
|
13:10 às 14:00 |
O que é uma Plataforma Moderna de Dados
Luiz Carrossoni Neto / Claudio Takamiya Vamos abordar e mostrar como as soluções open source desde aquisição, tratamento e análise dos dados estão transformando e democratizando a maneira como as empresas tratam o bem que é considerado mais valioso atualmente nas organizações: Dados.
Além do detalhamento de cada tecnologia vamos mostrar com casos de uso e um case na prática de como essa revolução está acontecendo não só no mundo corporativo mas também em nossas vidas.
|
14:10 às 15:00 |
Data Lakes: da Teoria à Prática
Jorge Gustavo Sandoval Simão Data Lakes podem ser descritos como enormes repositórios dedados que cobrem uma ampla gama de tópicos heterogêneos e domínios de negócios. Tais repositórios precisam ser efetivamente organizados, para que se possa ganhar valor a partir deles; e os mesmos exigem a aplicação de diversas técnicas para extrair informação e conhecimento, impedindo-os assim de tornarem-se um conjunto de dados inutilizáveis (data swamps). A aplicação prática do conceito também é um desafio, dado que criar um Data Lake é uma tarefa que pode se provar desafiadora. Nesta apresentação, é abordada a teoria básica de um Data Lake e os requisitos para realizar sua implementação. Ricardo Martinelli de Oliveira R é uma linguagem muito usada para cálculos estatisticos e também para visualizações de dados. Além disso, o R permite expor essas visualizações como uma aplicação Web e inclusive produzir dashboards completos. Essa palestra irá mostrar uma introdução à criação de um dashboard, bem como mostrar algumas opções para publicar o dashboard na Internet. |
15:00 às 15:30 |
Coffee-break e Networking
Durante o intervalo de coffee-break, serão entregues kits contendo suco e biscoitos. Um delicioso intervalo para relaxar, conhecer novas pessoas e estreitar contatos. Neste tempo, também surge a oportunidade de todas as pessoas no evento interagirem entre sí, participantes das trilhas, empresas patrocinadoras e apoiadoras, palestrantes e coordenadores. |
15:40 às 16:30 |
Como o iFood usa o full text search do PostgreSQL
Lucas Viecelli A Busca Textual tornou-se uma característica importante para muitos tipos de negócios. No iFood isso não é diferente. Um motor de busca completo, deve ter as seguintes características: -- Stemming (entregar resultados baseados na fonética da palavra) -- Ranqueamento / Atribuição de peso -- Suporte a vários idiomas -- Pesquisa Fuzzy para erros de ortografia -- Apoio a acentuação |
16:40 às 17:30 |
Migrações de dados sem downtimes! Truques e lições aprendidas com PostgreSQL na Olist
Jéssica Pauli de Castro Bonson Você tem receio de executar migrações de dados? Tem que rodar elas de madrugada, torcendo para não afetar a performance do sistema? Na Olist tivemos vários problemas em decorrência de migrações em tabelas grandes no PostgreSQL, e também muitos aprendizados de truques de como fazê-las e monitorá-las com segurança. [Are you afraid of executing data migrations? Do you have to execute them late at night, hoping to don't impact the system's performance? At Olist we had several problems due to big migrations in PostgreSQL, and also many learnings on how to better execute and monitor them safely.] Jorge Gustavo Sandoval Simão Com o advento do conceito de Big Data, evoluções naturais propagaram-se a partir deste, sendo uma delas os Data Lakes. Como resultado, embora haja uma certa noção acordada da idéia central, não há uma aceitação de quais componentes ou funcionalidades um Data Lake possui. Da mesma forma que Big Data ou Cloud, o termo tem sido utilizado em diversos contextos com diferentes significados, entretanto, a riqueza das informações contida nesta estrutura pode gerar diversas análises e inferências para segurança pública, permitindo desde deduções e induções a respeito de um indivíduo ou grupo, até o seu mapeamento e suas motivações.
|
17:40 às 18:30 |
Os desafios na construção do Data Lake do Governo do Estado de SC
Fabio Thomaz Construir um Data Lake não é uma tarefa fácil. Fazer isso no Governo de um Estado da Federação deixa o desafio um pouco mais divertido. Nessa palestra veremos o que levou os técnicos do CIASC (empresa de TI do Estado de SC) a construir um Data Lake de Governo utilizando tecnologias do ecossistema Hadoop. Veremos também as dificuldades encontradas no caminho, quais foram os resultados obtidos até aqui e quais as perspectivas para o futuro.
Governança de dados - Criando um pipeline de Qualidade de dados
Tatiana Nascimento Criar um pipeline de qualidade de dados para atender a necessidade de negócio voltado ao analytics e termos assim um data lake e não um data swamp, |
18:40 às 19:00 |
Encerramento e Sorteios
No horário de encerramento, todas as trilhas serão direcionadas de suas salas para o Auditório Principal, mesmo local da abertura. Após a apresentação de resultados do dia, muitos sorteios fecharão o dia. |
Quinta-feira, 25 de Abril de 2019
10 às 19h
Av. Governador Gustavo Richard, 850
Centro | Florianópolis - SC
Analistas, cientistas e arquitetos de dados, CDO, CTO, DBAs, pessoas interessadas em conhecer mais sobre Big Data, desde iniciantes a profissionais experientes.
presencial:R$ 290,00
Fazendo sua inscrição presencial, você terá acesso a esta
trilha e no mesmo dia também:
TDC Expo: Venha conversar com pessoas e conhecer empresas incríveis.
Trilha Carreiras: Você poderá assistir às palestras da trilha Carreiras do mesmo dia.
Trilha Stadium: Você poderá assistir às palestras da trilha Stadium do mesmo dia.