Trilha BigData Do relacional ao NoSQL, da estatística a Machine learning, passando por BigData.

Dados são o elemento que suporta o ""I"" de Tecnologia da Informação.

O objetivo desta trilha é apresentar e discutir o que há de mais relevante e atual no armazenamento, prospecção, recuperação e extração de valor de dados.

Coordenação

Diogo Lucas

Christiano Anderson

Otávio Santana

TODAS AS TRILHAS

Programação / Palestras TODAS AS TRILHAS

Importante: A grade de palestras está sujeita a alterações sem prévio aviso.

	Conteúdo
08:00 às 09:00	Credenciamento e recepção dos participantes Todas as pessoas inscritas, palestrantes, coordenadores e de imprensa, devem retirar seus crachás e kit do congressista nos balcões de credenciamento localizados na entrada do evento, para obterem acesso às salas e Auditório Principal.
09:00 às 10:00	Abertura do evento no Auditório Principal Após o credenciamento, convidamos os participantes a comparecerem ao auditório para receberem as boas vindas por parte dos realizadores e patrocinadores. Neste keynote de abertura, todos serão orientados sobre o funcionamento do evento, destaques e outras novidades.
10:10 às 11:00	NOMS: um novo modelo de banco de dados para o mundo Big Data Gustavo Coelho / Luiz Hermes Svoboda Junior Bancos de dados relacionais e NoSQL oferecem soluções para armazenamento de dados e provêm métodos eficientes de consulta. Muitos recursos foram investidos para otimizar estes aspectos, entretanto você já se questionou que tipo de suporte temos para tratar questões como versionamento e compartilhamento de dados? Para responder esta pergunta, surge o NOMS. O NOMS traz para o mundo de banco de dados conceitos do Git, resultando em um modelo descentralizado, no qual todas as mudanças são preservadas e versionadas. O NOMS promete revolucionar a forma como publicamos e compartilhamos dados da mesma forma que o Git mudou e popularizou a forma como compartilhamos código fonte.
11:10 às 12:00	Stream Processing: uma visão geral Otávio Carvalho remos falar sobre a história e as idéias por trás de Stream Processing, o modelo de processamento utilizado por empresas como Google, LinkedIn, Twitter e Uber para fazer sentido de grandes volumes de dados em alta velocidade. Mostraremos um overview histórico, começando com ferramentas baseadas em bancos de dados relacionais (TelegraphCQ), passando por trabalhos da Google, como o MapReduce, que influenciaram fortemente a área, e finalizaremos com iniciativas atuais como o Storm, Flink, Spark Streaming, Samza, Google Dataflow, Kafka Stream. O objetivo é demonstrar a relevância dessa área para empresas que precisam escalar as suas operações em ambientes de computação em nuvem, demonstrar que as APIs são simples de utilizar e que o modelo de processamento se relaciona e respeita a Filosofia Unix
12:00 às 13:00	Intervalo para Almoço Uma excelente oportunidade de todas as pessoas no evento interagirem e trocarem ideias, colaboradores, empresas patrocinadoras e apoiadoras, palestrantes e coordenadores.
13:10 às 14:00	Do ELK ao Elastic Stack 5.x: O que vem por aí (BIGDATA) Thiago Souza O release 5.x é um marco no histórico de versões dos componentes do Elastic Stack. Nesta palestra vou mostrar as importantes mudanças, bug fixes e melhorias de desempenho do core a api do Elasticsearch e demais componentes do stack. Aprenda também sobre as diferentes estratégias de migração de versão evitando desastres.
14:10 às 15:00	Respostas em tempo real para perguntas complexas com Elasticsearch Waldemar Neto SLIDES Era uma vez o tempo em que perguntas complexas demoravam para serem respondidas, que relatórios demoravam horas para serem gerados, que eram necessárias várias ferramentas para detectar anomalias em dados. Nesta palestra vamos ver que, além de um poderoso full text search, o elasticsearch também possui funcionalidades focadas em análise de dados. Vamos ver como métricas de negócio, acompanhamento de usuários e detecção de anomalias podem ser feitas em tempo real. Criando um Data Lake na OLX utilizando AWS Hudson Santos Como reinventamos nossa arquitetura de dados com um Data Lake escalável utilizando AWS e como integramos essa nova arquitetura com os projetos de B.I e Data Science.
15:00 às 15:30	Coffee-break e Networking Durante o intervalo de Coffee-break, as mesas de alimentação terão disponíveis café, sucos, frutas e biscoitos. Um delicioso intervalo para relaxar, conhecer novas pessoas e estreitar contatos. Neste tempo, também surge a oportunidade de todas as pessoas no evento interagirem entre sí, participantes das trilhas, empresas patrocinadoras e apoiadoras, palestrantes e coordenadores.
15:40 às 16:30	Google BigQuery: Estudo de Caso Globo.com Guilherme Bedin SLIDES Escolher uma plataforma para manter e acessar um volume grande de dados é uma tarefa difícil. É necessário prever quanto irá custar mensalmente, o trabalho necessário para importar os dados e quais serão as ferramentas de acesso aos dados. Para responder esta perguntas realizamos diversos testes e analises baseados nos dados que temos em parquet no Hadoop. Nesta palestra iremos apresentar as perguntas e respostas que usamos para avaliar o uso ou não do BigQuery.
16:40 às 17:30	Orquestrando Hadoop, Cassandra e MongoDB com o Pentaho Big Data Analytics Marcio Junior Vieira SLIDES Será apresentado como os profissionais cientistas de dados podem tirar proveito das ferramentas da Pentaho na analise de grande volume de dados ( Big Data ) armazenados ou gerados através do ecossistemas Hadoop, Cassandra ou MongoDB. O Pentaho Business Analytics fornece suporte nativo para as principais distribuições Hadoop, bancos de dados noSQL e bases de dados analíticas de alta performance para acessar, integrar, visualizar, explorar e prever informações. Descritivo: Administrar o ecossistema Hadoop, Cassanda e MongoDB ou ambos em conjunto tem se tornado um desafio para profissional cientistas de dados, requer ter muitas experiências e conhecimentos de diversas tecnologias. O Pentaho
17:40 às 18:30	Armazenando séries temporais em bases de dados alternativas André Carlucci SLIDES Uma série temporal (time series) é uma coleção de observações feitas sequencialmente ao longo do tempo. Se você está no mercado de IoT, esse tipo de dado será o que você vai armazenar cada vez que ler um sensor: data e valor. Por 10 anos, temos armazenado na Way2 bilhões de medições periódicas em bancos de dados relacionais. Mas projetos cada vez maiores nos forçaram a repensar como trabalhar melhor com tantos dados desta natureza. Nesta palestra, vamos analisar as opções de armazenamento deste tipo de dados e compartilhar nossa evolução em busca de sistemas rápidos e eficientes. Começaremos por maneiras criativas de se usar um banco de dados relacional, depois passaremos por modelos NoSQL
18:40 às 19:00	Encerramento e Sorteios No horário de encerramento, todas as trilhas serão direcionadas de suas salas para o Auditório Principal, mesmo local da abertura. Após a apresentação de resultados do dia muitos sorteios fecharão o dia.

Data e Local

Quinta-feira, 6 de Outubro de 2016

10:00 às 18:30 h

UniRitter

Rua Orfanotrófio, 555
Alto Teresópolis | Porto Alegre - RS

Informações sobre Data e Local

Público Alvo

DBAs, desenvolvedores, gerentes e estrategistas de TI, arquitetos e cientistas de dados.

Investimento

presencial:R$ 200,00

Fazendo sua inscrição (presencial) você terá acesso a esta trilha e também a:
Pavilhão de Stands: Venha conversar com pessoas e conhecer empresas incríveis.
Trilha Stadium: Você poderá assistir às palestras da trilha Stadium, que tem uma seleção de palestras das trilhas de cada dia do evento.