Trilha DataScience Dados, o novo petróleo

Vamos falar sobre dados, informação e conhecimento?

Trocamos milhões de e-mails por dia, milhares de transações bancárias acontecem no mundo a cada segundo, Até 2020 serão criados cerca de 2 megabytes de novas informações por segundo, para cada ser humano do planeta. Se você souber como utilizar os dados que tem em mãos,poderá entender como melhorar um produto, como criar uma estratégia de marketing mais eficiente, como cortar gastos, como produzir mais em menos tempo e assim por diante. Esse é o objetivo dessa trilha, mostrar como podemos utilizar os dados que temos disponíveis para gerar valor e melhorar nossa tomada de decisão. Trocaremos experiências com profissionais que já estão atuando na área e nos contarão sobre o desafio e as alegrias na missão de tirar valor dos dados.

Coordenação

Gabriel Lages

Fernanda Teixeira Dos Santos

TAISE CAMPOS DA ROCHA

Patrocínio Trilha

TODAS AS TRILHAS

Programação / Palestras TODAS AS TRILHAS

Importante: A grade de palestras está sujeita a alterações sem prévio aviso.

	Conteúdo
08:00 às 09:00	Credenciamento e recepção dos participantes Todas as pessoas inscritas, palestrantes, coordenadores e de imprensa, devem retirar seus crachás e kit do congressista nos balcões de credenciamento localizados na entrada do evento, para obterem acesso às salas e Auditório Principal.
09:00 às 10:00	Abertura do evento no Auditório Principal Após o credenciamento, convidamos os participantes a comparecerem ao auditório para receberem as boas vindas por parte dos realizadores e patrocinadores. Neste keynote de abertura, todos serão orientados sobre o funcionamento do evento, destaques e outras novidades.
10:10 às 11:00	Preprocessando e extraindo dados relevantes de textos com tf-idf Igor de Moura Philippini SLIDES Entenda como o tf-idf (term frequencyinverse document frequency), uma simples análise utilizada por grandes players (inclusive o Google!), pode servir para extrair os termos mais relevantes de um texto. Veremos quais os termos que se destacam tanto em um documento, quanto num conjunto de documentos, como você pode utilizar essas informações, e como isso se aplicou no nosso caso de uso ao tratarmos milhares de documentos de um grande cliente na área jurídica. Também será mostrado como esse processamento pode ser utilizado para outras técnicas de Machine Learning, ajudando a facilitar treinamentos e visualização de resultados.
11:10 às 12:00	Desenvolvimento de aplicações web com R Shiny: como escalar produtos de dados de forma rápida e confiável. Gabriel Teotonio SLIDES R é uma linguagem de programação desenvolvida inicialmente para lidar com computação estatística e gráficos. No entanto, ao longo dos anos, muitos recursos e pacotes foram adicionados, oferecendo aos usuários mais ferramentas para criar ambientes inteiros. Um exemplo disso é o pacote Shiny: um framework para construir aplicações web usando o R. As aplicações Shiny são uma forma poderosa e fácil de compartilhar e comunicar sua análise e permitir que as pessoas interajam com ela. Na In Loco, temos uma série de aplicações construídas usando tal framework, tanto para clientes externos quanto internos. Nessa palestra vamos compartilhar os desafios e soluções aplicadas durante o desenvolvimento.
12:10 às 13:00	A saga do Unicórnio: entendo e otimizando um workflow de ciência de dados Nathália Demetrio Responder uma pergunta a partir de dados, fazer a seleção e a leitura das fontes de interesse, tratar e explorar as informações, comunicar insights, ajustar modelos, deploy ... Traduzir a Ciência de Dados em uma sequência lógica de passos é um recurso extremamente útil para ilustrar a essência desta área. Contudo, este tipo de visão não faz jus à complexidade de cada uma das etapas do flow, além de passar uma ideia de linearidade que raramente é vivenciada na prática. Para esclarecer tudo isso, iremos nos aprofundar nos principais momentos que compõem a ciência de dados: descrevendo peculiaridades, dando dicas, e esclarecendo de uma vez por todas quem é esse tão falado Unicórnio dos Dados.
13:10 às 14:00	Intervalo para Almoço Uma excelente oportunidade de todas as pessoas no evento interagirem e trocarem ideias, colaboradores, empresas patrocinadoras e apoiadoras, palestrantes e coordenadores.
14:10 às 15:00	Judge Panderson: Análise de leads com NLP e Detecção de Anomalias Patricia Pampanelli SLIDES Judge Panderson é a solução de processamento e classificação em tempo real das mais de 100.000 mensagens enviadas por dias para os anunciantes dos portais ZAP Imóveis e Vive Real. Nesta palestra vamos apresentar a abordagem de machine learning utilizada para detecção de anomalias com o método _Isolation Forest_. Vamos descrever o pipeline de processamento de mensagens utilizando métodos de _Natural Language Processing (NLP)_. Sem achismo: O que os dados podem nos dizer sobre nosso futebol Gerson Vasconcelos Neto Com a crescente tendência nos negócios em analisar dados e tomar decisões baseadas nessas análises, é importante nos perguntar: será que tomar decisões baseadas em dados são realmente importantes? Se sim, por quê? Vamos trazer a conversa de bar para o mundo dos dados para que possamos ilustrar essa discussão e tirar a prova de algumas das famosas discussões de boteco. Será que a chamada 'geração de ouro' do nosso futebol era melhor que a geração de hoje? Será que jogar em casa é realmente determinante para o time?
15:10 às 16:00	Fklearn - A functional machine learning library Guilherme Peixoto Fklearn is an open source machine learning library that uses functional programming principles to make it easier to solve real problems with Machine Learning. The name is a reference to the widely known scikit-learn library. The fklearn principles are: * Validation should reflect real-life situations. * Production models should match validated models. * Models should be production-ready with few extra steps. * Reproducibility and in-depth analysis of model results should be easy to achieve.
16:00 às 16:30	Coffee-break e Networking Durante o intervalo de coffee-break, serão entregues kits contendo suco e biscoitos. Um delicioso intervalo para relaxar, conhecer novas pessoas e estreitar contatos. Neste tempo, também surge a oportunidade de todas as pessoas no evento interagirem entre sí, participantes das trilhas, empresas patrocinadoras e apoiadoras, palestrantes e coordenadores.
16:40 às 17:30	Empoderando modelos com Feature Engineering Robson Kitano Várias soluções em machine learning, de problemas básicos até os de competições do Kaggle, usam os mesmos algoritmos, mas o que diferencia os melhores resultados são aqueles que fazem o melhor feature engineering! Embora esse tema seja tratado de forma informal, é talvez o processo mais importante para o funcionamento dos algoritmos de machine learning e tem impacto direto na acurácia do seu modelo e no sucesso do seu projeto. Nesta apresentação, serão mostradas algumas técnicas fundamentais de feature engineering para machine learning. Mostraremos também as principais armadilhas e o impacto dessas técnicas aplicados em datasets conhecidos e em alguns cases da PlayKids.
17:40 às 18:30	Criando e fazendo deploy de uma API REST para modelos de aprendizagem de máquina Déborah Mesquita SLIDES O Pipeline do Scikit-learn é um objeto da biblioteca que facilita bastante o processamento de dados, sendo possível tanto treinar quando fazer predições utilizando a mesma Pipeline. Usar os modelos no Jupyter Notebook é uma das tarefas que realizamos durante as análises, mas o objetivo final de muitas soluções é integrar os modelos com alguma aplicação (normalmente aplicações web). Nesta palestra vamos treinar um modelo usando o scikit-learn e usar o Flask para construir uma API REST capaz de disponibilizar o modelo como um serviço web. Visualizando a relação de Orquestras de Frevo pelos milhares de blocos de nosso Carnaval Antonio Aureliano A história de Pernambuco desfila no seu carnaval. Remanescentes nagôs, indígenas, infantes, senhoras cantantes e a mistura intensa de marchas militares e negros capoeiras como estrela maior: o Frevo. O bloco, une famílias e tem no Frevo o seu principal expoente de atração, e em sua base, as Orquestras dos grandes maestros pernambucanos, que giram a região metropolitana para ser a peça fundamental de milhares de agremiações. Nessa apresentação, vamos demostrar através da visualização de dados animados, coletados pelo Mapa do Frevo, a circulação de várias Orquestras de Frevo pelos milhares de blocos de nosso Carnaval.
18:40 às 19:00	Encerramento e Sorteios No horário de encerramento, todas as trilhas serão direcionadas de suas salas para o Auditório Principal, mesmo local da abertura. Após a apresentação de resultados do dia, muitos sorteios fecharão o dia.

Data e Local

Quinta-feira, 10 de Outubro de 2019

10 às 19h

Universidade Católica De Pernambuco - UNICAP

Rua Almeida Cunha (estacionamento dos alunos)
Boa Vista, Recife - PE

Informações sobre Data e Local

Público Alvo

Qualquer pessoa interessada ou que já tenha experiência na área de análise de dados.

Investimento

presencial:R$ 290,00

Fazendo sua inscrição presencial, você terá acesso a esta trilha e no mesmo dia também:
TDC Expo: Venha conversar com pessoas e conhecer empresas incríveis.
Trilha Carreiras: Você poderá assistir às palestras da trilha Carreiras do mesmo dia.
Trilha Stadium: Você poderá assistir às palestras da trilha Stadium do mesmo dia.