TDC 2020
Belo Horizonte
O encontro de comunidades e empresas no Brasil

Trilha Data Science O uso de dados para gerar conhecimento e ideias

Esta trilha busca contar histórias a partir de dados (storytelling), bem como mostrar novas tecnologias e linguagens, abrangendo aplicações práticas que fazem uso de data mining, machine learning e/ou matemática/estatística.

Palestras

Importante: A grade de palestras está sujeita a alterações sem prévio aviso.
Conteúdo
08:00 às 09:00 Credenciamento e recepção dos participantes

Todas as pessoas inscritas, palestrantes, coordenadores e de imprensa, devem retirar seus crachás e kit do congressista nos balcões de credenciamento localizados na entrada do evento, para obterem acesso às salas e Auditório Principal.

09:00 às 10:00 Abertura do evento no Auditório Principal

Após o credenciamento, convidamos os participantes a comparecerem ao auditório para receberem as boas vindas por parte dos realizadores e patrocinadores.

Neste keynote de abertura, todos serão orientados sobre o funcionamento do evento, destaques e outras novidades.

10:10 às 11:00 Como se tornar um cientista de dados melhor usando workflow de experimentos de modelos utilizando MLFlow
Daniel Nascimento / Leonardo Rodrigues Lima de Souza Pinto

Sabemos que fazer ciência de dados não é fácil, temos que muitas vezes limpar os dados, várias opções de algoritmos possíveis para o problema que estamos tratando, hiper-parâmetros para otimizar, testes e mais testes e etc - para que com muita sorte tenhamos um algoritmo que possa ir para produção. Foi pensando nisso que surgiu o framework open-source ML Flow. Ele permite com que controlemos o ciclo de vida da tarefa de construção de modelos de Machine Learning. Essa palestra visa demonstrar qual utilização podemos fazer em problemas reais do dia a dia.

11:10 às 12:00 A Matemática das Redes Neurais (com implementação em Python)
André Amaral

Se por um lado existem diversas bibliotecas com implementações prontas de modelos de Aprendizado de Máquina, por outro é importante que sejamos capazes de entender como esses algoritmos funcionam.

Nesse sentido, vamos estudar a Matemática por trás das Redes Neurais Artificiais, detalhando os algoritmos de Forward Propagation e Stochastic Gradient Descent com Backpropagation. Ao final da discussão vamos construir, em Python, a nossa própria rede neural.

Por fim, apesar de essa ser uma palestra introdutória sobre o assunto, é importante que o participante tenha algum conhecimento em Cálculo no $\mathbb{R}^n$.

12:10 às 13:00 O Design da Ciência de Dados: foco no negócio e no usuário
Leonardo Braulio de Oliveira e Silva / Thaís Falabella Ricaldoni

A construção de um produto de dados tem de ser entendida como a construção de qualquer outro produto digital: com foco no negócio e foco no usuário. Nessa palestra demonstraremos como utilizamos como ponto de partida ferramentas de design thinking e UX para a criação de um produto de dados que realmente atenda à pergunta do negócio e que seja de fato utilizado por quem está na ponta. Falamos sobre o processo de pesquisa, entrevista com os usuários, prototipação, teste e, finalmente, sua implementação. Abordaremos o caso ocorrido em uma grande universidade, onde houve o desafio de metrificar a intangibilidade do aprendizado e trazer para a ponta a capacidade de ação com base nos dados.

Machine Learning Interpretability: Um case sobre interpretação de modelos usando o SHAP
Alexandre Ray Silva

Seu modelo possui uma ótima acurácia, mas você não sabe exatamente como explicá-lo para os stakeholders. Afinal, por que o modelo toma determinadas decisões? Este Talk vai mostrar como o SHAP funciona e como essa ferramenta pode ser usada para interpretar os modelos que você desenvolve por meio de um case prático.

13:10 às 14:00 Intervalo para Almoço
Uma excelente oportunidade de todas as pessoas no evento interagirem e trocarem ideias, colaboradores, empresas patrocinadoras e apoiadoras, palestrantes e coordenadores.
14:10 às 15:00 An introduction to the Bayesian paradigm - hyper parameter optimization application
Larissa Sayuri Futino Castro dos Santos / Gabriel Assunção

Bayesian paradigm is being increasingly applied into data modelling. An interesting way to be presented to its concepts and mathematical notation is by studying its application into hyper parameter optimization. As a common issue faced in modelling with supervised approach, it can be time consuming and not effective in defining the set of parameters which best suits the problem. The bayesian paradigm applied to this task can be efficient and save processing time. We will use Gaussian Proccess which can be explored visually, helping defyning the abstract concepts used in bayesian paradigm.

15:10 às 16:00 Evoluindo a Plataforma de Dados do Nubank
André de Lannoy Tavares

No Nubank estamos devolvendo a mais de 20 milhões de clientes o controle sobre seu dinheiro. Isso só é possível porque construímos uma poderosa plataforma de dados, que é utilizada por toda a empresa para automatizar e escalar decisões.

Nessa palestra apresentaremos os principais componentes da plataforma de dados do Nubank: como funciona nossa infraestrutura de microsserviços; como utilizamos spark para democratizar a criação e processamentos de datasets; como decisões de modelos são usadas no ambiente de produção; que ferramentas e processos utilizamos para empoderar os nubankers a tomarem decisões melhores com dados.

16:00 às 16:30 Coffee-break e Networking

Durante o intervalo de coffee-break, serão entregues kits contendo suco e biscoitos. Um delicioso intervalo para relaxar, conhecer novas pessoas e estreitar contatos.

Neste tempo, também surge a oportunidade de todas as pessoas no evento interagirem entre sí, participantes das trilhas, empresas patrocinadoras e apoiadoras, palestrantes e coordenadores.

16:40 às 17:30 Nem web, nem mobile. Que tal programar robôs investidores?
Kaio Valente

Robôs investidores não são os dispositivos de hardware que estamos acostumados a lembrar quando vemos a palavra "Robô". São softwares que automatizam estratégias de investimento na bolsa de valores, baseados em análise gráfica/técnica ou modelos quantitativos. Vou abordar a linguagem de programação MQL5, a ferramenta MetaTrader, conceitos básicos de análise técnica e apresentar um mundo onde nós, desenvolvedores, podemos sair do convencional e desenvolver estratégias de investimentos/especulação no mercado financeiro, seja para day trade ou no médio e longo prazo.

Storytelling e Data Visualization - O diferencial está nos detalhes
Davidson Oliveira

Um dos produtos mais importantes de um projeto de Data Science é a parte da apresentação das análises realizadas. Por isso, abordaremos nesse momento que a aplicação adequada de técnicas de visualização de dados com storytelling direcionado é fundamental para que qualquer pessoa tenha pleno entendimento do tamanho do valor agregado no projeto.

17:40 às 18:30 A definir
18:40 às 19:00 Encerramento e Sorteios

No horário de encerramento, todas as trilhas serão direcionadas de suas salas para o Auditório Principal, mesmo local da abertura.

Após a apresentação de resultados do dia, muitos sorteios fecharão o dia.

Data e Local

Sexta-feira, 6 de Novembro de 2020

10 às 19 h

Actuall Convention Hotel

Rod. Fernão Dias, 3443 - Jardim Riacho das Pedras
Belo Horizonte - MG

Informações sobre Data e Local


Público Alvo

Estudantes, independente do nível de aprendizado, entusiastas e todos os profissionais que se interessam por análises de dados, machine learning e áreas correlacionadas a uso de dados.


Investimento

presencial:R$ 420,00

Fazendo sua inscrição presencial, você terá acesso a esta trilha e no mesmo dia também:
TDC Expo: Venha conversar com pessoas e conhecer empresas incríveis.
Trilha Stadium: Você poderá assistir às palestras da trilha Stadium do mesmo dia.


Palestrantes da Trilha Data Science

Daniel Nascimento
Daniel Nascimento
ThoughtWorks
Davidson Oliveira
Davidson Oliveira
Localiza Hertz
Kaio Valente
Kaio Valente
Consultor

Patrocinadores


Gold


Silver


Apoio


Patrocinios e Apoios Trilha e Workshop




Realização

TDC Online