TDC SÃO PAULO ONLINE
O encontro de comunidades e empresas no Brasil

Trilha DATA SCIENCE

Data Science: BEHIND THE SCENES

A ciência de dados tem sido a principal forma de responder aos problemas atualmente. Seja nos negócios ou na saúde pública, os seus resultados têm chegado a todos. Afinal de contas, certamente até seus avós já viram algum gráfico representando um modelo preditivo, uma simulação ou um histograma nos últimos meses.

A sua importância só cresce como uma disciplina focada em entender os porquês de um determinado fenômeno estar acontecendo ou em planejar o que vai acontecer com esse fenômeno no futuro. Por isso, está na hora de sairmos dos conceitos e começarmos a compreender como esses sistemas inteligentes e tecnologias de Big Data têm sido construídos.

Em 2020, a Trilha Data Science estará concentrada em apresentar o arcabouço utilizado pelos melhores profissionais da área para analisar, construir e divulgar projetos de ciência de dados. Junte-se a nós para colocarmos a mão na massa com quem aplica de verdade a ciência de dados no Brasil e no mundo hoje.

Data

Quarta-feira, 26 de Agosto de 2020

09h às 19h (somente ao vivo)

Investimento

Tabela de Pacotes de Preços da Fase 1 INSCREVA-SE

Como se inscrever

Palestras

Hora Conteúdo
09:00 às 09:30 Abertura do evento e mini keynote

No palco da Stadium, todos serão orientados sobre o funcionamento do evento, destaques e outras novidades.

09:30 às 10:20 Keynote da manhã

Os keynotes serão apresentados no palco da Stadium.

10:25 às 10:40 Abertura da trilha pela coordenação

Aqui os coordenadores se apresentam e fazem uma introdução para a trilha.

10:45 às 11:20

Boas práticas de desenvolvimento para Jupyter Notebooks

Joel Pinho Lucas

Metodologias de Integração Contínua (CI) e de boas práticas de código são bastante difundidas e consolidadas no contexto de desenvolvimento de software. Porém, o uso de Jupyter Notebooks é relativamente recente no ciclo de desenvolvimento de arquiteturas de software mais complexas. Visto que cientistas de dados em sua maioria possuem uma base científica e matemática, implementações com notebooks são particularmente desafiadoras no que tange a qualidade de código, podendo resultar em maior incidência de bugs, maior tempo e esforço gasto com manutenção e correções. Sendo assim, esta apresentação descreve uma coletânea de recomendações envolvendo boas práticas tanto de código, como do uso de Ju

11:25 às 12:00

Process Mining in Healthcare

Alex Meincheim

A Mineração de Processos (em inglês Process Mining) é uma área de conhecimento dentro da Inteligência Artificial que tem como objetivo descobrir, monitorar e melhorar processos reais, extraindo conhecimento de dados disponíveis em diversos sistemas de informação. Na saúde existem muitas restrições e inúmeras possibilidades de fluxos seguidos pelos pacientes o que dificulta a avaliação destes processos de cuidado. Entender quais são os caminhos mais adequados que representam o melhor custo-efetividade é de extrema importância para melhorar os processos de cuidado e segurança dos pacientes. Nesta palestra será abordado os 4 tipos de Mineração de Processos e sua aplicação prática na Saúde.

12:05 às 12:25 Open Space

12:25 às 13:00

Feature Engineering em Modelos de Machine Learning

Jéssica Costa

Trabalhar com Machine Learning envolve muitos processos até o resultado final e um dos processos mais custoso e trabalhoso é o de tratamento de dados. Nesse processo de tratamento de dados temos a tarefa de identificar a trabalhar com as features que serão utilizadas de acordo com o modelo preditivo escolhido. Dessa forma essa palestra tem por objetivo ajudar desenvolvedores a identificar features e tratá-las para os mais diversos algoritmos de Machine Learning.

13:00 às 13:45 Intervalo para almoço

Intervalo para o almoço e recarregar energias.

13:45 às 14:00 Abertura da tarde e mini keynote

No palco da Stadium, todos serão orientados sobre o funcionamento do evento, destaques e outras novidades.

14:00 às 14:35

The Wonderful World of Bio-Inspired Computing

Eyal Wirsansky

Bio-inspired computing is a family of algorithms that are based on models of biological systems and behaviors. This presentation will explore the wonders of bio-inspired computing methods, and the problems they can help solve, including: Genetic algorithms?imitate the process of natural evolution to find the best solution for a given problem; often used in automated machine learning. Genetic Programming?evolving computer programs to accomplish a specific task. Ant Colony Optimization?mimic the way certain species of ants locate food and prioritize resources. Particle Swarm Optimization?based on the behavior of flocks of birds, where individuals work together towards a common goal.

14:40 às 15:15

Como NÃO fazer visualização de dados

Luiza Araújo Vieira

Você sabia que muitos gráficos que você vê são enganosos? Vamos falar um pouco sobre storytelling com dados, a importância de ser uma pessoa questionadora e a importância da estatística em nossas vidas. Além disso, teremos dicas de estudo e as ferramentas mais usadas.

15:20 às 15:55

Gerenciando Pipeline de Dados com Apache Airflow

Jhon Lucas

O Apache Airflow é uma ferramenta comumente utilizada por Engenheiros de Dados e também por Cientistas de Dados. A ferramenta permite a implementação e gestão completa de um Pipeline de Dados, algo que é comum no dia a dia de um Engenheiro de Dados. A parte interessante da ferramenta é que todo o Pipeline é desenvolvido utilizando a linguagem Python, que permite a implementação de um Pipeline completamente personalizado, algo que não é possível com ferramentas do tipo Drag and Drop. Durante a talk passaremos pelos conceitos do Airflow e teremos uma parte prática, onde será demonstrado um Pipeline de Dados Completo, desde a aquisição do dado, até o armazenamento em uma fonte de destino.

16:00 às 17:00

Data Science: BEHIND THE SCENES

Painel Digital desta Trilha
17:10 às 18:00 Keynote da tarde

Os keynotes serão apresentados no palco da Stadium.

18:05 às 18:25 Encerramento

Após a apresentação de resultados do dia, no palco da Stadium, muitos sorteios fecharão o dia.


Grade sujeita a alterações

Coordenação da Trilha DATA SCIENCE


Patrocinadores

Diamond




Apoio


Realização