#TheDevConf 2020 | SÃO PAULO ONLINE : Trilha DATA SCIENCE

Trilha DATA SCIENCE

Data Science: BEHIND THE SCENES

A ciência de dados tem sido a principal forma de responder aos problemas atualmente. Seja nos negócios ou na saúde pública, os seus resultados têm chegado a todos. Afinal de contas, certamente até seus avós já viram algum gráfico representando um modelo preditivo, uma simulação ou um histograma nos últimos meses.

A sua importância só cresce como uma disciplina focada em entender os porquês de um determinado fenômeno estar acontecendo ou em planejar o que vai acontecer com esse fenômeno no futuro. Por isso, está na hora de sairmos dos conceitos e começarmos a compreender como esses sistemas inteligentes e tecnologias de Big Data têm sido construídos.

Em 2020, a Trilha Data Science estará concentrada em apresentar o arcabouço utilizado pelos melhores profissionais da área para analisar, construir e divulgar projetos de ciência de dados. Junte-se a nós para colocarmos a mão na massa com quem aplica de verdade a ciência de dados no Brasil e no mundo hoje.

Data

Quarta-feira, 26 de Agosto de 2020

09h às 19h (somente ao vivo)

Investimento

Como se inscrever

TODAS AS TRILHAS

Programação / Palestras TODAS AS TRILHAS

Hora	Conteúdo
09:00 às 09:30	Abertura do evento e mini keynote No palco da Stadium, todos serão orientados sobre o funcionamento do evento, destaques e outras novidades.
09:30 às 10:20	Keynote \| Surviving and Thriving in the Human Economy Fabiola Eyholzer We all bring unique traits and qualities to our work. The ability to leverage these strengths will be the source for competitiveness and success going forward. However, transitioning from a Knowledge to a Human Economy has profound implications and requires an unequivocal commitment to human potential.
10:25 às 10:40	Abertura da trilha pela coordenação Aqui os coordenadores se apresentam e fazem uma introdução para a trilha.
10:45 às 11:20	Boas práticas de desenvolvimento para Jupyter Notebooks Joel Pinho Lucas Metodologias de Integração Contínua (CI) e de boas práticas de código são bastante difundidas e consolidadas no contexto de desenvolvimento de software. Porém, o uso de Jupyter Notebooks é relativamente recente no ciclo de desenvolvimento de arquiteturas de software mais complexas. Visto que cientistas de dados em sua maioria possuem uma base científica e matemática, implementações com notebooks são particularmente desafiadoras no que tange a qualidade de código, podendo resultar em maior incidência de bugs, maior tempo e esforço gasto com manutenção e correções. Sendo assim, esta apresentação descreve uma coletânea de recomendações envolvendo boas práticas tanto de código, como do uso de Ju
11:25 às 12:00	Process Mining in Healthcare Alex Meincheim A Mineração de Processos (em inglês Process Mining) é uma área de conhecimento dentro da Inteligência Artificial que tem como objetivo descobrir, monitorar e melhorar processos reais, extraindo conhecimento de dados disponíveis em diversos sistemas de informação. Na saúde existem muitas restrições e inúmeras possibilidades de fluxos seguidos pelos pacientes o que dificulta a avaliação destes processos de cuidado. Entender quais são os caminhos mais adequados que representam o melhor custo-efetividade é de extrema importância para melhorar os processos de cuidado e segurança dos pacientes. Nesta palestra será abordado os 4 tipos de Mineração de Processos e sua aplicação prática na Saúde.
12:05 às 12:25	Open Space
12:25 às 13:00	Feature Engineering em Modelos de Machine Learning Jéssica Costa Trabalhar com Machine Learning envolve muitos processos até o resultado final e um dos processos mais custoso e trabalhoso é o de tratamento de dados. Nesse processo de tratamento de dados temos a tarefa de identificar a trabalhar com as features que serão utilizadas de acordo com o modelo preditivo escolhido. Dessa forma essa palestra tem por objetivo ajudar desenvolvedores a identificar features e tratá-las para os mais diversos algoritmos de Machine Learning.
13:00 às 14:00	Intervalo para almoço Intervalo para o almoço e recarregar energias.
14:00 às 14:15	Abertura da trilha pela coordenação Aqui os coordenadores se apresentam e fazem uma introdução para a trilha.
14:15 às 14:50	Como NÃO fazer visualização de dados Luiza Araújo Vieira Você sabia que muitos gráficos que você vê são enganosos? Vamos falar um pouco sobre storytelling com dados, a importância de ser uma pessoa questionadora e a importância da estatística em nossas vidas. Além disso, teremos dicas de estudo e as ferramentas mais usadas. SLIDES
14:55 às 15:30	The Wonderful World of Bio-Inspired Computing Eyal Wirsansky Bio-inspired computing is a family of algorithms that are based on models of biological systems and behaviors. This presentation will explore the wonders of bio-inspired computing methods, and the problems they can help solve, including: Genetic algorithms?imitate the process of natural evolution to find the best solution for a given problem; often used in automated machine learning. Genetic Programming?evolving computer programs to accomplish a specific task. Ant Colony Optimization?mimic the way certain species of ants locate food and prioritize resources. Particle Swarm Optimization?based on the behavior of flocks of birds, where individuals work together towards a common goal.
15:35 às 16:10	Gerenciando Pipeline de Dados com Apache Airflow Jhon Lucas O Apache Airflow é uma ferramenta comumente utilizada por Engenheiros de Dados e também por Cientistas de Dados. A ferramenta permite a implementação e gestão completa de um Pipeline de Dados, algo que é comum no dia a dia de um Engenheiro de Dados. A parte interessante da ferramenta é que todo o Pipeline é desenvolvido utilizando a linguagem Python, que permite a implementação de um Pipeline completamente personalizado, algo que não é possível com ferramentas do tipo Drag and Drop. Durante a talk passaremos pelos conceitos do Airflow e teremos uma parte prática, onde será demonstrado um Pipeline de Dados Completo, desde a aquisição do dado, até o armazenamento em uma fonte de destino.
16:15 às 17:15	Data Science: BEHIND THE SCENES Letícia Ange Pozza / Thaís Falabella Ricaldoni / Fabiola Pereira / Orlando Silva / Leonardo Braulio de Oliveira e Silva Painel Digital desta Trilha
17:25 às 18:15	Keynote \| Building Technical Communities The Wrong Way Jono Bacon In this new keynote from Jono Bacon, a leading community consultant and author, he will share a collection of anti-patterns of what not to do when building technical developer communities. From his experience working with companies including GitHub, Canonical, HackerOne, Mattermost, Digital Asset, and others, Jono will share a series of common and less common mistakes and show attendees how to invert those mistakes to build amazing technical communities. This will be an in-depth session with a lot of content.
18:20 às 18:40	Encerramento Após a apresentação de resultados do dia, no palco da Stadium, muitos sorteios fecharão o dia.