Atividade
MC03-CD - Algoritmos e Modelos de Programação para Big Data
Tipo de atividade: Minicurso
Carga Horária: 6h
Local do evento: Auditorio A
Objetivo:
O aparecimento de grandes volumes de dados a serem analisados modificou o panorama de sistemas de processamento de dados. Além de sistemas do tipo NoSQL, surgiram frameworks BigData com alta escalabilidade e um modelo de programação que favorece o processamento paralelo e distribuído. Neste curso apresentaremos as principais abordagens para processamento BigData e nos concentraremos nos frameworks existentes. Discutiremos seu Modelo de Programação, Arquitetura e Técnicas de Programação.
Parte teórica
1. Introdução a BigData
2. Modelos de Programação: Map-Reduce, BSP, GraphX e Giraph.
3. Apache Spark e Hadoop HDFS
4. Estruturas de dados para grandes volumes de dados: Kd-tree, Ph-tree, DHTs,Quadtrees,...
5. Particionamento de dados
6. Clusterização: K-Means, DBSCAN,NG-DBSCAN, ...
Parte prática.
Exercício com o framework Apache Spark - Python
Local: LNCC - Laboratório Nacional de Computação Ciêntifica
Endereço: Getúlio Vargas Av., 333, Quitandinha Petrópolis - Rio de Janeiro CEP 25651-075 - Brasil
Telefone: (24) 2233.6004
Participantes:
Tipo Participação | Nome | Instituição |
---|---|---|
Professor | Fabio Andre Machado Porto | Laboratório Nacional de Computação Científica |
Agenda :
Data | Dia Semana | Início | Fim |
---|---|---|---|
18/02/2019 | Segunda | 13:30 | 15:00 |
19/02/2019 | Terça | 13:30 | 15:00 |
20/02/2019 | Quarta | 13:30 | 15:00 |
21/02/2019 | Quinta | 13:30 | 15:00 |