Notícias LNCC
LNCC CONVIDA PARA PALESTRA:
Publicado em: 05/08/2009,00:00
ESTRATÉGIAS DE PARTICIONAMENTO DE DADOS EM SISTEMAS DE LARGA ESCALA (SE NÃO FOR DINÂMICO NÃO TEM SENTIDO!) PALESTRANTE CONVIDADO: Prof. Dr. Alberto Lerner, Doutor pela Ecole Nationale Supérieure de Telecommunications Data: 12 de agosto de 2009 Hora: 14h Local: LNCC - Auditório A Av. Getúlio Vargas, 333 Quitandinha Informações: Assessoria de eventos do LNCC Telefone: 22336101 RESUMO Escalabilidade em sistemas de bancos de dados tem sido obtida através do uso de paralelismo e distribuição. Por exemplo, os sistemas que aparecem no topo dos resultados de benchmarks do TPC (Transaction Processing Council) são invariavelmente compostos de vários nós. Os dados são distribuídos entre estes nós na forma de partições. As consultas, idem, rodam localmente e os resultados são agregados. Esta abordagem quase sempre atinge acelerações lineares. O problema é que este esquema de particionamento muitas vezes é completamente estático. Cada partição é atribuída a um único nó e o conjunto de nós que compõem o sistema permanece inalterado. Tal esquema pode se mostrar muito rígido para uma série de aplicações. Não raro, existe a necessidade de acrescentar novos nós ao sistema, seja com o objetivo de aumentar a capacidade de processamento, ou, para responder a problemas de falhas, caso em que o sistema pode perder nós já existentes. Independentemente do número de nós, de modo a distribuir as partições de maneira balanceada, o sistema deve ser sensível ao seu tamanho e padrão de acesso -- ambos variáveis. Em sistemas recentemente desenvolvidos na indústria, foram propostos esquemas de particionamente que permitem expansão de capacidade incremental, assim como balanceamento de carga adaptativo, ambos em escala jamais vista. Esta palestra apresentará dois destes sistemas: o Dynamo, da Amazon, e o Bigtable, da Google. Falaremos sobre as suas arquiteturas e sobre os principais algoritmos utilizados na solução dos problemas de sistemas distribuídos que estes invariavelmente encontraram no seu caminho. CURRÍCULO ABREVIADO Alberto Lerner foi, até recentemente, um engenheiro de sistemas na Google, trabalhando na divisão de infra-estrutura de software, por exemplo, no sistema Bigtable. Ao longo de sua passagem pela Google, ele participou no desenho e implementação de algoritmos distribuídos para vários sistemas críticos de larga escala -- e descobriu pessoalmente a alegria de ter que depurar "race conditions" nestes sistemas... Ele obteve o seu mestrado pela PUC-Rio em 1998, e seu doutorado pela Ecole Nationale Supérieure de Telecommunications em 2003, tendo visitado o INRIA de Roquencourt e a New York University frequentemente ao longo deste período. Alberto entrou para a divisão de pesquisa da IBM como pós doutorando logo após, inicialmente em T.J. Watson e depois em Almaden. Lá, ele trabalhou em otimização de consultas relacionais e em sistemas de processamento de fluxos de dados "streaming systems"). Notícias relacionadas: Jornal da Ciência, nº 3822, de 07 de agosto de 2009- LNCC promove palestra sobre escalabilidade em sistemas de banco de dados . Assessoria de Comunicação LNCC Laboratório Nacional de Computação Científica 24 2233 6039 imprensa@lncc.br