EVENTO
SAVIME: A MULTIDIMENSIONAL SYSTEM FOR THE ANALYSIS AND VISUALIZATION OF PREDICTIONS
Tipo de evento: Exame de Qualificação
AS LIMITAÇÕES ATUAIS DOS SISTEMAS DE GERENCIAMENTO DE BANCOS DE DADOS IMPEDEM SUA UTILIZAÇÃO EM DOMÍNIOS CIENTÍFICOS. AO INVÉS DE SGBDS, OS USUÁRIO ADOTAM BIBLIOTECAS, INTERFACES DE E/S E FORMATOS DE ARQUIVO CIENTÍFICOS PARA GERENCIAR SEUS DADOS. ENTRETANTO, ESSAS ALTERNATIVAS NÃO OFERECEM OS MESMOS BENEFÍCIOS QUE OS ENCONTRADOS EM UM SGBD, COMO UM MODELO DE DADOS COM UMA SEMÂNTICA RICA E BEM DEFINIDA, UMA LINGUAGEM DE CONSULTA PARA A ANÁLISE DE DADOS, O ISOLAMENTO ENTRE OS DADOS E AS APLICAÇÕES E TÉCNICAS AUTOMÁTICAS DE OTIMIZAÇÃO DE CONSULTAS. PORTANTO, PROPOMOS NESTE TRABALHO O DESENVOLVIMENTO DE UM SGBD BASEADO EM MATRIZES MULTIDIMENSIONAIS, PROJETADO PARA LIDAR COM DADOS CIENTÍFICOS, SOBRETUDO OS DE SIMULAÇÕES NUMÉRICAS. NESTA PROPOSTA DE EXAME DE QUALIFICAÇÃO, DESCREVEMOS O SISTEMA SAVIME, E MOSTRAMOS COMO SEU MODELO DE DADOS (TARS) PERMITE UMA RÁPIDA INGESTÃO E VISUALIZAÇÃO DOS DADOS, UTILIZANDO COMO MÉTRICA A COMPARAÇÃO COM SISTEMAS DE BANCO DE DADOS QUE ESTÃO NO ESTADO DA ARTE. BIBLIOGRAFIA: [1] J. Ahrens, Increasing scientific data insights about exascale class simulationsunder power and storage constraints, IEEE Computer Graphics and Applica-tions, vol. 35, pp. 811, Mar 2015.[2] I. Alagiannis, R. Borovica, M. Branco, S. Idreos, and A. Ailamaki, Nodb: Effi-cient query execution on raw data files, in Proceedings of the 2012 ACM SIG-MOD International Conference on Management of Data, SIGMOD 12, (NewYork, NY, USA), pp. 241252, ACM, 2012.[3] U. Ayachit, A. Bauer, B. Geveci, P. OLeary, K. Moreland, N. Fabian, andJ. Mauldin, Paraview catalyst: Enabling in situ data analysis and visualiza-tion, in Proceedings of the First Workshop on In Situ Infrastructures for En-abling Extreme-Scale Analysis and Visualization, ISAV2015, (New York, NY,USA), pp. 2529, ACM, 2015.[4] P. Baumann, Management of multidimensional discrete data, The VLDB Jour-nal, vol. 3, pp. 401444, Oct. 1994.[5] P. Baumann, P. Furtado, R. Ritsch, and N. Widmann, The rasdaman approachto multidimensional database management, in Proceedings of the 1997 ACMSymposium on Applied Computing, SAC 97, (New York, NY, USA), pp. 166173, ACM, 1997.[6] S. Blanas, K. Wu, S. Byna, B. Dong, and A. Shoshani, Parallel data analysisdirectly on scientific file formats, in Proceedings of the 2014 ACM SIGMODInternational Conference on Management of Data, SIGMOD 14, (New York,NY, USA), pp. 385396, ACM, 2014.[7] P. A. Boncz, M. Zukowski, and N. Nes, Monetdb/x100: Hyper-pipelining queryexecution, in CIDR, 2005.[8] P. Cudre-Mauroux, H. Kimura, K.-T. Lim, J. Rogers, R. Simakov, E. Soroush,P. Velikhov, D. L. Wang, M. Balazinska, J. Becla, D. DeWitt, B. Heath, D. Maier,S. Madden, J. Patel, M. Stonebraker, and S. Zdonik, A demonstration of scidb:A science-oriented dbms, Proc. VLDB Endow., vol. 2, pp. 15341537, Aug.2009.[9] C. Dym, Principles of Mathematical Modeling. Elsevier Science, 2004.[10] A. T. A. Gomes, W. S. Pereira, F. Valentin, and D. Paredes, On the imple-mentation of a scalable simulator for multiscale hybrid-mixed methods, CoRR,vol. abs/1703.10435, 2017.[11] L. Gosink, J. Shalf, K. Stockinger, K. Wu, and W. Bethel, Hdf5-fastquery: Ac-celerating complex queries on hdf datasets using fast bitmap indices, in Proceed-ings of the 18th International Conference on Scientific and Statistical DatabaseManagement, SSDBM 06, (Washington, DC, USA), pp. 149158, IEEE Com-puter Society, 2006.[12] G. Graefe, Volcano an extensible and parallel query evaluation system,IEEE Trans. on Knowl. and Data Eng., vol. 6, pp. 120135, Feb. 1994.[13] T. H. Group, Hdf5 - the hdf group, 2017. [Online; accessed 01-feb-2018].[14] B. Howe, Gridfields: Model-driven Data Transformation in the Physical Sciences.PhD thesis, Portland, OR, USA, 2007. AAI3255425.[15] Kitware, Vtk - the visualization toolkit, 2018. [Online; accessed 01-feb-2018].[16] A. K. Koliopoulos, P. Yiapanis, F. Tekiner, G. Nenadic, and J. Keane, Towardsautomatic memory tuning for in-memory big data analytics in clusters, in 2016IEEE International Congress on Big Data (BigData Congress), pp. 353356,June 2016.[17] B. S. Lee, L. Chen, and I. yeol Song, I.l.: Modeling and querying scientificsimulation mesh data, tech. rep., International Electrotechnical Commision,1999.[18] J. Lofstead, F. Zheng, S. Klasky, and K. Schwan, Adaptable, metadata rich iomethods for portable high performance io, in Parallel Distributed Processing,2009. IPDPS 2009. IEEE International Symposium on, pp. 110, May 2009.[19] H. Lustosa, N. Lemus, F. Porto, and P. Valduriez, TARS: An Array Model withRich Semantics for Multidimensional Data, in ER FORUM 2017: ConceptualModeling : Research In Progress, (Valencia, Spain), Nov. 2017.[20] H. Lustosa, F. Porto, P. Valduriez, and P. Blanco, Database system support ofsimulation data, Proc. VLDB Endow., vol. 9, pp. 13291340, Sept. 2016.[21] A. P. Marathe and K. Salem, A language for manipulating arrays, in Proceed-ings of the 23rd International Conference on Very Large Data Bases, VLDB 97,(San Francisco, CA, USA), pp. 4655, Morgan Kaufmann Publishers Inc., 1997.[22] A. P. Marathe and K. Salem, Query processing techniques for arrays, in ACMSIGMOD Record, vol. 28, pp. 323334, ACM, 1999.[23] R. A. Oldfield, K. Moreland, N. Fabian, and D. Rogers, Evaluation of methodsto integrate analysis into a large-scale shock shock physics code, in Proceedingsof the 28th ACM International Conference on Supercomputing, ICS 14, (NewYork, NY, USA), pp. 8392, ACM, 2014.[24] OpenMP, Openmp. [Online; accessed 01-feb-2018].[25] Paradigm4, Append data to existing array, 2015. [Online; accessed 01-feb-2018].[26] Paradigm4, Scidb, 2017. [Online; accessed 01-feb-2018].[27] A. Rezaei Mahdiraji, P. Baumann, and G. Berti, Img-complex: graph datamodel for topology of unstructured meshes, in Proceedings of the 22nd ACMinternational conference on Conference on information & knowledge man-agement, CIKM 13, pp. 16191624, 2013.[28] A. Tevanian, R. F. Rashid, M. W. Young, D. B. Golub, M. R. Thompson,W. Bolosky, and R. Sanzi, A unix interface for shared memory and memorymapped files under mach, in In Proceedings of the Summer 1987 USENIX Con-ference, pp. 5367, 1987.[29] Unidata, netcdf, 2017. [Online; accessed 01-feb-2018].[30] V. Vishwanath, M. Hereld, V. Morozov, and M. E. Papka, Topology-awaredata movement and staging for i/o acceleration on blue gene/p supercomputingsystems, in Proceedings of 2011 International Conference for High PerformanceComputing, Networking, Storage and Analysis, SC 11, (New York, NY, USA),pp. 19:119:11, ACM, 2011.
Data Início: 12/03/2019 Hora: 13:00 Data Fim: 12/03/2019 Hora: 17:00
Local: LNCC - Laboratório Nacional de Computação Ciêntifica - Auditorio A
Aluno: Hermano Lourenço Souza Lutosa - LNCC -
Orientador: Fabio André Machado Porto - Laboratório Nacional de Computação Científica - LNCC
Participante Banca Examinadora: Antônio Tadeu Azevedo Gomes - Laboratório Nacional de Computação Científica - LNCC Eduardo Cunha de Almeida - UFPR - UFPR Gilson Antônio Giraldi - Laboratório Nacional de Computação Científica - LNCC Marta Lima de Queirós Mattoso - Universidade Federal do Rio de Janeiro - UFRJ
Suplente Banca Examinadora: Artur Ziviani - Laboratório Nacional de Computação Científica - LNCC