EVENTO
SAVIME: A MULTIDIMENSIONAL SYSTEM FOR THE ANALYSIS AND VISUALIZATION OF PREDICTIONS
Tipo de evento:
Exame de Qualificação
AS LIMITAÇÕES ATUAIS DOS SISTEMAS DE GERENCIAMENTO DE BANCOS DE DADOS IMPEDEM SUA UTILIZAÇÃO EM DOMÍNIOS CIENTÍFICOS. AO INVÉS DE SGBDS, OS USUÁRIO ADOTAM BIBLIOTECAS, INTERFACES DE E/S E FORMATOS DE ARQUIVO CIENTÍFICOS PARA GERENCIAR SEUS DADOS. ENTRETANTO, ESSAS ALTERNATIVAS NÃO OFERECEM OS MESMOS BENEFÍCIOS QUE OS ENCONTRADOS EM UM SGBD, COMO UM MODELO DE DADOS COM UMA SEMÂNTICA RICA E BEM DEFINIDA, UMA LINGUAGEM DE CONSULTA PARA A ANÁLISE DE DADOS, O ISOLAMENTO ENTRE OS DADOS E AS APLICAÇÕES E TÉCNICAS AUTOMÁTICAS DE OTIMIZAÇÃO DE CONSULTAS. PORTANTO, PROPOMOS NESTE TRABALHO O DESENVOLVIMENTO DE UM SGBD BASEADO EM MATRIZES MULTIDIMENSIONAIS, PROJETADO PARA LIDAR COM DADOS CIENTÍFICOS, SOBRETUDO OS DE SIMULAÇÕES NUMÉRICAS. NESTA PROPOSTA DE EXAME DE QUALIFICAÇÃO, DESCREVEMOS O SISTEMA SAVIME, E MOSTRAMOS COMO SEU MODELO DE DADOS (TARS) PERMITE UMA RÁPIDA INGESTÃO E VISUALIZAÇÃO DOS DADOS, UTILIZANDO COMO MÉTRICA A COMPARAÇÃO COM SISTEMAS DE BANCO DE DADOS QUE ESTÃO NO ESTADO DA ARTE.
BIBLIOGRAFIA:
[1] J. Ahrens, Increasing scientific data insights about exascale class simulations
under power and storage constraints, IEEE Computer Graphics and Applica-
tions, vol. 35, pp. 811, Mar 2015.
[2] I. Alagiannis, R. Borovica, M. Branco, S. Idreos, and A. Ailamaki, Nodb: Effi-
cient query execution on raw data files, in Proceedings of the 2012 ACM SIG-
MOD International Conference on Management of Data, SIGMOD 12, (New
York, NY, USA), pp. 241252, ACM, 2012.
[3] U. Ayachit, A. Bauer, B. Geveci, P. OLeary, K. Moreland, N. Fabian, and
J. Mauldin, Paraview catalyst: Enabling in situ data analysis and visualiza-
tion, in Proceedings of the First Workshop on In Situ Infrastructures for En-
abling Extreme-Scale Analysis and Visualization, ISAV2015, (New York, NY,
USA), pp. 2529, ACM, 2015.
[4] P. Baumann, Management of multidimensional discrete data, The VLDB Jour-
nal, vol. 3, pp. 401444, Oct. 1994.
[5] P. Baumann, P. Furtado, R. Ritsch, and N. Widmann, The rasdaman approach
to multidimensional database management, in Proceedings of the 1997 ACM
Symposium on Applied Computing, SAC 97, (New York, NY, USA), pp. 166
173, ACM, 1997.
[6] S. Blanas, K. Wu, S. Byna, B. Dong, and A. Shoshani, Parallel data analysis
directly on scientific file formats, in Proceedings of the 2014 ACM SIGMOD
International Conference on Management of Data, SIGMOD 14, (New York,
NY, USA), pp. 385396, ACM, 2014.
[7] P. A. Boncz, M. Zukowski, and N. Nes, Monetdb/x100: Hyper-pipelining query
execution, in CIDR, 2005.
[8] P. Cudre-Mauroux, H. Kimura, K.-T. Lim, J. Rogers, R. Simakov, E. Soroush,
P. Velikhov, D. L. Wang, M. Balazinska, J. Becla, D. DeWitt, B. Heath, D. Maier,
S. Madden, J. Patel, M. Stonebraker, and S. Zdonik, A demonstration of scidb:
A science-oriented dbms, Proc. VLDB Endow., vol. 2, pp. 15341537, Aug.
2009.
[9] C. Dym, Principles of Mathematical Modeling. Elsevier Science, 2004.
[10] A. T. A. Gomes, W. S. Pereira, F. Valentin, and D. Paredes, On the imple-
mentation of a scalable simulator for multiscale hybrid-mixed methods, CoRR,
vol. abs/1703.10435, 2017.
[11] L. Gosink, J. Shalf, K. Stockinger, K. Wu, and W. Bethel, Hdf5-fastquery: Ac-
celerating complex queries on hdf datasets using fast bitmap indices, in Proceed-
ings of the 18th International Conference on Scientific and Statistical Database
Management, SSDBM 06, (Washington, DC, USA), pp. 149158, IEEE Com-
puter Society, 2006.
[12] G. Graefe, Volcano an extensible and parallel query evaluation system,
IEEE Trans. on Knowl. and Data Eng., vol. 6, pp. 120135, Feb. 1994.
[13] T. H. Group, Hdf5 - the hdf group, 2017. [Online; accessed 01-feb-2018].
[14] B. Howe, Gridfields: Model-driven Data Transformation in the Physical Sciences.
PhD thesis, Portland, OR, USA, 2007. AAI3255425.
[15] Kitware, Vtk - the visualization toolkit, 2018. [Online; accessed 01-feb-2018].
[16] A. K. Koliopoulos, P. Yiapanis, F. Tekiner, G. Nenadic, and J. Keane, Towards
automatic memory tuning for in-memory big data analytics in clusters, in 2016
IEEE International Congress on Big Data (BigData Congress), pp. 353356,
June 2016.
[17] B. S. Lee, L. Chen, and I. yeol Song, I.l.: Modeling and querying scientific
simulation mesh data, tech. rep., International Electrotechnical Commision,
1999.
[18] J. Lofstead, F. Zheng, S. Klasky, and K. Schwan, Adaptable, metadata rich io
methods for portable high performance io, in Parallel Distributed Processing,
2009. IPDPS 2009. IEEE International Symposium on, pp. 110, May 2009.
[19] H. Lustosa, N. Lemus, F. Porto, and P. Valduriez, TARS: An Array Model with
Rich Semantics for Multidimensional Data, in ER FORUM 2017: Conceptual
Modeling : Research In Progress, (Valencia, Spain), Nov. 2017.
[20] H. Lustosa, F. Porto, P. Valduriez, and P. Blanco, Database system support of
simulation data, Proc. VLDB Endow., vol. 9, pp. 13291340, Sept. 2016.
[21] A. P. Marathe and K. Salem, A language for manipulating arrays, in Proceed-
ings of the 23rd International Conference on Very Large Data Bases, VLDB 97,
(San Francisco, CA, USA), pp. 4655, Morgan Kaufmann Publishers Inc., 1997.
[22] A. P. Marathe and K. Salem, Query processing techniques for arrays, in ACM
SIGMOD Record, vol. 28, pp. 323334, ACM, 1999.
[23] R. A. Oldfield, K. Moreland, N. Fabian, and D. Rogers, Evaluation of methods
to integrate analysis into a large-scale shock shock physics code, in Proceedings
of the 28th ACM International Conference on Supercomputing, ICS 14, (New
York, NY, USA), pp. 8392, ACM, 2014.
[24] OpenMP, Openmp. [Online; accessed 01-feb-2018].
[25] Paradigm4, Append data to existing array, 2015. [Online; accessed 01-feb-
2018].
[26] Paradigm4, Scidb, 2017. [Online; accessed 01-feb-2018].
[27] A. Rezaei Mahdiraji, P. Baumann, and G. Berti, Img-complex: graph data
model for topology of unstructured meshes, in Proceedings of the 22nd ACM
international conference on Conference on information & knowledge man-
agement, CIKM 13, pp. 16191624, 2013.
[28] A. Tevanian, R. F. Rashid, M. W. Young, D. B. Golub, M. R. Thompson,
W. Bolosky, and R. Sanzi, A unix interface for shared memory and memory
mapped files under mach, in In Proceedings of the Summer 1987 USENIX Con-
ference, pp. 5367, 1987.
[29] Unidata, netcdf, 2017. [Online; accessed 01-feb-2018].
[30] V. Vishwanath, M. Hereld, V. Morozov, and M. E. Papka, Topology-aware
data movement and staging for i/o acceleration on blue gene/p supercomputing
systems, in Proceedings of 2011 International Conference for High Performance
Computing, Networking, Storage and Analysis, SC 11, (New York, NY, USA),
pp. 19:119:11, ACM, 2011.
Data Início: 12/03/2019
Hora: 13:00
Data Fim: 12/03/2019
Hora: 17:00
Local: LNCC - Laboratório Nacional de Computação Ciêntifica - Auditorio A
Aluno:
Hermano Lourenço Souza Lutosa - LNCC -
Orientador:
Fabio André Machado Porto - Laboratório Nacional de Computação Científica - LNCC
Participante Banca Examinadora:
Antônio Tadeu Azevedo Gomes - Laboratório Nacional de Computação Científica - LNCC
Eduardo Cunha de Almeida - UFPR - UFPR
Gilson Antônio Giraldi - Laboratório Nacional de Computação Científica - LNCC
Marta Lima de Queirós Mattoso - Universidade Federal do Rio de Janeiro - UFRJ
Suplente Banca Examinadora:
Artur Ziviani - Laboratório Nacional de Computação Científica - LNCC