SIP – Sistema Integrado de Processos
Menu: TCCs de Ciência da Computação

Título: PROPOSTA DE CONSTRUÇÃO DE UM DATA LAKEHOUSE DE CÓDIGO ABERTO

Autoria de: Gabriel Marques de Melo

Orientação de: Erick Galani Maziero

Presidente da banca: Erick Galani Maziero

Primeiro membro da banca: Ricardo Terra

Segundo membro da banca: Ramon Gomes Costa

Palavras-chaves: Data Lakehouse, Código Aberto, Engenharia de Dados, Data Lake, Data Warehouse

Data da defesa: 19/11/2021

Semestre letivo da defesa: 2021-1

Data da versão final: 29/11/2021

Data da publicação: 29/11/2021

Referência: Melo, G. M. d. PROPOSTA DE CONSTRUÇÃO DE UM DATA LAKEHOUSE DE CÓDIGO ABERTO. 2021. 79 p. Trabalho de Conclusão de Curso (Graduação em Ciência da Computação Bacharelado)-Universidade Federal de Lavras, Lavras, 2021.

Resumo: A transformação digital tem levado cada vez mais empresas para um contexto de processamento e armazenamento em nuvem (cloud computing). Contudo, para projetos de menores dimensões ou de propósitos didáticos, o custo desses serviços, principalmente os relacionados ao processamento de dados, pode ser maior que o orçamento disponível, ou representar um elevado gasto em projetos que não possuem um retorno financeiro direto. Além disso, pode haver o receio em se armazenar e processar dados sigilosos e pessoais em servidores na nuvem, por motivos de segurança e privacidade. Existem, entretanto, alternativas para esses processamentos em nuvem, como dispositivos de processamento de baixo custo e, até mesmo, computadores pessoais. Ademais, uma abordagem que vem ganhando espaço no mercado nos últimos anos é o conceito de Data Lakehouse, que, em resumo, traz a flexibilidade e baixo custo de armazenamento dos consolidados Data Lakes aliados à consistência das transações ACID dos Data Warehouses. Este trabalho propõe uma arquitetura de Data Lakehouse de código aberto, on premise, e de baixo custo de infraestrutura, para desenvolvimento de projetos de dados com objetivos didáticos ou de iniciativas de escopo reduzido de dados.

URI: sip.prg.ufla.br/publico/trabalhos_conclusao_curso/acessar_tcc_por_curso/
ciencia_da_computacao/20211201620018

URI alternaviva: repositorio.ufla.br/handle/1/54273

Curso: G010 - CIÊNCIA DA COMPUTAÇÃO (BACHARELADO)

Nome da editora: Universidade Federal de Lavras

Sigla da editora: UFLA

País da editora: Brasil

Gênero textual: Trabalho de Conclusão de Curso

Nome da língua do conteúdo: Português

Código da língua do conteúdo: por

Licença de acesso: Acesso aberto

Nome da licença: Licença do Repositório Institucional da Universidade Federal de Lavras

URI da licença: repositorio.ufla.br

Termos da licença: Acesso aos termos da licença em repositorio.ufla.br

Detentores dos direitos autorais: Gabriel Marques de Melo e Universidade Federal de Lavras

Baixar arquivo