SIP – Sistema Integrado de Processos
Menu: TCCs de Ciência da Computação

Título: Avaliação de Ferramentas de Reconhecimento Automático de Fala para Língua Portuguesa

Título alternativo: Evaluation of Automatic Speech Recognition Tools for Portuguese Language

Autoria de: Aline Rodrigues Guimaraes de Oliveira

Orientação de: Luiz Henrique de Campos Merschmann

Presidente da banca: Luiz Henrique de Campos Merschmann

Primeiro membro da banca: Paula Christina Figueira Cardoso

Segundo membro da banca: Erick Galani Maziero

Terceiro membro da banca: -

Quarto membro da banca: -

Palavras-chaves: Processamento de áudio, Análise de dados, Machine learning, Reconhecimento de voz, Inteligência artificial

Data da defesa: 28/04/2022

Semestre letivo da defesa: 2021-2

Data da versão final: 07/05/2022

Data da publicação: 07/05/2022

Referência: Oliveira, A. R. G. d. Avaliação de Ferramentas de Reconhecimento Automático de Fala para Língua Portuguesa. 2022. 43 p. Trabalho de Conclusão de Curso (Graduação em Ciência da Computação Bacharelado)-Universidade Federal de Lavras, Lavras, 2022.

Resumo: Ao longo dos anos, o reconhecimento automático de fala (ASR) tem recebido cada vez mais foco e interesse da indústria e da academia. Consequentemente, as ferramentas com o objetivo de transcrever dados de áudio, em vários idiomas e suas variantes, foram desenvolvidos. Além disso, conjuntos de dados contendo dados de áudio junto com seu texto transcrito são criados para treinar e avaliar os modelos utilizados por essas ferramentas de ASR. Este trabalho tem como objetivo comparar várias ferramentas de ASR em termos de desempenho de precisão, precificação e tempo de execução, para língua portuguesa em diferentes domínios. Além disso, mapeamos o ambiente de dados existente para a língua portuguesa e discutimos métricas para avaliação de ASR.

Abstract: Over the years, automatic speech recognition (ASR) has received increasing attention and interest from industry and academia. Consequently, tools aiming to transcribe audio data, in multiple languages and their variants, have been developed. Furthermore, datasets containing audio data along with their transcribed text are created to train and evaluate the models used by these ASR tools. This work aims to compare multiple ASR tools in terms of accuracy performance, pricing, and execution time, for Portuguese language in different domains. In addition, we map the existing data environment for the Portuguese language and discuss metrics for ASR evaluation.

URI: sip.prg.ufla.br/publico/trabalhos_conclusao_curso/acessar_tcc_por_curso/
ciencia_da_computacao/20212201810549

URI alternaviva: repositorio.ufla.br/handle/1/54915

Curso: G010 - CIÊNCIA DA COMPUTAÇÃO (BACHARELADO)

Nome da editora: Universidade Federal de Lavras

Sigla da editora: UFLA

País da editora: Brasil

Gênero textual: Trabalho de Conclusão de Curso

Nome da língua do conteúdo: Inglês

Código da língua do conteúdo: eng

Licença de acesso: Acesso aberto

Nome da licença: Licença do Repositório Institucional da Universidade Federal de Lavras

URI da licença: repositorio.ufla.br

Termos da licença: Acesso aos termos da licença em repositorio.ufla.br

Detentores dos direitos autorais: Aline Rodrigues Guimaraes de Oliveira e Universidade Federal de Lavras

Baixar arquivo