SIP – Sistema Integrado de Processos
Menu: TCCs de Ciência da Computação

Título: Módulo de Interpretação Textual para Reconhecimento de Intenções em Linguagem Natural.

Título alternativo: Textual Interpretation Module for Intention Recognition in Natural Language.

Autoria de: Guilherme Henrique Emilioreli Giarola

Orientação de: Erick Galani Maziero

Presidente da banca: Erick Galani Maziero

Primeiro membro da banca: Luiz Henrique de Campos Merschmann

Segundo membro da banca: Paula Christina Figueira Cardoso

Palavras-chaves: Processamento de Linguagem Natural, Inteligência Artificial, Aprendizado de Máquina, Córpus de Frases, Reconhecimento de Intenções.

Data da defesa: 10/05/2021

Semestre letivo da defesa: 2020-2

Data da versão final: 23/06/2021

Data da publicação: 23/06/2021

Referência: Giarola, G. H. E. Módulo de Interpretação Textual para Reconhecimento de Intenções em Linguagem Natural.. 2021. 70 p. Trabalho de Conclusão de Curso (Graduação em Ciência da Computação Bacharelado)-Universidade Federal de Lavras, Lavras, 2021.

Resumo: Dispositivos e sistemas inteligentes têm se popularizado, principalmente pela capacidade de interação através da linguagem natural, como o Português. Entendera intenção de um usuário a partir de sua fala não é uma tarefa trivial e envolve um conjunto de técnicas que permitem a uma máquina capturar a fala de um usuário, convertê-la em texto e extrair a intenção do usuário. No contexto de uma casa inteligente, diversas funcionalidades estão à disposição dos moradores e, amaneira mais natural e intuitiva de interação é a linguagem natural. Nesse trabalho propõe-se a exploração de técnicas do Processamento de Linguagem Natural(PLN) e Inteligência Artificial (IA) para a geração de um módulo de interpretação textual para mapear a frase gerada por um usuário (e identificar sua intenção)a uma funcionalidade de uma casa. Para tanto, objetiva-se o uso das técnicas já conhecidas de machine learning Logistic Regression, Support Vector Machines,K-Nearest Neighbors, Decision Trees e Gradient Boosting e a utilização, também, de duas técnicas para extração de atributos, (TF-IDF e Word2Vec) de forma a gerar o módulo de interpretação textual. De forma a treinar estes modelos citados, foi tomado por base um córpus de frases em linguagem natural, as quais foram anotadas juntamente às intenções esperadas. Os dados levantados não foram suficientes para a inferência de um resultado definitivo. Entretanto, os relatórios de classificação gerados e os testes de validação estatística são capazes de orientar e auxiliar futuros projetos.

Abstract: Smart devices and systems have become more popular, mainly due to the ability to interact through natural language, such as Portuguese. Understanding a user????s intention by his speech isn????t a trivial task and involves many techniques that allow a machine to capture a user????s speech, convert it into text and extract the user????s intention. In the context of a smart house, several features are available to it????s residents and the most natural and intuitive way of interaction is by natural language. In this work, it????s proposed to explore Natural Language Processing(NLP) and Artificial Intelligence (AI) techniques to generate a textual interpretation module that maps a user-generated phrase (and identify it????s intention) to a smart house????s functionality. For this reason, the main objective is to use already known techniques of machine learning Logistic Regression, Support Vector Ma-chines, K-Nearest Neighbors, Decision Trees and Gradient Boosting and also the usage of two attribute extraction techniques, (TF-IDF and Word2Vec) in order to generate the textual interpretation module. In order to train these models, it was used a corpus of phrases in natural language, which were annotated along with the expected intentions. The data collected wasn????t sufficient for inferring a definitive result. However, the generated classification reports and the statistic validation tests are capable of orientating and helping future projects.

URI: sip.prg.ufla.br/publico/trabalhos_conclusao_curso/acessar_tcc_por_curso/
ciencia_da_computacao/20202201720075

URI alternaviva: repositorio.ufla.br/handle/1/47494

Curso: G010 - CIÊNCIA DA COMPUTAÇÃO (BACHARELADO)

Nome da editora: Universidade Federal de Lavras

Sigla da editora: UFLA

País da editora: Brasil

Gênero textual: Trabalho de Conclusão de Curso

Nome da língua do conteúdo: Português

Código da língua do conteúdo: por

Licença de acesso: Acesso aberto

Nome da licença: Licença do Repositório Institucional da Universidade Federal de Lavras

URI da licença: repositorio.ufla.br

Termos da licença: Acesso aos termos da licença em repositorio.ufla.br

Detentores dos direitos autorais: Guilherme Henrique Emilioreli Giarola e Universidade Federal de Lavras

Baixar arquivo