Avaliação de aprendizado de máquina aplicado ao realinhamento de hierarquias para segmentação de imagens

Dissertação de Mestrado Acadêmico

Autor(es)

Milena Menezes Adão (Adão, Milena Menezes)

Programa de Pós-graduação em Informática

Área de conhecimento

CIÊNCIA DA COMPUTAÇÃO

CIÊNCIA DA COMPUTAÇÃO

Orientador(es)

Zenilton Kleber Gonçalves do Patrocínio Júnior

Banca Examinadora

Erickson Rangel do Nascimento ( UNIVERSIDADE FEDERAL DE MINAS GERAIS )

Silvio Jamil Ferzoli Guimarães ( PONTIFÍCIA UNIVERSIDADE CATÓLICA DE MINAS GERAIS )

30/05/2019


Avaliação de aprendizado de máquina aplicado ao realinhamento de hierarquias para segmentação de imagens

Palavras-chave em Português

Aprendizado de máquina.

Segmentação hierárquica de imagens.

Devido a popularização dos smartfones, que permitem a captura de imagens, e a disseminação das redes sociais, que permitem o compartilhamento de multimídias, uma quantidade significativa de imagens é gerada e disponibilizada em bases de dados todos os dias. Portanto, existe a necessidade de processar imagens em grande quantidade de maneira eficiente e eficaz. A segmentação de imagens é uma das técnicas fundamentais para o processamento e análise de conteúdo visual. Atualmente, métodos de segmentação hierárquica de imagens vêm atraindo a atenção da comunidade cientifica de processamento digital de imagens. Estes métodos retornam um conjunto de segmentações de imagens com diferentes níveis de detalhes, de modo que os níveis pouco detalhados podem ser produzidos a partir da fusão entre as regiões de níveis mais detalhados. No entanto, os objetos podem ser localizados em diferentes níveis hierárquicos devido às diferenças de tamanho ou às distintas distâncias da câmera. Na literatura, muitos trabalhos vem sendo desenvolvidos para melhorar os resultados finais dos métodos de segmentação hierárquica de imagens. Uma solução possível é realinhar uma hierarquia de modo que cada região que contém um objeto (ou suas partes) esteja no mesmo nível. Neste trabalho, exploramos o uso de floresta aleatória e redes neurais artificiais como modelos de regressores para prever valores de score de regiões pertencentes a uma hierarquia, os quais são utilizadas para realinha-la. A presenta dissertação objetivou responder a seguinte questão: qual é o impacto gerados nos resultados de segmentação hierárquica após o processo de realinhamento de hierarquias ao treinar florestas aleatórias e redes nerais com diferentes configurações e com diferentes descritores de regiões? Além disso, foi proposto nessa dissertação um novo cálculo de score. A partir de resultados experimentais foi possível concluir que a utilização de diferentes abordagens de aprendizado de máquina com diferentes arquiteturas e diferentes descritores influenciam na qualidade dos treinamentos. Além disso, percebeu-se que a utilização do realinhamento de hierarquias pode melhorar os resultados finais da segmentação de imagens. Analisando as duas abordagens de aprendizado de máquinas foi possível perceber que as florestas aleatórias apresentam resultados mais estáveis que as redes neurais. Porém, o melhor resultado foi alcançado quando se utilizou rede neural artificial. Ao observar que no treinamento as regiões de algumas imagens foram preditas com um erro absoluto relativamente maior que os demais, uma análise detalhada foi feita nessas imagens, o que acarretou em uma proposta de alteração no cálculo de score para a abordagem de realinhamento de hierarquias e uma melhoria de 39,5% no MSE.


Machine learning assessment for hierarchy realignment for image segmentation

Palavras-chave em Inglês

Hierarchical image segmentation.

Machine learning.

Due to the popularity of \textit {smartphones}, which enable the capture of images, and the dissemination of social networks that allow the sharing of multimedia, a significant amount of images are generated and made available in databases every day. Given this, there is a need to process large quantities of images efficiently and effectively. Image segmentation is one of the fundamental techniques for processing and analyzing visual content. Currently, hierarchical image segmentation methods have attracted the attention of the scientific community of digital image processing. These methods return a set of image segmentations with different levels of detail, so that poorly detailed levels can be produced by merging between regions at more detailed levels. However, objects can be located at different hierarchical levels due to differences in size or different distances of the camera. In the literature, many works have been developed to improve the final results of hierarchical image segmentation methods. One possible solution is to realign the hierarchy so that each region containing an object (or its parts) is at the same level. In this work, we explore the use of random forest and artificial neural networks as regressor models to predict score values for regions belonging to a hierarchy of partitions, which are used to realign it. The present dissertation aimed to answer the following question: what is the impact generated in the results of hierarchical segmentation after the process of realigning hierarchies when training random forests and nets with different configurations and with different region descriptors? Three experiments were performed to answer this question. In addition, a new calculation of score was proposed in this dissertation. From the experimental results it was possible to conclude that the use of different machine learning approaches with different configurations and different descriptors influences the quality of training. It was also possible to observe that the use of hierarchical realignment can improve the final results of the segmentation of images. Analyzing the two approaches to machine learning, it was possible to perceive that the random forests present more stable results than the neural networks, because it acted better when more trees were used in the forests. However, the best result was achieved when using neural networks with three layers and two neurons. When observing that in the training the regions of some images were predicted with a relatively greater absolute error than the others, a detailed analysis was done in these images, which entailed in a proposal of alteration in the calculation of score of the approach of realignment of hierarchies. Based on the new proposal, experiment 4 was carried out, which resulted in an improvement of 39.5% in the MSE measure.


Texto Completo

Aguarde...

Aguarde...