

























Estude fácil! Tem muito documento disponível na Docsity
Ganhe pontos ajudando outros esrudantes ou compre um plano Premium
Prepare-se para as provas
Estude fácil! Tem muito documento disponível na Docsity
Prepare-se para as provas com trabalhos de outros alunos como você, aqui na Docsity
Os melhores documentos à venda: Trabalhos de alunos formados
Prepare-se com as videoaulas e exercícios resolvidos criados a partir da grade da sua Universidade
Responda perguntas de provas passadas e avalie sua preparação.
Ganhe pontos para baixar
Ganhe pontos ajudando outros esrudantes ou compre um plano Premium
Comunidade
Peça ajuda à comunidade e tire suas dúvidas relacionadas ao estudo
Descubra as melhores universidades em seu país de acordo com os usuários da Docsity
Guias grátis
Baixe gratuitamente nossos guias de estudo, métodos para diminuir a ansiedade, dicas de TCC preparadas pelos professores da Docsity
Trabalho de Conclusão de Curso apresentado à Coordenadoria do Curso de. Licenciatura em Informática do Instituto. Federal do Espirito Santo, ...
Tipologia: Notas de estudo
1 / 33
Esta página não é visível na pré-visualização
Não perca as partes importantes!
Trabalho de Conclusão de Curso apresentado à Coordenadoria do Curso de Licenciatura em Informática do Instituto Federal do Espirito Santo, Campus Cachoeiro e Itapemirim, como requisito parcial para a obtenção do titulo de professor Licenciado em Informática. Orientador: Prof. MSc. Daniel José Ventorim Nunes CACHOEIRO DE ITAPEMIRIM-ES 2022
LUÍS SALVADOR POLDI GUIMARÃES PROPOSTA DE IMPLANTAÇÃO DE RECONHECIMENTO DE IMAGEM E BANCO DE DADOS UTILIZANDO REDES NEURAIS ARTIFICIAIS E SUA APLICABILIDADE NA EDUCAÇÃO Monografia apresentada à Coordenadoria do Curso de Licenciatura em Informática do Instituto Federal do Espirito Santo, Campus Cachoeiro de Itapemirim, como requisito parcial para a obtenção do título de professor Licenciado em Informática Aprovado em 2 6 de abril de 2022. COMISSÃO EXAMINADORA ____________________________________________ Me. Daniel José Ventorim Nunes Instituto federal do Espírito Santo – Cachoeiro de Itapemirim Orientador ____________________________________________ Dr. Edmundo Rodrigues Junior Instituto federal do Espírito Santo – Cachoeiro de Itapemirim ____________________________________________ Dr. Raul de Souza Brandão Instituto federal do Espírito Santo – Cachoeiro de Itapemirim
MINISTÉRIO DA EDUCAÇÃO INSTITUTO FEDERAL DO ESPÍRITO SANTO SISTEMA INTEGRADO DE PATRIMÔNIO, ADMINISTRAÇÃO E CONTRATOS FOLHA DE ASSINATURAS Emitido em 28/04/ FOLHA DE APROVAÇÃO-TCC Nº 3/2022 - CAI-CCLI (11.02.18.01.08.02.06) (Nº do Protocolo: NÃO PROTOCOLADO) (Assinado digitalmente em 28/04/2022 15:14 ) DANIEL JOSE VENTORIM NUNES PROFESSOR DO ENSINO BASICO TECNICO E TECNOLOGICO CAI-CCLI (11.02.18.01.08.02.06) Matrícula: 1918045 (Assinado digitalmente em 28/04/2022 18:19 ) EDMUNDO RODRIGUES JUNIOR PROFESSOR DO ENSINO BASICO TECNICO E TECNOLOGICO CAI-CCTI (11.02.18.01.08.02.07) Matrícula: 1670128 (Assinado digitalmente em 28/04/2022 15:52 ) RAUL DE SOUZA BRANDAO PROFESSOR DO ENSINO BASICO TECNICO E TECNOLOGICO CAI-CCSI (11.02.18.01.08.02.13) Matrícula: 2764324 Para verificar a autenticidade deste documento entre em https://sipac.ifes.edu.br/documentos/informando seu número: 3 , ano: 2022 , tipo: FOLHA DE APROVAÇÃO-TCC , data de emissão: 28/04/2022 e o código de verificação: 72d139eeb
ABSTRACT The identification of images by photography in a database is a complex activity as an analysis material. It is therefore necessary to use computational and mathematical tools to satisfactorily address the problem. In this context, the objective of this work is to evaluate the efficiency in the application of artificial neural networks as a way to predict and solve this problem. In the future, if the study proves to be satisfactory, the possibility of developing an analysis equipment to be directed to Education is envisaged, with which its use can be carried out directly at school or even in the field of research in a portable and with low cost, adding mobility and agility to the execution of this task through educational biological analogies. That is, the comparison of the image pixel with the images held in the databases added to statistical tests of prediction and correlation. For example, when seeing a jabuticaba tree, the human brain informs us that that vision is a jabuticaba tree. And that the jabuticaba tree is not to be confused with a guava tree. How does the brain identify these shapes? This is what we want to do with neural networks, only now in an artificial and not biological way. As can be seen, the research should be directed to an area of heuristics, topology and group theory. That will form the large group called neurocomputing with a focus on pattern recognition techniques, image processing, control systems, robotics, statistical analysis and identification and prediction of events that will form systems. Identifying a person is easier when you have access to their characteristics, eye color, head shape. However, this work becomes less complex when its focus is applied to education. Even specialized technicians have difficulties in distinguishing one student from another, given the enormous variety of people and character that exist. In general, in the identification process, macroscopic characteristics (eyes, writing skills, use of technical words, language skills, etc.) and microscopic composition of tacts, type and arrangement of heads, presence of tattoos, pupil details are analyzed. among other characteristics of silhouettes, demanding time and knowledge from the specialist. Among the new technologies that are being used in the identification of students there is the comparison of images through the image of their face, eyes, details, which can provide a set of pixel information for a given area range. Keywords: Computational tools, image processing, Artificial Neural Networks.
10 nível técnico e superior, o interesse pela área. Outro objetivo foi o de permitir uma reciclagem ou um primeiro contato de profissionais dos diferentes setores da educação, cujas atividades envolvam alguma informação baseada em imagens e banco de dados. Por se tratar de uma área bastante ampla, não foi possível incluir todos os possíveis tópicos relevantes, mas procurou-se fornecer um mínimo de detalhes associados a cada etapa de processamento em um sistema típico de PDI, da aquisição à classificação. Para aqueles interessados em se aprofundar nos tópicos pouco explorados, e.g. segmentação, extração de características e classificação, ou em outros tópicos igualmente importantes que não puderam ser incluídos neste documento por restrições de espaço, e.g. transformações geométricas, representação no domínio da frequência (transformada de Fourier e Wavelets), técnicas de compressão, dentre muitos outros. 1.2 OBJETIVOS DO TRABALHO Verificar se a utilização de redes neurais artificiais como técnica de reconhecimento de imagens pode ser útil na identificação ou discriminação no tocante a educação através da análise do perfil de cada aluno. 1.2.1 Objetivo Geral Utilizar redes neurais como ferramenta de identificação de alunos procurando selecionar e agrupá-los por agentes psicológicos. Separando-os por comportamentos: agressivos, calmo, inteligente, com dificuldades, uso da visão e óculos, audição, altura, postura entre outras variáveis. 1.2.2 Objetivos Específicos Analisar e comparar o desempenho de diferentes implementações de rede neurais artificiais para classificação dos alunos, como sexo, presença de tatuagens, pircings, e aspectos neurais: inteligência, assiduidade, medição do tempo de concentração de cada um, testes de agilidade e motricidade; Futuramente desenvolver equipamento de baixo custo e alta mobilidade para minimizar o tempo e o custo de análise.
11 1.3 JUSTIFICATIVA Ao presenciar um Conselho de Classe percebi quanta informação são lançadas fora. O professor traça uma anamnese do aluno e esses dados não são registrados através de um banco de dados. Características de comportamento, assiduidade, percepção, inquietude, indisciplinas entre outros nada disso é registrado num banco de dados escolar. A Escola oferece um ambiente para uma anamnese completa. Juntando todas estas informações num banco de dados têm-se infinitas variáveis para análise futura de um caráter. Quais as características de um gênio? De um psicopata, de um engenheiro de um médico? Perde-se tudo isto por não se dispor de um banco de dados e um banco de imagens na Escola. Imagine se tivesse todos os dados do Bolsonaro num banco de dados? Poder-se- ia estudar o perfil de um aluno que teria chance de ser um Presidente do Brasil. Obter maior agilidade no auxílio à identificação de alunos. Tipo ágeis, mole, espertos, atenciosos, educados, relação com os pais entre outros. Embora a rede neural possa não ser capaz de dar uma resposta exata, uma aproximação, já facilita a análise ao indicar uma maior probabilidade de que uma amostra de alunos possa ser agrupados de acordo com alguma característica. Seja de determinado grupo ético seja de pais separados, pais casados direitinhos, pais empregados, uso de drogas. Destacar semelhanças/padrões entre as amostras analisadas. E como se investiga também a possibilidade de utilização em computadores portáteis para serem usados dentro da sala de aula. Em conjunto com equipamentos que não necessitem de tratamento da amostra, conferindo agilidade na análise bem como mobilidade do instrumental através da aplicação de redes neurais, já que uma RNA possui capacidade de adquirir experiência e aperfeiçoar seu desempenho, baseando-se em dados reais para gerar um modelo genérico, objetivando a identificação de padrões nesses dados.
13 mapeadores universais de funções multivariáveis, com custo computacional que cresce apenas linearmente com o número de variáveis. Outra importante característica é a capacidade de auto-organização e de processamento temporal. Todas estas características fazem das RNAs uma ferramenta computacional atrativa para a solução de problemas complexos. Como se pode então observar dos enunciados acima uma Rede Neural Artificial é um modelo matemático inspirado na neurobiologia, cujo objetivo é representar a cognição humana ou o neurônio biológico de forma generalizada. Considera-se generalização o fato da RNA produzir saídas adequadas para entradas que não estavam presentes no seu treinamento (fase de aprendizagem). Sua principal propriedade é a capacidade de aprender a partir do meio e de aperfeiçoar o seu desempenho de forma ordenada, a fim de atingir um objetivo estabelecido. O processo de aprendizagem ocorre de forma iterativa e consiste nos ajustes aplicados aos pesos sinápticos e níveis de bias, que são análogos às intensidades dos sinais de sinapses dos neurônios biológicos. Esses ajustes fazem com que a rede torne-se mais instruída sobre seu ambiente após cada iteração do algoritmo de aprendizagem. De forma genérica pode-se dizer que aprendizagem é um procedimento onde os pesos e bias são adaptados através de estímulos oriundos do ambiente ao qual a rede está inserida, sendo que o tipo de aprendizagem é determinado pelo modo como ocorre a modificação desses parâmetros (OLIVEIRA et al, 2015). 2.1 O NEURÔNIO ARTIFICIAL As RNAs tentam reproduzir as funções das redes neurais biológicas, buscando implementar seu comportamento funcional e sua dinâmica. Como características comuns entre estes dois tipos de redes, pode-se citar que ambos são baseados em unidades de computação paralela e distribuída que se comunicam por meio de conexões sinápticas, possuem detectores de características, redundâncias, e modularização das conexões. Essas características comuns permitem às RNAs reproduzir com fidelidade várias funções cognitivas e motoras dos seres humanos. O neurônio artificial é um modelo
14 simplificado do neurônio biológico. Tais modelos inspirados a partir da análise da geração e propagação de impulsos elétricos pela membrana celular dos neurônios. São modelo não-lineares, fornecem saídas tipicamente contínuas, e realizam funções simples, como coletar sinais existentes em suas entradas, agregá-los de acordo com a sua função de ativação. Sinais de entrada { X1, X2, …, Xn }: São os sinais externos normalmente normalizados para incrementar a eficiência computacional dos algoritmos de aprendizagem. Pesos sinápticos { W1, W2, …, Wn }: São valores para ponderar os sinais de cada entrada da rede. Combinador linear { Σ }: Agregar todos sinais de entrada que foram ponderados pelos respectivos pesos sinápticos afim de produzir um potencial de ativação. Limiar de ativação { Θ }: Especifica qual será o patamar apropriado para que o resultado produzido pelo combinador linear possa gerar um valor de disparo de ativação. Potencial de ativação { u }: É o resultado obtido pela diferença do valor produzido entre o combinador linear e o limiar de ativação. Se o valor for positivo, ou seja, se u ≥ 0 então o neurônio produz um potencial excitatório; caso contrário, o potencial será inibitório. Função de ativação { g }: Seu objetivo é limitar a saída de um neurônio em um intervalo de valores. Sinal de saída { y }: É o valor final de saída podendo ser usado como entrada de outros neurônios que estão sequencialmente interligados.
16 2.2.1 Aprendizado Supervisionado Redes de aprendizado supervisionado aprendem ao serem apresentadas a dados de treinamento pré-classificados. A aprendizagem se dá ao serem modificados os pesos das conexões de suas redes, para classificar mais precisamente os dados de treinamento. Deste modo, em muitas situações, redes neurais são capazes de generalizar, com grande grau de precisão, a partir de um conjunto de dados de treinamento, chegando ao conjunto completo de entradas possíveis. Um dos métodos mais comumente usados para o aprendizado supervisionado é retropropagação. Aprendizado supervisionado exige a existência de um supervisor, ou professor externo, o qual é responsável por estimular as entradas da rede por meio de padrões de entrada e ao observar a saída calculada pela mesma, comparando-a com a saída desejada. Como a resposta da rede é função dos valores atuais do seu conjunto de pesos, estes são ajustados de forma a aproximar a saída da rede da saída desejada. Para cada padrão de entrada, a rede tem sua saída corrente comparada com a saída desejada pelo supervisor, que fornece informações sobre a direção de ajuste dos pesos. A minimização da diferença é incremental, já que pequenos ajustes são feitos nos pesos a cada etapa de treinamento, de tal forma que caminhem, se houver solução possível, para uma solução. O aprendizado supervisionado se aplica a problemas em que se deseja obter um mapeamento entre padrões de entrada e saída. Os exemplos mais conhecidos de algoritmos para aprendizado supervisionado são a regra delta [WH60] e a sua generalização para redes de múltiplas camadas, o algoritmo back-propagation [RHW86]. O aprendizado supervisionado pode ser implementado basicamente de duas formas: off-line e on-line. Para treinamento off-line, os dados do conjunto de treinamento não mudam, e, uma vez obtida uma solução para a rede, esta deve permanecer fixa. Caso novos dados sejam adicionados, um novo treinamento, envolvendo também os dados anteriores, deve ser realizado para se evitar interferência no treinamento anterior. Por sua vez, no aprendizado on-line o
17 conjunto de dados muda continuamente, e a rede deve estar em um contínuo processo de adaptação. 2.2.2 Aprendizado não-supervisionado Métodos de aprendizado não-supervisionado aprendem sem qualquer intervenção humana, não há um professor ou supervisor externo para acompanhar o processo de aprendizado. Neste esquema de treinamento somente os padrões de entrada estão disponíveis para a rede, ao contrário do aprendizado supervisionado, cujo conjunto de treinamentos possui pares de entrada e saída. Durante o processo de aprendizado os padrões de entrada são apresentados continuamente à rede, e a existência de regularidades nesses dados faz com que o aprendizado seja possível. Regularidade e redundância nas entradas são características essenciais para haver aprendizado não-supervisionado. O aprendizado não-supervisionado se aplica a problemas que visam a descoberta de características estatisticamente relevantes nos dados de entrada, em que estes precisem ser classificados ou agrupados em um conjunto de classificações que não são conhecidas previamente. No entanto, neste tipo de aprendizado não existe um supervisor externo, sendo o ajuste dos pesos feito independentemente de qualquer critério de desempenho da resposta da rede, por meio de um mecanismo local às sinapses. 3 PROCESSAMENTO DE IMAGENS Nos últimos anos as RNAs ganharam popularidade como ferramenta alternativa e às vezes complementar as técnicas clássicas de reconhecimento de imagens. Nessa área, a aplicação das RNAs envolvem reconhecimento de caracteres escritos à mão, compactação de dados, análise de componentes independentes, codificação, entre outros. Em reconhecimento de imagens, os problemas requerem o tratamento de imagens de alta definição com uma grande quantidade de informação adicional, como coloração e posicionamento no espaço tridimensional. O tratamento desses problemas com RNAs frequentemente requer a utilização de técnicas convencionais de processamento de imagens para pré-processar os
19 assistidos por computadores no tocante a reconhecimento de imagens de parênquimas. Pinto Junior et al. (2006) proporam uma RNA para identificar classes de defeitos de madeira serrada de eucalipto em imagens digitais, utilizando-se como características os percentuais das bandas do vermelho, verde e azul detectados por uma câmera especial dotada de filtro RGB. Os resultados variam de 76,6% a 83,1% de acerto, dependendo do tamanho dos blocos de madeira analisados. Labati et al. (2009 in OLIVEIRA, 2013) desenvolveram um mecanismo para classificação de alguns tipos de madeira, utilizadas na fabricação de painéis, a partir dos espectros de infravermelho captados por filtros ópticos de baixo custo acoplados a um conjunto de fotodetectores. A ideia é treinar uma rede para identificar se a madeira utilizada é adequada para a fabricação de painéis e juntá- la a um sistema de reconhecimento eletrônico. Faz-se incidir um feixe de laser sobre a amostra e fotodetectores com filtros nas cores vermelho, verde e azul captam as frequências de infravermelho associadas. Dentre as duas situações de teste propostas, o melhor desempenho atingiu precisão, no reconhecimento, superior a 97%. Esteban et al. (2009 IN oliveira, 20 13 ) foi utilizada uma Rede Neural do tipo Perceptron com Backpropagation com regularização Bayesiana para a identificação de dois tipos de madeira de árvores nativas das Ilhas Canárias, Juniperus cedrus e J. phoenicea. Como essas duas espécies apresentam características anatômicas similares, a ideia da rede desenvolvida foi utilizar, em conjunto, atributos biométricos e anatômicos para classificação. O percentual de sucesso atingido no reconhecimento foi de 92%. Packianather e Drake (2000 in OLIVEIRA, 2013) aplicaram uma RNA com o objetivo de identificação de falhas em madeira laminada colada (em inglês plywood) produzidas por uma indústria de beneficiamento. A ideia é que um sistema computadorizado possa fazer a identificação de 12 tipos de falhas poupando recursos humanos para tal tarefa. O trabalho resultou numa precisão de 86,5% e numa diminuição no tempo de identificação se comparado com classificadores humanos.
20 Jordan et al. (1998) utilizou as respostas elásticas, devido à excitação ultrassônica da madeira, para treinar uma RNA com o objetivo de classificar sua origem entre os quatro diferentes espécimes de árvores utilizadas. Foi utilizada uma RNA do tipo MLP (Multilayer Perceptron) com 3 camadas. O modelo teve desempenho aproximado de 97% na classificação das espécies. Bremananth et al. (2009) as diferenças nas características presentes nas cascas de espécies distintas de árvores foram utilizadas para treinar uma RNA como ferramenta de classificação. As informações para treinamento da rede foram obtidas pela análise da imagem das suas cascas mediante técnicas como Gray- level Cooccurrence Matrices (GLCM) e passaram por um tratamento estatístico com PCA (Principal Component Analisys). Quatro espécies de árvores, nativas da América do Norte, foram utilizadas no trabalho. O resultado atingiu 97% de precisão. Em fim, de acordo com as várias citações acima se pode concluir que o Processamento Digital de Imagens (PDI) não é uma tarefa simples, na realidade envolve um conjunto de tarefas interconectadas. Tudo se inicia com a captura de uma imagem, a qual, normalmente, corresponde à iluminação que é refletida na superfície dos objetos, realizada através e um sistema de aquisição. Após a captura por um processo de digitalização, uma imagem precisa ser representada de forma apropriada para tratamento computacional. Imagens podem ser representadas em duas ou mais dimensões. O primeiro passo efetivo de processamento é comumente conhecido como pré-processamento, o qual envolve passos como a filtragem de ruídos introduzidos pelos sensores e a correção de distorções geométricas causadas pelo sensor. Concluído esta etapa de processamento de imagens que incorpora fundamentos de várias ciências, como Física, Computação, Matemática. Conceitos como Óptica, Física do Estado Sólido, Projeto de Circuitos, Teoria dos Grafos, Álgebra, Estatística, dentre outros, são comumente requeridos no projeto de um sistema de processamento de imagens. Existe também uma interseção forte entre PDI e outras disciplinas como Redes Neurais, Inteligência Artificial, Percepção Visual, Ciência Cognitiva. Há igualmente um número de disciplinas as quais, por razões históricas,