Aplicação de visão computacional com OpenCV

13/01/2017

Leandro Passarelli

visão computacional com OpenCV

ÍNDICE DE CONTEÚDO

Visão computacional é a visão de máquinas, é possível obter informações de imagens, sejam elas astronômicas, microscópicas ou em tamanho natural, podemos utilizar algoritmos computacionais para descrever e analisar o conteúdo de qualquer imagem digitalizada.

Essa prática é cada vez mais comum na indústria no controle de qualidade de processos e orientação de robôs, a visão computacional é capaz de realizar análises com precisão e velocidades que o olho humano não poderia alcançar, traz um novo leque de possibilidades como navegação de veículos autônomos, descoberta de novos planetas e análises biológicas em células.

Sobre o projeto

Um sistema de visão computacional para identificar e analisar biscoitos em tempo real, desenvolvido com software livre e neste caso voltado para uso educacional.

Inspeção - Biscoito aprovado — Figura 1 – Inspeção – Biscoito aprovado

Funcionamento do sistema

O sistema de visão computacional utiliza uma câmera digital, uma iluminação uniforme tipo domo e um computador com software para processar e analisar as imagens. O software utiliza técnicas de processamento de imagens que são como os filtros do photoshop, os filtros têm o objetivo de tratar as imagens, retirar o fundo (background) e deixar o objeto com o melhor contraste possível e sem ruídos que possam atrapalhar a análise geométrica. Após filtrada a imagem, temos uma imagem binária, uma imagem preto e branco somente com a forma do objeto, chamamos essa imagem binária de máscara e é nela que o software irá realizar as análises de padrões geométricos.

Primeiro o software verifica a presença do biscoito na imagem pela cor/tom com uma função simples e rápida chamada trigger, depois se houver a presença detectada do objeto a imagem passa por filtros é retirada a máscara e em seguida passa para análise do padrão geométrico que vai identificar as peças boas e ruins e ao final o resultado é mostrado na tela em tempo real.

OpenCV – Biblioteca aberta de visão computacional da Intel

OpenCV é a principal biblioteca de código aberto para a visão computacional, processamento de imagem e aprendizagem de máquina, e agora apresenta a aceleração de GPU para operação em tempo real.

OpenCV é liberado sob uma licença de BSD e daqui é livre para o uso acadêmico e comercial. Possui interfaces C++, C, Python e Java e suporta Windows, Linux, Mac OS, iOS e Android. OpenCV foi projetado para eficiência computacional e com um forte foco em aplicações em tempo real. Escrito em C/C++ otimizado, a biblioteca pode aproveitar o processamento multi-core. Adotado em todo o mundo, OpenCV tem mais de 47 mil pessoas da comunidade de usuários e número estimado de downloads superior a 6 milhões. O uso varia de arte interativa, a inspeção de minas, costura mapas na web ou através de robótica avançada.

Documentação oficial do OpenCV.

Recomendo a leitura da documentação oficial do OpenCV para aprendizado e consulta!

Considero que você possui conhecimentos em programação, tem o OpenCV instalado e testou alguns, ou todos os exemplos dele em C++ e Python e fez um hello world com CMAKE.

Esse tutorial é de nível intermediário, apesar da simplicidade do código, é necessário algum conhecimento mas qualquer um pode aprender seguindo a documentação.

O projeto

Vamos apresentar a utilização do OpenCV em um projeto realtime simples, completo e de baixo custo.

Esse projeto poderá ser modificado para muitos outros casos de inspeção visual de objetos e sua arquitetura é fruto de anos de pesquisa e desenvolvimento para obter o melhor desempenho e manter a simplicidade do código com menor custo possível.

Funcionamento algoritmo básico:

Captura
Detecção
Pre-processamento / filtro
Inspeção / análise
Resultado

Funcionamento algoritmo básico — Figura 2 – Funcionamento algoritmo básico

Parametrização, antes de capturar a imagem é necessário configurar a câmera, resolução, fps, tempo de exposição e ganho do sensor manual.

//comando do sistema (video1, tempo de exposição manual, ganho do sensor manual)

int status = system( "v4l2-ctl -d /dev/video1 -c gain_automatic=0 -c gain=0 -c auto_exposure=1 -c exposure=30 -c power_line_frequency=1" );

1 – Captura – abrir conexão, primeiro vamos abrir uma conexão com a câmera para imagem ser capturada.

1.0 – Conexão da câmera, este passo ocorre fora do loop principal, na inicialização do sistema:

int main(int, char**)
{
// video 1, exposure manual, gain manual
int status = system( "v4l2-ctl -d /dev/video1 -c gain_automatic=0 -c gain=0 -c auto_exposure=1 -c exposure=30 -c power_line_frequency=1" );
	

double start=0;
	double end=0;
	//iniciar captura camera 1
capture.open(1);
	
pthread_mutex_init(&frameLocker, NULL);
	pthread_t UpdateThread;
	pthread_create(&UpdateThread, NULL, UpdateFrame, NULL);
    	
//loop principal
	for (;;)
	{(...)}

1.1 Captura de frame, esta função é um loop e roda dentro de uma thread independente, aqui utilizei um mutex que tem a função de impedir que a imagem seja acessada simultaneamente por duas threads, pois a frame é uma variável tipo global e é utilizada por duas threads.

/capture
void *UpdateFrame(void *arg)
{
	for(;;)
	{
    	try
    	{
        	Mat tempFrame = Mat::zeros( frame.size(), CV_8UC3 );
        	capture >> tempFrame;
       	 
        	pthread_mutex_lock(&frameLocker);
        	if (!tempFrame.empty())
            	frame = tempFrame;
        	pthread_mutex_unlock(&frameLocker);
    	}
    	catch(Exception &e)
    	{
        	cout << e.msg << endl;
    	}
	}   
}

2 – Detecção, uma função simples e rápida que verifica se o objeto existe na frame capturada!

A detecção ou trigger é uma área retangular no centro da imagem que testa a média da cor/tom.

Se a comparação for verdadeira a frame capturada contém o objeto e podemos inspecioná-la.

Trigger — Figura 3 – Trigger

//Trigger
float trigger(Mat &tframe)
{
try
	{
    	float resmean = 0;
    	int x=200,y=200,w=300,h=110;
    	Rect roi = Rect(x,y,w,h);
    	Mat mask0 = Mat::zeros( tframe.size(), CV_8UC1 );
    	rectangle(mask0,roi,255,1);
    	Mat imRoi = frame(roi);
    	Scalar tempMean = mean(imRoi);
    	resmean = tempMean.val[0];
    	if (resmean < 123)
        		cout << "\n trigger mean: " << resmean << "\n";
    	return resmean;
    
	}
	catch (Exception &e)
	{   
     	cout << e.msg << endl;
     	return 0;
	}
}

3 – Pré-processamento, Esta etapa é muito importante, é onde filtramos a imagem cinza e transformamos em uma máscara, ou seja, uma imagem binária preto e branco, onde o objeto é branco e o fundo preto.

void processing(Mat &frame)
{
	try
	{
    	vector<Mat> bgr_planes;
    	split( frame, bgr_planes );
    	//Mat b = bgr_planes[0];
    	//Mat g = bgr_planes[1];
    	Mat r = bgr_planes[2];
    	Mat mask   = Mat::zeros( frame.size(), CV_8UC1 );
    	Mat res = Mat::zeros( frame.size(), CV_8UC1 );
    	Mat open   = Mat::zeros( frame.size(), CV_8UC1 );
    	Mat close  = Mat::zeros( frame.size(), CV_8UC1 );
    	Mat thresh = Mat::zeros( frame.size(), CV_8UC1 );
    	resize( r, mask, Size(), 0.5, 0.5, INTER_LINEAR );
    	threshold(mask,thresh, 120, 255, THRESH_BINARY);
	//cleanup
    	Mat kernel1 = getStructuringElement(MORPH_ELLIPSE, Size(3, 3));
    	morphologyEx(thresh,open, MORPH_OPEN, kernel1);
    	morphologyEx(open,close, MORPH_CLOSE, kernel1);
    	GaussianBlur(close,res, Size(3, 3), 3);
    	resize( res, res, Size(), 2, 2, INTER_LINEAR );
    	inspect(res, frame);
	}
	catch (Exception &e)
	{   
     	cout << e.msg << endl;
	}

}

3.1 Canal – Escolho entre os canais de cor RGB o que melhor representa o objeto

Figura 4 - Canal R - canal Red selecionado — Figura 4 – Canal R – canal Red selecionado

3.2 Canal R – Os canais RGB, são imagens em tons de cinza com profundidade de 8 bits cada, neste caso escolhemos o RED que contém a melhor informação dos tons do biscoito, note que ele é cinza mas representa o vermelho de 0 á 100% na imagem colorida.

3.3 Threshold – Função que binariza a imagem, ou seja, transforma uma imagem em tons de cinza em uma imagem preto e branco, note que ainda existem alguns ruídos na imagem.

Threshold - imagem binária — Figura 5 – Threshold – imagem binária

3.4 Cleanup – Remoção de ruídos (Reduz a imagem na metade do tamanho, passa filtros de transformação morfológica de abrir e fechar e depois amplia a imagem para o tamanho original).

Após esses passos eliminam se os ruídos e temos uma imagem mais uniforme. Essa operação está dentro da função processing.

Máscara - Imagem filtrada — Figura 6 – Máscara – Imagem filtrada

4- Inspeção / análise, Após o objeto ser detectado, a frame filtrada e transformada em máscara é chamada a função de inspeção, que vai analisar a geometria do objeto.

Essa função analisa a máscara e verifica se o objeto é convexo, (possui todos os cantos arredondados) e valida as dimensões do objeto. Podemos medir a área, perímetro, altura e largura.

4.1 Contornos, é uma função que transforma a máscara binária em linhas ou contornos.

//função busca contornos(máscara, resultado, hierarquia, modo, método, offset)
findContours( mask.clone(), contours, hierarchy, RETR_CCOMP, CHAIN_APPROX_SIMPLE, Point(0, 0) );

4.2 – Aproximação poligonal, transforma as linhas em um polígono com ajustes de precisão do comprimento das linhas. Essa precisão é chamada epsilon.

https://docs.opencv.org/3.1.0/dd/d49/tutorial_py_contour_features.html

//Perímetro 
int cnt_len = arcLength(current_contour, 1);
//Fator da precisão epsilon = 0,36% (neste caso)
Float epsilon =( 00.0036 * cnt len)  

//aproximação do poligono(contorno_entrada, contorno_saída, epsilon, flag_recursão )
approxPolyDP( Mat(contours[largestComp]), current_contour, epsilon, true );

//Validação da análise número de pontos, área e convexidade
if ( cnt_size > 6 and cnt_area > 60000 and cnt_area < 80000 and cnt_convex )...

5 – Resultado, Após a análise temos o resultado e podemos mostrar os contornos na tela com cores verde e vermelho indicando passa ou falha e em um sistema completo acionar uma saída digital de rejeito de defeitos.

/desenha contornos(imagem, contornos, maior contorno, cor, linha, hierarquia)
drawContours( result, contours, largestComp, color, 1, LINE_8, hierarchy );

Resultado, biscoito reprovado — Figura 7 – Resultado, biscoito reprovado

Resultado, biscoito aprovado — Figura 8 – Resultado, biscoito aprovado

Existem diversas maneiras de analisar imagens, com muitos outros algoritmos como por exemplo ORB, AKAZE e SURF. Neste caso nós utilizamos análise geométrica básica, que é um código simples, leve e eficiente. Na maioria das aplicações é necessário otimizar o código ao máximo para atingir alta velocidade de inspeção com precisão e segurança.

Materiais utilizados no teste

Fonte 12V, Fita Led, Bola de Isopor, pseye, um suporte de abajur de mesa e uma mesa giratória com fundo de EVA preto para simular o movimento da esteira.

Materiais — Figura 9 – Materiais

Iluminação domo — Figura 10 – Iluminação domo

Montagem da iluminação domo, feita com meia bola de isopor e fita led, a lente da câmera fica no centro do domo, os leds apontam para dentro do domo, esta iluminação é difusa, utilizada para evitar reflexo e obter uma iluminação uniforme. Funciona bem próximo ao objeto a ser inspecionado.

Projeto final — Figura 11 – Projeto final

Observações

Em projetos industriais utilizamos equipamentos industriais de alto desempenho e precisão, como as câmeras inteligentes da COGNEX, que possuem processadores dedicados com software próprio, iluminações como as da ADVANCED ILLUMINATION e lentes de alta qualidade, para realizar inspeções em linhas de alta velocidade com precisão e repetibilidade, além de conexão com robôs e outros equipamentos industriais.

É possível utilizar este software com câmeras industriais, mas é necessário fazer a integração! Nosso objetivo aqui é fornecer um ambiente de estudos de visão computacional de baixo custo com materiais simples e promover o uso de software livre para fins educacionais!

Isso é o mais simples que posso fazer, não é utilizado para fins industriais e sim para estudos!

Repositório do projeto para download

Vocês podem baixar o exemplo completo neste repositório.

Vídeo

Existe uma versão em Python e uma em C++ para este projeto.

Espero que gostem!

Leandro Passarelli

1 post

https://github.com/llpassarelli

Licença Creative Commons

Esta obra está licenciada com uma Licença Creative Commons Atribuição-CompartilhaIgual 4.0 Internacional.

Comentários:

Inscrever-se

34 Comentários

mais recentes

mais antigos Mais votado

Aly Olaia

11/06/2023 08:57

Saudacoes!

Como posso usar o algortimo para reconhecimento de residuos solidos urbanos, gostaria de desenvolver uma aplicacao para reconhecimento de residuos solidos/lixo descartados em locais ilegais?

0

Leandro Passarelli

Responder para Aly Olaia

12/06/2023 15:04

Olá Aly, saudações ????

Esse tipo de aplicação mais avançada precisa ser desenvolvida com IA.

Presto consultoria para essas aplicações através da Agrostorm computer vision.

@agrostorm [email protected]
http://www.agrostorm.com.br

Por favor entre em contato que irei te atender e te apresentar as melhores soluções para o seu desafio.

0

Márcio Silveira

30/11/2018 23:31

Faz o treinamento e usa haar cascade, muito mais confiável, não precisa de luz controlada, ambiente controlado. Desse jeito nunca vai funcionar na “vida real”, só em laboratório com tudo (ambiente, luz, objeto) controlados.

0

Rogério Isidorio

Responder para Márcio Silveira

24/06/2019 22:40

Precisamos de um profissional para desenvolver uma solução em visão computacional. Teria alguém para indicar?
Obrigado.

0

Márcio Silveira

Responder para Rogério Isidorio

25/06/2019 14:32

Rogério, me envia um email para conversarmos sobre seu projeto.
Meu email é [email protected]
Fico no aguardo.

0

Francisco

Responder para Rogério Isidorio

11/09/2019 18:08

Se você ainda tiver interesse em alguém, podemos conversar sobre o projeto que vocês desejam iniciar e então talvez fazermos uma parceria. Eu utilizo outras ferramentas mais precisas que opencv. Email: [email protected]

0

Thiago

29/10/2018 15:24

Leandro boa tarde,

Estou trabalhando em um TCC sobre “PROGRAMA DE OTIMIZAÇÃO DA LÍNGUA BRASILEIRA DE SINAIS (LIBRAS)”, inicialmente na plataforma mobile.

Quero desenvolver um tradutor de LIBRAS para português e vice-versa.

Poderia me ajudar com estudos e/ou pesquisas semelhantes na área?
Ou alguma tecnologia (pesquisei sobre OpenCV que acho vai ajudar muito no desenvolvimento do meu TCC)…

Obrigado!!

0

andre ribeiro

18/09/2018 00:53

Gostaria da saber onde vejo a versão em Python ?

1

Hericles Jardim

30/08/2018 08:37

Boa tarde, gostaria de saber qual software de programação o senhor utilizou.

0

Leandro Passarelli

Autor

Responder para Hericles Jardim

18/09/2018 14:25

Olá Hericles, utilizei sublime-text, um editor de código simples e o gcc e cmake para compilar o exemplo em c++, e o python para rodar o exemplo em python.

0

Ro Mem

25/08/2018 13:57

Caro Passarelli, boa tarde!

Estou desenvolvendo um projeto sobre “Processamento de Imagens na Agricultura de Precisão” (foco: Pragas em Folhas) com OpenCV e Python.
Poderia me ajudar com estudos e/ou pesquisas semelhantes na área?
Estou encontrando dificuldades…

Agradeço sua gentileza.
Forte Abraço,
Rô

0

Leandro Passarelli

Autor

Responder para Ro Mem

18/09/2018 14:28

Boa tarde Rô, posso sim, me manda um e-mail para [email protected] com suas dúvidas.

Abraços

0

Airton Gaidys

30/05/2018 22:34

E ai maluco, tudo dentro? Leandro, aqui Airton TAGAI, coloca para eu ver o tempo em ms que cada rotina leva para executar cada função. Só para comparar com o meu feito em Processing. Outra coisa, também estou usando a camera do PS3 aqui, esta camera é fera,. 100 Frames com ajustes muito bacanas. Parabéns pelo trabalho.

0

Leandro

Responder para Airton Gaidys

07/06/2018 14:04

Fala Airton, tudo certo! rodei no raspi com tempo de 50ms e no i7 a 4ms, essa câmera é muito boa pra brincar. Quero ver seu artigo de futebol de robôs também!
Foram bons tempos na tagai, muito aprendizado e crescimento!
Obrigado por tudo e um grande abraço!

0

willian_horik

01/03/2018 17:18

Parabéns, bom trabalho.
Há dois anos no meu TCC fiz um trabalho com OpenCV semelhante a esse, mas no caso era para reconhecimento de doença em sementes de soja utilizando machine learning e classificação com o WEKA em dispositivos mobile (android)

1

Leandro Passarelli

Autor

Responder para willian_horik

01/03/2018 21:10

Obrigado Willian!
Ainda não conheço o weka, mas é muito interessante sua aplicação, parabéns!
Se tiver disponível posta ela aqui ou envia o nome do app pra gente testar!
Abraços!

0

willian_horik

Responder para Leandro Passarelli

19/03/2018 09:07

O objetivo final era medir a melhor performance no quesito acurácia e tempo de descritores (explicados no trabalho) e classificação. Segue o link da monografia https://drive.google.com/open?id=0Bw6ZiUelKGElQ24xckMtN0ZVeEk

Mande um feedback do que achou. Ficarei grato

1

José Elias Gonçalves Leiva

Responder para willian_horik

18/03/2018 19:12

tem link do seu tcc?

0

willian_horik

Responder para José Elias Gonçalves Leiva

19/03/2018 09:08

Opa, mandei o no comentário acima… Mande um feedback depois.

1

Leandro Passarelli

Autor

Responder para willian_horik

03/04/2018 20:41

Solicitei acesso, quando liberar vou dar uma olhada sim!

1

Márcio

17/01/2018 15:40

Leandro, fiz uma aplicação em Python que ao ser chamada ela grava um arquivo avi de 10 segundos de vídeo. Mas isso tendo acesso por shell através de alguma interface gráfica.

Sabe se tem alguma forma fazer essa gravação via prompt através de um ssh por exemplo?

quando tento rodar ele me reporta esse erro ‘Gtk-WARNING **: cannot open display:’

0

Leandro Passarelli

Autor

Responder para Márcio

01/03/2018 21:03

Olá Márcio, é possível, você só precisa escrever um software de captura, existem até ferramentas como gstreamer, mas recomendo você escrever um codigo em python ou c++ para capturar e gravar o vídeo em uma pasta local e depois copiar para seu host via ssh para visualizar.
Na documentação do opencv tem exemplos de como gravar um avi.

Abraços!

0

Andre

21/12/2017 21:23

Boa noite amigo ! Desde já quero parabenizá-lo pelo projeto !
Eu tenho algumas dúvidas:
-Alem do python, o que preciso para compilar o codigo no windows?. Sou novato nesta area e estou apanhando muito para conseguir fazer rodar.
-Que tipo de camera preciso para funcionar no codigo?
Obrigado

0

Leandro Passarelli

Autor

Responder para Andre

01/03/2018 20:57

Olá André, muito obrigado!
Eu recomendo você testar no linux, no windows é um pouco chato de instalar o opencv, porém você pode pesquisar algum tutorial de instalação no windows e depois que conseguir instalar, tenta rodar esse código em python https://github.com/llpassarelli/thcv/blob/master/thcv.py
a câmera utilizada é a pseye 3
Abraços!

0

Software, Sistemas Operacionais

Visão Computacional

Home » Software » Aplicação de visão computacional com OpenCV

EM DESTAQUE

Fórum Sistemas Embarcados e IoT 2025

WEBINARS

Webinar: Iluminação Automotiva: projetando com LED Drivers e LEDs em sistemas eletrônicos

Entenda por que isolamento de memória e privilégios em firmware são importantes. Descubra a arquitetura de um microkernel neste webinar.

Webinar: Escrevendo um Microkernel para Dominar Isolamento de Memória

VEJA TAMBÉM

Cenário atual da cadeia de suprimentos de PCBs

108 – High Boy: A Revolução Brasileira na Cibersegurança Portátil

JUNTE-SE HOJE À COMUNIDADE EMBARCADOS

Talvez você goste:

Visão Computacional: Revolucionando o Controle de Qualidade na Automação Industrial

07/05/2026

LATeRe Representante Newark

AMD / Xilinx Kria™ KV260 Vision AI Starter Kit

24/09/2025

Mouser Electronics

Visão Computacional para Detecção de Defeitos

07/11/2024

Mouser Electronics

Como máquinas de visão 3D estão transformando a robótica

23/05/2024

Mouser Electronics

Detectando e contando objetos através de processamento de imagens com OpenCV no Raspberry Pi Zero

01/12/2023

Maria Eduarda Lingo de Almeida

Webinar Gravado: Introdução a Visão Computacional em Sistemas Embarcados

31/03/2021

Equipe Embarcados

E-books

Checklist de Segurança para Projetos com ESP32

e-book Criando Sistemas Linux Embarcado com Yocto Project

e-book Domine a Linguagem C

e-book Descobrindo o Linux Embarcado

e-book Descobrindo o Linux Embarcado

e-book Coleção ESP32 do Embarcados: Aplicações Low Power com ESP32