ÍNDICE DE CONTEÚDO
- Introdução ao Machine Learning: Conceitos Básicos
- Tarefas do Aprendizado de Máquina
- Datasets: O que são e para que servem no Aprendizado de Máquina
- Explorando os Datasets — Parte 1
- Estatística Descritiva — Parte 1
- Estatística Descritiva – Parte 2
- Pré-Processamento Dos Dados
- Limpeza Dos Dados
- Transformação De Dados
- Classificação X Regressão
- O Algoritmo Dos K Vizinhos Mais Próximos
- Regressão Linear – Parte 1
Olá pessoal! Espero que estejam todos bem. Hoje continuaremos nossa aventura pelo mundo do aprendizado de máquina. Vamos entender um pouco melhor o que é uma tarefa de aprendizado de máquina (A.M.) e como elas são organizadas. Partiu?!
Introdução
No artigo passado eu mencionei que não há um consenso sobre a definição de aprendizado de máquina e dei alguns exemplos. Para podermos explorar alguns conceitos nesta série, vou dar mais um exemplo e vamos usar isto para tentar entender algumas coisas daqui pra frente.
Processo de indução de uma hipótese a partir da experiência passada. Computadores são programados para aprender com a experiência passada. Para tal, empregam um princípio de inferência denominado indução, no qual se obtêm conclusões genéricas a partir de um conjunto particular de exemplos*. Assim, algoritmos de A.M. aprendem a induzir uma função capaz de resolver um problema a partir de dados que representam instâncias do problema a ser resolvido. (Facelli et. al.) (Facelli et. al.)
* Exemplos: também podem ser chamados de instâncias ou objetos.
Preferi colocar a citação completa ao invés de escrever com as minhas palavras pois assim eu não corro o risco de estragar algo tão bem escrito. Você sabe o que é uma hipótese? De acordo com o dicionário, “Hipótese é a suposição de algo que pode (ou não) ser verosímil, que seja possível de ser verificado, a partir da qual se extrai uma conclusão”. Simplificando, podemos entender que, se temos dados disponíveis sobre um problema, um programa de computador pode aprender sobre isso e tentar “adivinhar” e concluir algo disso, resolvendo o problema, ou então descobrindo algo relevante que vai ajudar a resolver o problema em questão. Por exemplo, suponha que há dados de músicas disponíveis. Um algoritmo de A.M. é utilizado para aprender os gêneros musicais e depois tentar adivinhar os gêneros de novas músicas lançadas. A hipótese, neste caso, é aprender o gênero musical. Portanto, é induzida uma hipótese capaz de categorizar as músicas nos gêneros corretos. Ficou mais fácil de entender? Espero que sim. Caso ainda esteja confuso, deixe ai nos comentários ok.
Bom, problemas existem no mundo inteiro e continuam a surgir sem parar. Podemos dizer que há uma taxonomia para os problemas, isto é, eles podem ser categorizados em domínios. Exemplo: descobrir todas as funções de uma proteína é um problema do mundo real muito difícil de se resolver manualmente, no entanto, existem dados disponíveis sobre isso, portanto, podemos criar um MODELO computacional/matemático/estatístico que possa lidar com esse tipo de complexidade e assim encontrar as respostas para este problema. Este é um típico problema de biotecnologia, ou seja, um problema do domínio da área de biotecnologia. Outros domínios: texto, imagem, áudio, música, vídeos, fármacos, biologia, e por aí vai.
Para cada domínio, teremos de usar técnicas diferentes para criar o modelo de aprendizado de máquina mais adequado para resolver o problema do domínio em questão. Além disso, nem sempre os dados existentes possuirão todas as informações para que o modelo de aprendizado aprenda corretamente. Por este motivo, temos diferentes tarefas de A.M. e inúmeros algoritmos para cada uma delas. Por exemplo, reconhecer palavras faladas exige um algoritmo, enquanto reconhecer faces em vídeos vai exigir um tipo diferente de algoritmo. É possível tirar proveito de conceitos que permeiam os diferentes domínios de problemas, tarefas, etc., criando assim algo ainda mais inédito e complexo.
Tarefas
A Figura 1 apresenta um sumário dos tipos de tarefas de A.M. que existem:
Vamos entender a diferença entre as palavras Descritivo e Preditivo:
“Descritivo: que se consegue descrever; que possui a característica de uma descrição; que é capaz de retratar algo ou alguém; diz-se daquilo que descreve alguma coisa e/ou possui características descritivas” (Fonte).
“Preditivo: ação de afirmar antecipadamente o que poderá ocorrer num momento futuro. Deduzido ou entendido a partir de informações, dados ou ações anteriores à finalização ou à conclusão de. Que se pode predizer, prever por antecipação, com antecedência; em que há previsão” (Fonte).
Das definições podemos então entender que: modelos preditivos preveem coisas e modelos descritivos descrevem coisas. Em ambos os casos precisamos de informações, mas no caso da predição, precisamos de informações já rotuladas ou categorizadas, enquanto que no caso da descrição, temos que descobrir quais são esses rótulos ou categorias a partir dos próprios dados.
Em uma definição mais formal dessas tarefas, podemos dizer que nas tarefas preditivas o objetivo é encontrar uma função/modelo/hipótese a partir do conjunto de dados que pode ser utilizada para predizer um valor ou um rótulo/classe/categoria. O termo Aprendizado Supervisonado também é utilizado pois, neste tipo de tarefa, nós temos informações de entrada e saída. Então é possível verificar com mais facilidade se o que o algoritmo está dando como resposta está correto ou não, já que sabemos o resultado de antemão. As tarefas do aprendizado supervisionado são a Classificação e Regressão. As tarefas descritivas exploram ou descrevem um conjunto de dados e o termo Aprendizado Não Supervisionado é utilizado aqui pois não temos conhecimento das categorias, rótulos ou classes dos dados. As tarefas aqui são o agrupamento, associação e sumarização.
Exemplo: em gênero musical, rock, pop, sertanejo são os rótulos, ou categorias, das músicas. Em um modelo preditivo aprendemos os gêneros musicais e depois tentamos prevê-los para novas músicas, desconhecidas pelo modelo. Mas num modelo descritivo, não sabemos nada sobre esses gêneros! Então os modelos descritivos tentam descobrir os gêneros musicais apenas analisando as características dos dados. Modelos que mesclam predição e descrição (modelos híbridos) também são possíveis, eles tiram proveito de ambas formas de aprendizagem.
Além destes, também existe o aprendizado por reforço. Neste tipo de aprendizado, o objetivo é punir uma ação negativa e recompensar ação positiva. Um robô é um bom exemplo para entender o procedimento, já que ele precisa ser ensinado a encontrar a melhor forma de realizar suas tarefas. Poderíamos também pensar no adestramento de um cão. No entanto, o conceito pode ser aplicado a algoritmos, por exemplo, quando acerta ou erra uma classe pode haver recompensa ou penalização. A Figura 2 apresenta mais detalhes de cada um dos tipos de modelos/tarefas do aprendizado de máquina.
Conclusão
Para o artigo de hoje o conteúdo está de bom tamanho. Falamos sobre hipótese, modelo, domínio de problemas e dos tipos de aprendizados de máquina existentes. Ao longo desta série, entrarei em detalhes nesses tópicos, portanto, não se preocupem se no artigo de hoje não houveram mais informações sobre. Espero vocês no próximo artigo. Obrigada por lerem até aqui. Se gostaram, compartilhem com seus amigos.
Referência
- Faceli, Katti; Lorena, Ana Carolina; Gama, João; de Carvalho, André C. P. L. F. Inteligência Artificial. Uma Abordagem de Aprendizado de Máquina. Editora LTC, 2011.
- Tom M. Mitchell. Machine Learning. Editora McGraw-Hill Education, 1997.
muito legal o trabaljo. meus parabens
Obrigada =)