3 tipos de aprendizagem de máquina

Video: Aprendizado de Máquinas - USP - neurônio numa rede neural funções de transferência

Conteúdo

Video: aprendizado de máquinas - usp - neurônio numa rede neural funções de transferência
Aprendizagem supervisionada
Aprendizagem não supervisionada
Aprendizado por reforço
Video: aprendizado de máquina e gigantes da tecnologia | peixe babel 52

aprendizado de máquina vem em muitos sabores diferentes, dependendo do algoritmo e seus objetivos. Você pode dividir aprendizagem de máquina algoritmos em três grupos principais com base em seu propósito:

aprendizagem supervisionada
aprendizagem não supervisionada
aprendizado por reforço

aprendizagem supervisionada

aprendizagem supervisionada ocorre quando um algoritmo aprende a partir de dados de exemplo e respostas alvo associados que podem consistem em valores numéricos ou etiquetas de cordas, como classes ou tags, a fim de prever mais tarde a resposta correta quando posou com novos exemplos. A abordagem supervisionada é de fato semelhante ao aprendizado humano sob a supervisão de um professor. O professor fornece bons exemplos para o aluno a memorizar, e o estudante, então deriva regras gerais a partir destes exemplos específicos.

Você precisa distinguir entre problemas de regressão, cujo alvo é um valor numérico e problemas de classificação, cujo alvo é uma variável qualitativa, como uma classe ou uma tag. A tarefa de regressão determina os preços médios de casas em área de Boston, e uma tarefas de classificação distingue entre tipos de flores da íris com base em suas medidas sépalas e pétalas.

aprendizagem não supervisionada

aprendizagem não supervisionada ocorre quando um algoritmo aprende com exemplos simples, sem qualquer resposta associada, deixando ao algoritmo para determinar os padrões de dados por conta própria. Este tipo de algoritmo tende a reestruturar os dados em outra coisa, como novos recursos que podem representar uma classe ou uma nova série de valores não correlacionadas. Eles são muito úteis em fornecer seres humanos com insights sobre o significado dos dados e novos contributos úteis para algoritmos de aprendizado de máquina supervisionado.

Como uma espécie de aprendizado, assemelha-se os métodos de seres humanos usam para descobrir que certos objetos ou eventos são da mesma classe, como por observar o grau de semelhança entre os objetos. Alguns sistemas de recomendação que você encontrar na web na forma de automação de marketing são baseadas neste tipo de aprendizagem.

O algoritmo de automação de marketing deriva suas sugestões a partir do que você comprou no passado. As recomendações são baseadas em uma estimativa de qual grupo de clientes que você se parece mais e depois inferir as suas preferências prováveis baseadas em grupo.

aprendizado por reforço

aprendizado por reforço ocorre quando você apresenta o algoritmo com exemplos que não possuem rótulos, como na aprendizagem não supervisionada. No entanto, você pode acompanhar um exemplo com um feedback positivo ou negativo de acordo com a solução do algoritmo propõe. aprendizado por reforço está ligado a aplicações para as quais o algoritmo deve tomar decisões (assim que o produto é prescritiva, não apenas descritivo, como em aprendizado não supervisionado), e as decisões têm consequências. No mundo humano, é como aprender por tentativa e erro.

Video: Aprendizado de Máquina e Gigantes da Tecnologia | Peixe Babel 52

Erros ajudá-lo a aprender, porque eles têm uma penalidade adicional (custo, perda de tempo, pesar, dor, e assim por diante), ensinando-lhe que um determinado curso de ação é menos probabilidade de êxito do que outros. Um exemplo interessante de reforço de aprendizagem ocorre quando os computadores aprender a jogar jogos de vídeo por si mesmos.

Neste caso, um aplicativo apresenta o algoritmo de exemplos de situações específicas, como ter o jogador preso em um labirinto, evitando um inimigo. O aplicativo permite que o algoritmo de saber o resultado de ações que for preciso, e aprendizagem ocorre ao tentar evitar que ele descobre a ser perigoso e buscar a sobrevivência. Você pode dar uma olhada em como a empresa Google DeepMind criou um programa de reforço de aprendizagem que desempenha velhos videogames da Atari. Ao assistir o vídeo, observe como o programa é inicialmente desajeitada e não qualificados, mas de forma constante melhora com o treinamento até que se torne um campeão.