Noções básicas de filtros colaborativos baseados no usuário em análise preditiva
Com uma abordagem com base no utilizador para filtragem colaborativa em análise de previsão, o sistema pode calcular a semelhança entre pares de utilizadores utilizando a fórmula similaridade cosseno, uma técnica bem como a abordagem baseada no produto. Normalmente tais cálculos levam mais tempo para fazer, e pode precisar de ser calculado com mais freqüência, do que aqueles usados na abordagem baseada em item. Isso é porque
Você teria muito mais usuários do que itens (idealmente de qualquer maneira).
Você esperaria itens para mudar menos frequência do que os usuários.
Com mais usuários e menos mudanças nos itens oferecidos, você pode usar muitos mais atributos do que apenas compram história ao calcular similaridade usuário.
Um sistema baseado no usuário também pode usar algoritmos de aprendizagem de máquina para agrupar todos os usuários que têm mostrado que eles têm os mesmos gostos. O sistema baseia-se bairros de usuários que têm perfis semelhantes, padrões de compra, ou padrões de classificação. Se uma pessoa em um bairro compra e gosta de um item, o sistema de recomendação pode recomendar esse item para todo o resto do bairro.
Tal como acontece com filtragem colaborativa baseada em produto, a abordagem com base no utilizador requer dados suficientes sobre cada utilizador para ser eficaz. Antes que o sistema pode fazer recomendações, é necessário criar um perfil de usuário - por isso também requer que o usuário criar uma conta e estar conectado (ou armazenar informações de sessão no navegador através de cookies) durante a visualização de um site.
Inicialmente, o sistema pode solicitar que o usuário explicitamente para criar um perfil, detalhar o perfil por fazer perguntas, e em seguida, otimizar suas sugestões após dados de compra do usuário acumulou.
Netflix é um exemplo de rapidamente construir um perfil para cada cliente. Aqui é o procedimento geral:
Netflix convida seus clientes para configurar filas dos filmes que gostariam de assistir.
Os filmes escolhidos são analisados para aprender sobre os gostos do cliente em filmes.
O modelo preditivo recomenda mais filmes para o cliente para assistir, com base nos filmes já na fila.
A matriz da amostra de clientes e seus itens comprados - é um exemplo de filtragem colaborativa baseada no usuário. Para simplificar, use uma regra que um bairro de usuário é criado a partir de utilizadores que compraram pelo menos duas coisas em comum.
Cliente | Item 1 | ponto 2 | item 3 | item 4 | ponto 5 | ponto 6 |
---|---|---|---|---|---|---|
A - N1 | X | X | X | |||
B - N1 | X | X | ||||
C - N2 | X | X | ||||
D - N2 | X | X | X | |||
E - N1 | X | X | ||||
F - N1 | X | X | X | X | ||
G - N1 | X | X | ||||
H - N3 | X | |||||
I - N3 | X |
Há três bairros de usuários formados: N1, N2 e N3. Cada usuário em bairros N1 e N2 foi comprado pelo menos 2 itens em comum com outra pessoa no mesmo bairro. N3 são usuários que ainda não preencheram os critérios e não receberão recomendações até que comprar outros itens para atender os critérios.
Aqui está um exemplo de como você pode usar este sistema de recomendação:
desligada através de uma campanha de marketing e-mail ou se o usuário está no site enquanto estiver conectado O sistema poderia enviar anúncios de marketing ou fazer recomendações sobre o site da seguinte forma.:
O item 3 ao Cliente B
Item 4 ao Cliente C
Ponto 1 ao Cliente E
O item 3 ao Cliente F
Ponto 2 ao G Cliente
artigo indeterminado de clientes A e D
Idealmente, você deve ter muito mais itens do que seis. E deve sempre haver alguns itens no bairro de um cliente que o cliente não tenha comprado ainda.
artigo indeterminado para os clientes H e I
Neste caso, não há dados suficientes para servir como base de uma recomendação.
Uma diferença muito importante é que desde que cada cliente pertence a um grupo, todas as compras futuras que um membro torna será recomendada para os outros membros do grupo até que o filtro é treinado novamente. Então cliente A e D vai começar a receber recomendações muito rapidamente, uma vez que já pertencem a um bairro e, certamente, os outros vizinhos vão comprar algo em breve.
Por exemplo: se o Cliente B compra Item 6, então o sistema de recomendação irá recomendar o item 6 a todos em N1 (Customer A, B, E, F e G).
Cliente F potencialmente pode pertencer a qualquer N1 bairro ou N2 dependendo de como o algoritmo de filtragem colaborativa é implementado.
Clientes H e I fornecem exemplos da problema de arranque a frio: O cliente só não gerou dados suficientes para ser agrupados em um bairro de usuário. Na ausência de um perfil de usuário, um novo cliente com muito pouco ou nenhum histórico de compras - ou que só compra itens obscuros - sempre colocam o problema de partida a frio para o sistema, independentemente de qual abordagem de filtragem colaborativa está em uso.
Cliente I ilustra um aspecto do problema de arranque a frio que é único para a abordagem baseada no usuário. A abordagem baseada em item seria começar a encontrar outros itens semelhantes para o item que o cliente bought- então, se outros usuários começar a comprar Item 6, o sistema pode começar a fazer recomendações.
Sem outras compras precisa ser feito pelo pelo usuário a abordagem baseada em item pode começar a recomendar. Em um sistema baseado no usuário, no entanto, o Cliente I tem de fazer compras adicionais, a fim de pertencer a um bairro de usuários- o sistema não pode fazer nenhuma recomendação.
Ok, há uma suposição no trabalho nestes exemplos simples - ou seja, que o cliente não só comprou o item, mas Gostou o suficiente para fazer compras semelhantes. E se o cliente não gostou do produto? O sistema precisa, no mínimo, para produzir uma melhor precisão nas suas recomendações.
Você pode adicionar um critério para o sistema de recomendação para agrupar pessoas que deram classificações semelhantes aos itens comprados. Se o sistema encontrar clientes que gostam e não gostam os mesmos itens, então a assunção de alta precisão é válido. Em outras palavras, há uma alta probabilidade de que os clientes compartilham os mesmos gostos.