Meetings held during the period under review

CHAPTER III: Issues from the subsidiary bodies of the Commission, including the

C. Meetings held during the period under review

O primeiro sistema de recomendação proposto foi o Tapestry (RESNICK; VARIAN, 1997), seus idealizadores criaram a expressão “filtragem colaborativa”, termo que usaram para refe- renciar um sistema espec´ıfico capaz de filtrar conteúdos se utilizando de aux´ılio humano, ou seja, colaboração entre grupos de interessados.

Filtragem Colaborativa utiliza o feedback de um conjunto de indiv´ıduos sobre um conjunto de items para realizar as recomendações, e ignoram o conteúdo dos items (MONTANER, 2003) e dos perfis dos usuários.

A grande vantagem deste método é justamente não depender do conteúdo das descrições dos items e dos conteúdos dos perfis de usuários, superando o problema dos conteúdos incompletos, imprecisos ou inexistentes.

Segundo Herlocker (HERLOCKER, 2000), os primeiros sistemas de filtragem colaborativa requeriam usuários para especificar o relacionamento de predição entre suas opiniões, ou de modo expl´ıcito indicar os itens de interesse. Porém, em seguida estes sistemas automatizaram todo o procedimento através da coleção das pontuações dos itens pelos usuários.

Um usuário de um sistema de filtragem colaborativa deve portanto pontuar cada item ex- perimentado, indicando o quanto este item casa com sua necessidade de informação. Alguns sistemas, no entanto, permitem apenas que o usuário manifeste-se favorável a um item, ou não manifeste-se favorável, denotando indiferença, sem a possibilidade de um meio termo.

Sistemas de filtragem colaborativa simples apresentam para o usuário uma média de pontuações para cada item com potencial de interesse. Esta pontuação permite ao usuário descobrir itens que são considerados de interesse pelo grupo e evitar os itens que são considerados de pouco interesse. Sistemas mais avançados descobrem de maneira automática relações entre usuários (vizinhos mais próximos), baseado na descoberta de padrões comuns de comportamento (RE- ATEGUI; CAZELLA, 2005).

Uma questão importante em sistemas de filtragem colaborativa refere-se à coleta de informações dos usuários, que pode apresentar alguns problemas(REATEGUI; CAZELLA, 2005):

• Problema do primeiro avaliador: quando um novo item aparece no banco de dados

não existe maneira deste ser recomendado para o usuário até que mais informações sejam obtidas através de outro usuário.

• Problema de pontuac¸˜oes esparsas: o objetivo dos sistemas de filtragem colaborativa

é ajudar pessoas, focando em documentos lidos ou itens adquiridos. Caso o número de usuários seja pequeno em relação ao volume de informações no sistema existe um grande risco das pontuações tornarem-se muito esparsas.

• Similaridade: Caso um usu´ario tenha gostos que variam do normal, este ter´a dificuldades

para encontrar outros usuários com gostos similares, sendo assim suas recomendações podem se tornar pobres.

Tabela 3.1: Avaliações de usuários, sobre filmes.

Usuário / Filme Gladiador 300 Casanova Don Juan O Vidente Coração Valente

Marcos 4,0 3,0 3,0 - - 2,0

Let´ıcia - 3,0 4,5 4,5 - 0,5

Felipe - - 4,0 - - -

Marcelo 4,5 4,0 2,0 - - -

Ana 4,0 4,5 4,5 5,0 - 4,5

Analisando a tabela 3.1, percebe-se que Let´ıcia e Ana possuem gostos semelhantes, uma vez que suas notas para os filmes foram similares. Neste caso, uma recomendação pertinente a Let´ıcia seria o filme Gladiador, considerando também que ele recebeu notas altas de outros usuários, de gostos não semelhantes ao dela. Marcelo e Ana atribu´ıram notas semelhantes aos filmes de ação, porém notas muito diferentes ao filme Casanova(romance). Portanto, apesar do grau de proximidade em relação aos filmes de ação, o Movielens não recomendaria a Marcelo o filme Don Juan. Felipe atribuiu nota apenas ao filme Casanova. Este fato ilustra a dificuldade dos sistemas de filtragem em encontrar o grau de correlação entre os usuários quando sua base de dados é pobre. Outra dificuldade que os sistemas enfrentam é o caso do filme O Vidente. Como é um filme novo, ainda não foi avaliado por nenhum usuário, o que dificulta sua sugestão para outros usuários. Há ainda o caso do filme Coração Valente, cuja pontuação é esparsa, o que dificulta ao sistema classificá-lo como item de qualidade ou não.

3.2 Exploraç ão de Perfil de Usuário 45

Como mecanismo de recomendação, a filtragem colaborativa pode ser dividada em três passos (SOBOROFF; NICHOLAS, 2000): Encontrar usuários similares (vizinhos); Criar a vizinhança; Processar um prognóstico baseado nos vizinhos selecionados. Tais passos são des- critos a seguir.

Encontrar usu´arios similares (vizinhos)

Existem padrões de avaliação de similaridade usados para calcular o grau de similaridade entre o perfil de um determinado usuário em relação a um grupo de usuários. As técnicas mais comums utilizadas para esse fim são nearest neighbor, clustering e classificadores (MONTA- NER, 2003).

Duas abordagens podem ser utilizadas pelo algoritmo do vizinho mais próximo: Simi- laridade do cosseno ou correlação. Em similaridade do cosseno, os perfis dos usuários são representados em forma de vetores, em um espaço n-dimensional, onde n é o número de itens que os usuários, dois a dois, qualificaram. Ao se calcular o co-seno entre dois vetores num determinado plano, calcula-se, na verdade, o grau de similaridade da forma com que os dois usuário avaliaram items no sistema(NASCIMENTO, 2003). Esse co-seno é calculado segundo a seguinte equação: similaridade(a, b) = ∑ n i=0(ai× bi) q ∑n i=0(a2i) × q ∑n i=0(b2i) (3.1)

Onde: a é um usuário; b é outro usuário; aiavaliação de usuário a sobre o i-ésimo item de

recomendação; biavaliação de usuário b sobre o i-ésimo item de recomendação;

A outra abordagem consiste em utilizar o coeficiente de Pearson, que varia no intervalo de -1.0 a 1.0, onde quanto mais próximo de -1.0 maior o grau de dissimilaridade e quanto mais próximo de 1.0, maior o grau de similaridade entre as variáveis. Seu valor é calculado de acordo com a equação a seguir:

simililaridade(a, b) = ∑ n i=1(ai− ¯a) × (bi− ¯b) q ∑n i=1(ai− ¯a)2× (bi− ¯b)2 (3.2)

Onde: a é um usuário; b é outro usuário; aiavaliação de usuário a sobre o i-ésimo item de

recomendação; biavaliação de usuário b sobre o i-ésimo item de recomendação; e ¯a e ¯b são as

médias das avaliações sobre os items por a e b, respectivamente.

Criar a vizinhanc¸a

O segundo passo, chamado de criar vizinhança, consiste em determinar quantos vizinhos serão selecionados para o terceiro passo. Em geral, duas técnicas tem sido utilizadas para tal: a técnica do limiar de correlação (correlation-thresholding); e técnica do the best n-neighbors (MONTANER, 2003).

Na técnica do limiar de correlação, determina-se um limiar de correlação absoluto, onde todos os vizinhos com um limiar de correlação maior são selecionados. Ao configurar um limiar de correlação alto, restringe-se a vizinhança a apenas vizinhos muito próximos, mas muitos usuários podem possuir muito poucos vizinhos muito próximos, ou mesmo não possuir vizinhos muito próximos, resultando numa vizinhança vazia, ou muito escassa, e por consequência, incapaz de prover predições para muitos items.

A técnica do best n-neighbors consiste em pegar um número fixo de vizinhos para a vizinhança. Esta técnica funciona razoavelmente bem, por não restringir a cobertura de predição. Porém, ao pegar um número grande de usuários resultará em uma vizinhança grande, e os vizinhos mais distantes poderão atrapalhar as predições cobertas pelos vizinhos mais próximos. Em contrapartida, um pequeno número pode causar predições pobres para aqueles que não tem vizinhos muito próximos (MONTANER, 2003).

Processar um predic¸ ˜oes baseado nos vizinhos selecionados

O último passo consiste em computar as predições ponderando as avaliações dos vizinhos selecionados o passo anterior. Diferentes técnicas são usadas para contemplar este passo (MON- TANER, 2003). Neste trabalho, descreveremos três: o item de recomendação mais frequente; recomendação baseado em regras de associação; e média ponderada de avaliações.

O item mais frequente de recomendação pega a vizinhança e varre os interesses dos usuários extraindo os items mais frequentemente selecionados. Depois de todos vizinhos da vizinhança serem processados, o sistema ordena os items de acordo com a frequencia e simplesmente

3.3 Aspectos Sociais 47

retorna os n mais frequente items não ainda selecionados pelo usuário considerado para receber as recomendações (MONTANER, 2003).

Para descrever a recomendação baseado em regras de associação é necessário utilizar uma linguagem mais formal, como segue: assumindo que existem n items, I= {i1, i2, i3}, em uma

matriz R que registra as avaliações dos usuários em relação aos items. Uma transação T ⊆ I

é definida como um conjunto de items que são avaliados por um usuário, ou, em sistemas de e-commerce, o conjunto de items que são comprados juntos. Uma regra de associação entre dois conjuntos de items IX e IY tal que IX, IY ⊆ I e IX∩ IY = /0, diz que se há items do conjunto

IX na transação T , então há uma grande possibilidade de items do conjunto IY também esta-

rem presentes em T (VOZALIS, 2003). De acordo com a premissa apontada pelas regras de associação, as recomendações são realizadas.

A outra forma de combinar as avaliações dos vizinhos para realizar predições é computador a média ponderada das avaliações utilizando o coeficiente de correlação como peso (MONTA- NER, 2003). Desta forma, as avaliações de usuários mais similares obterão maior peso, e terão uma maior chance de serem recomendados.

Dans le document Annual report 2015: Committee of Experts Thirty-fourth meeting (Page 40-62)