Cap 8 Social Tagging
images?q=tbn:ANd9GcQ2IDxHZNHw5WJ1NcSuyfix-rjJWmbo-UE9uQIHPHN_qUoGMoANfvQi46VVaQ

Social tagging

A etiquetagem (tagging) rapidamente tornou-se uma prática comum e popular nos websites sociais. Ela permite que as pessoas marquem o conteúdo que publicam ou compartilhem palavras-chave de forma livre, a fim de tornar o conteúdo mais facilmente disponível e percetível para os outros.
Acreditamos que pode evoluir, combinada com esquemas de modelagem formal, tais como ontologias e assim torna-lo mais poderoso, e assim fazer parte da web semântica como um todo.

Tagging e folksonomias

Uma das características mais importantes nas redes sociais, é a capacidade de compartilhar e carregar conteúdos entre utilizadores.
O facto de as pessoas poderem compartilhar, interagir, e conhecer pessoas graças aos interesses comuns. Podemos através de vários gostos relacionados criar uma comunidade que pode acabar por se formar por exemplo: à volta de um filme, uma tecnologia ou lugar.
Nas redes sociais, estes tipos de dados podem ser subscritos e compartilhados com qualquer pessoa ou podem só estar disponíveis através de uma comunidade específica.

A fim de tornar esse conteúdo mais facilmente detetável, os utilizadores podem adicionar de forma livre palavras-chave, ou tags, que atuam como identificadores ou categorias para qualquer coisa que desejamos compartilhar.
A tag é normalmente um descritor de palavra única e os sinais de pontuação são geralmente evitados, embora alguns sistemas suportem frases entre aspas e outros usem camelCase para distinguir entre palavras.

Um dos sistemas de marcação mais popular é o serviço de social bookmarking del.icio.us, que permite armazenar os nossos bookmarks favoritos na web, através de botões no navegador de internet, não sendo necessária qualquer instalação no computador. Marcadores criados no del.icio.us tornam-se acessíveis em qualquer lugar e normalmente são públicos.
Os utilizadores podem subscrever os bookmarks de outros e os bookmarks podem ser enviados a outros utilizadores registados usando uma tag “for:username”, da sintaxe do del.icio.us.

No Twitter, os utilizadores usam o que ficou conhecido por “hashtags” (palavras com o prefixo “#”) para anotarem as suas entradas. Embora a utilização de hashtags tivesse inicio no final de 2007, o Twitter só deu suporte de hiperlink a estas tags em Julho 2009, quando clicávamos numa hashtag íamos diretamente para o post que lhe deu origem.

As tags embora sejam geralmente consideradas um tipo de metadados, é importante manter em mente que são atribuídos pelo utilizador. No caso de um motor blog que pode atribuir automaticamente uma data de criação para qualquer blog, ou como o flickr que usa os dados embutidos no exif para mostrar a abertura da máquina fotográfica usada na foto, as tags são voluntariamente atribuídos pelo próprio utilizador.

Deste modo as tags usam a informação atribuída pelo utilizador, não precisando de se ter de aprender um vocabulário pré-definido (como uma hierarquia ou taxonomia) e podem usar-se palavras-chave que se enquadram exatamente nesses fins. Esta marcação é geralmente conhecida por Folksnomia, tema atribuído por (Vander Wal 2007), com a junção dos termos “folks” e “taxonomia”. Ou seja folksnomia é um esquema de categorização aberto, em evolução e atribuído pelo utilizador.

Ao contrário dos esquemas pré-definidos de classificação, os utilizadores podem usar os seus próprios termos, o que faz a folksnomia evoluir rapidamente, beneficiando da “arquitetura de participação”. Sites que utilizem suporte de tagging beneficiam da sabedoria “do efeito das multidões”.

A informação atribuída pelas tags, pode ser facilmente procurada por motores de busca baseados em tags. Um esquema de visualização normalmente utilizado nestes ecossistemas de tagging é a nuvem de tags, onde as tags mais usadas são maiores do que as outras tags. Estas nuvens de tags dão também uma visão geral das principais categorias ou temas discutidos no site relacionado.

wozniak_tagcloud4small.jpg

Problemas com os sistemas de marcação livre

Apesar das suas vantagens ao anotar os itens de conteúdo, a etiquetagem leva a várias questões relativas a recuperação da informação. Isso torna a tarefa de recuperar o conteúdo marcado, por vezes muito dificil, especialmente quando se olha para a informação marcada por outras pessoas. (Mathes 2004) diz que "a folksonomia representa, simultaneamente, alguns dos melhores e piores na organização da informação".

Ambiguidade das Tags

Como as etiquetas são apenas strings de texto, sem qualquer semântica ou interpretação óbvia, a ambiguidade é uma questão importante. Se por exemplo usarmos um motor de busca com a palavra maça, ele vai retornar pelo menos como resultado a fruta e hardware da empresa Apple.

images?q=tbn:ANd9GcTl397qxE87epB-DyAKeXNr8Q_AtsH79L0q5-gyzfIgT-QrqdBuqg

images?q=tbn:ANd9GcQywps0DQPviCM3fTrQQEE264z0h5VvfnSBIHUo3PoPcLV9ngKT

Heterogeneidade das Tags

Ambiguidade tag refere-se quando a mesma marca é usada para se referir a coisas diferentes, mas uma questão paralela é que marcas diferentes também podem ser usadas para se referir à mesma coisa.

Neste caso, devemos executar várias consultas para obter o conteúdo relacionado a um determinado conceito ou objeto. Essa heterogeneidade é causada principalmente pela natureza multilingue de tags (por exemplo, 'semanticweb' e 'websemantique), mas também devido ao fato de que as pessoas vão usar siglas ou versões encurtadas ('sw' e 'semweb’), bem como linguística e morfo-variações sintáticas (sinónimos, plurais, as variações de caso, etc).

Por exemplo, observou-se que pelo menos dez variações são usadas para identificar o termo "web semântica" no del.icio.us.

Falta de organização entre as tags

Uma vez que uma folksonomia é essencialmente um conjunto fixo de tags, a falta de relações entre eles faz com que seja difícil encontrar a informação se a pessoa não olhar diretamente para tag correta.
Este é claramente um problema na prática da marcação, especialmente se, como observado por (Golder e Huberman 2006), os utilizadores usam tags diferentes dependendo do seu nível de especialização.

Por exemplo, enquanto nós mencionamos as tags 'semanticweb' ou 'socialweb' em relação a este livro, um perito prefere usar termos como "SIOC ',' RDFa ',' SPARQL ', que irá ajudá-lo a melhor classificar os dados. Então, se alguém simplesmente olhar para itens com a tag 'semanticweb', eles não serão capazes de encontrar o livro, embora haja uma relação clara entre ambos em termos de domínio tecnológico.

Para superar este problema, foi introduzido pelo (Begelman et al. 2006), algoritmos de agrupamento que podem ser usados para identificar as tags relacionadas.
No entanto, o seu sucesso depende da distribuição de marcação, ou seja, se houver ou não, uma forte ocorrência entre as tags. O que pode não ser o caso de algumas folksonomias, mesmo para etiquetas que identificam os conceitos relacionados. Em alguns casos, estes algoritmos também podem ser combinados com outras abordagens para identificar as tags relacionadas e comunidades em torno de temas particulares (Hayes e Avesani 2007).

Tags e a web semântica

No passado, folksonomias e ontologias têm sido regularmente citadas como um meio oposto e exclusivo para a gestão e organização da informação.
Um ponto de vista frequente foi considerar folksonomias como uma classificação de baixo para cima, enquanto ontologias foram vistos como uma abordagem cima para baixo.
Esta maneira de pensar também foi parte de um conjunto maior de pontos de vista opostos entre Web 2.0 e Web Semântica. Esta oposição é injustificada e não deveria existir uma vez que estes dois campos são de fato caminhos complementares (e sinérgicos) no sentido do reforço da Web.

Minning de taxonomias e ontologias em folksnomias

Este primeiro conjunto de abordagens baseia-se principalmente na ideia de que as semânticas emergentes aparecem naturalmente com o uso de tags. Como (Golder e Huberman 2006) relatam, geralmente há um conjunto estável de tags utilizadas para um determinado recurso após um determinado período de tempo.

Por exemplo, no del.icio.us, as tags de um item estabilizam depois de ter sido marcado cerca de cem vezes. Portanto, a semântica emergente pode ser usada para as taxonomias ou ontologias de folksonomias e esta área de pesquisa tem levado a várias obras nos últimos anos.

Entre outros, (Halpin et al. 2006) usaram uma abordagem com base em ocorrências relacionadas para extrair as relações hierárquicas entre os conceitos. Com base na reflexiva ocorrência de tags, extraem relações mais amplas e mais estreito entre os conceitos modelando como um vocabulário RDFS usando a propriedade rdfs: subClassOf. (Mika 2005) definiu uma abordagem social para automaticamente construir ontologias através da combinação de análise de rede social e algoritmos de agrupamento baseados em folksonomias.
Um resultado de seu trabalho é que sub-comunidades de utilizadores também podem ser mapeados para uma hierarquia de tags: comunidades de especialistas usam as tags mais “apertadas” do que as comunidades mais amplas em que estão incluídos.

Mais recentemente, a técnica do Folksonomy Ontology enRichment (FLOR) fornece uma abordagem completamente automatizada para enriquecer semanticamente espaços tag, por tags mapeados por entidades de Web Semântica (Angeletou 2008). Enriquecendo os espaços tag com informação semântica com o significado de cada tag, alguns problemas com a marcação sobre a recuperação da informação (tais como a ambiguidade tag como mencionado anteriormente) podem ser resolvidos.

Modelação de folksnomias usando tecnologias de web semântica

Enquanto a seção anterior descreveu o trabalho de extração e ligando modelos estruturados com base em tags e atividades tagging, outra abordagem para a ponte entre folksonomias e Web Semântica é usar princípios de modelagem RDF(S) / OWL para representar tags, ações de marcação e outros objetos relacionados como nuvens de tags.

Enquanto a busca baseada em tags é a única maneira de recuperar conteúdo com a etiqueta actualmente, (levando para os problemas acima mencionados), estes novos modelos permitem recursos avançados de consulta, tais como "quais itens estão marcados ‘semanticweb’ em qualquer plataforma "," quais são as últimas dez etiquetas usadas por Stefan em del.icio.us "," lista de todas as marcas normalmente usadas por Alex no SlideShare e pelo John no Flickr " ou "recuperar qualquer conteúdo marcado com algo relevante para o campo Web Semântica ". Tendo tags e conteúdo publicado com a etiqueta RDF também permite facilmente ligar este para ou a partir de outros dados da Web Semântica, e reutilizá-lo em todos os aplicativos.

Embora não tenha sido implementada, (Gruber 2007) definiu como uma das primeiras abordagens para folksonomias modelo e ações de marcação usando uma ontologia dedicada. Este trabalho considera o modelo tripartido de tagging e estende-o com (1) um espaço de atributos, visando a modelagem do website em que a ação de marcação ocorreu, e (2) o valor de uma polaridade, a fim de lidar com questões de spam. Sua proposta prevê um modelo completo para representar as ações de marcação, mas também considera a ideia de uma identidade de marca, de tal forma que várias marcas podem se referir ao mesmo conceito ao ser escrito de maneira diferente, introduzindo a necessidade de identificar algumas semânticas comuns nas próprias marcas.

  • O Tag Ontology foi o primeiro modelo baseado em RDF para representar marcas e ações de tagging, baseado nas idéias iniciais de Gruber e no modelo teórico comum de marcação que mencionamos anteriormente. Esta ontologia define as classes 'Tag' e 'Tagging' com propriedades relacionadas para criar a relação tripartida de marcação. A fim de representar o utilizador envolvido em uma ação de tagging, essa ontologia baseia-se no vocabulário FOAF. Uma característica importante deste modelo é que ele define uma classe Tag, portanto, o que implica que cada tag terá uma URI apropriada para que as tags podem ser usadas tanto como o sujeito e o objeto de triplos RDF. Além disso, esta classe é definida como uma subclasse de skos: Concept e a ontologia introduz uma propriedade "relatedTag” .
images?q=tbn:ANd9GcQAr4iAeRm0Womp_iRKNxLPSXU912-cG_KYJzibkqvtove0T7eL
  • O Simple Knowledge Organization System (SKOS) é um vocabulário RDFs leve, permitindo que as pessoas definam vocabulários controlados, tais como taxonomias e tesauros. Desta forma, as tags podem ser interligadas, por exemplo, o modelo que a tag 'rdfa' é mais específica que "semanticweb '. No entanto, a propriedade proposta não faz distinção entre duas marcas que estão relacionadas, porque eles representam o mesmo conceito, mas são escritas de forma diferente ("websemantique 'e' semanticweb ') ou se uma tag identifica um conceito que é mais amplo do que o outro ('rdfa' e 'semanticweb’). Finalmente, embora não especificamente considerado o espaço de marcação, ele introduz uma forma de definir temporalmente, graças a ação de marcação a uma propriedade taggedOn.
images?q=tbn:ANd9GcTSGttnGOZH6UocbtLxxcwOf8tEVzeJlfrJGX63AuAPu9br6PdVXA
  • A ontologia Social Semantic Cloud of Tags (SCOT) (Kim et ai. 2007) está focada em representar nuvens de tags e define maneiras de descrever o uso e ocorrência de tags numa determinada plataforma social, permitindo que se move o seu tag de um serviço para outro e compartilhar nuvens tag com os outros. É importante mencionar que SCOT prevê que a portabilidade não pelo conteúdo em si, mas pelas ações de marcação e as marcas de um determinado utilizador. SCOT reutiliza a Ontologia Tag, bem como etiquetas e modelos SIOC, as ações de marcação e as nuvens de tags. Um aspeto importante do modelo SCOT é que ele considera o espaço onde a ação tagging aconteceu (ie plataforma social, por exemplo, Flickr ou del.icio.us), como sugerido pela proposta inicial de Gruber. SCOT também fornece várias propriedades para definir variantes ortográficas entre as tags, usando uma propriedade principal spellingVariant e subproperties diversos, tais como sigla plural, etc.
images?q=tbn:ANd9GcTNNY1cWB7ooYtCM6dqDW6cs_bYcrEfpv1_SUlbvMQ2yq17GYWG
  • Meaning Of A Tag (MOAT) visa representar o significado de tags usando URIs de instâncias da ontologia de domínio existente ou recursos existentes a partir de bases de conhecimento público (Passant Laublet e 2008b), tais como os do Linking Open Data project. O objetivo do MOAT é, portanto, criar uma ponte entre folksonomias e ontologias existentes ou bases de conhecimento para que as questões de marcação de forma livre em relação a recuperação da informação possam ser resolvidas. Por exemplo, eu uso a tag "maçã" e com isso quero dizer a marca do computador identificado por dbpedia:Apple_Inc, enquanto a imagem tag "maçã" refere-se ao fruto identificado pela dbpedia:Apple.

Para atingir esse objetivo, ele fornece uma ontologia OWL-DL leve que reutiliza e estende a Tag Ontology. MOAT também depende de SIOC e FOAF para modelar o recurso marcado e o utilizador que atribuiu o tag. MOAT é mais do que um modelo único, também fornece uma framework baseada na ontologia, cujo objetivo é permitir às pessoas facilmente preencher a lacuna entre a marcação de forma livre e simples de indexação semântica. Este último é mais poderoso do que o anterior em termos de recuperação de informação, mas é certamente mais complexa em termos de anotar o conteúdo. O quadro proposto visa reduzir essa lacuna, ajudando os utilizadores a anotar seu conteúdo com URIs de recursos da Web Semântica a partir das etiquetas que já usou para o conteúdo anotado.

images?q=tbn:ANd9GcTBpI19TBe7mGQk0gI4bpxQY6xwxBJWetTsmHiwLTvfl6wHt22T

Além disso, enquanto ela consiste principalmente de um modelo e um quadro para marcação aumentada, a abordagem MOAT pode ser automatizada tal como aplicado por (Abel 2008), no sistema GroupMe!. Fornece portanto uma agradável ponte entre as abordagens que o extrato de significados tags das folksonomias, e aqueles que visam etiquetas modelo com tecnologias da Web Semântica.

Mais recentemente, a Tag Common initiative (envolvendo AdaptiveBlue. Faviki Freebase, Yahoo!, Zemanta, Zigtag e DERI, NUI Galway) desenvolveram um vocabulário de peso com um objetivo similar de ligar marcas a conceitos bem definidos (representado com a sua URIs), a fim de fazer a marcação mais eficiente e interligada. Em particular, ela concentra-se numa abordagem simples permitindo que os proprietários do site publiquem anotações tag RDFa, bem como proporcionar um ecossistema completo de produtores e consumidores de dados de tags comuns que podem ajudar os utilizadores finais a implantar aplicativos baseados neste formato.

Além disso, os outros modelos que podem ser usados para representar as tags incluem a Nepomuk Ontology Annotation (NAO), SIOC, a anotação Ubimarks e esquemas marcador. Ambos NAO e SIOC definem uma nova 'Tag' classe , com sioc:Tag definido como uma subclasse de skos:Concept. SIOC também define uma propriedade tópico para vincular um recurso a alguns de seus temas embora não explicitamente usando a palavra 'tag' na sua definição, o modelo marcador Ubimarks fornece uma classe "Topic" e uma propriedade” hasTopic “ para vincular um item para algumas palavras-chave relacionadas. Este modelo também define uma propriedade “subTopicOf”, a fim de modelar hierarquias de tópicos.
No entanto, em contraste com as principais ontologias definidas anteriormente, estes três vocabulários não fornecem qualquer forma para modelar a ação tagging em si (ou seja, a relação tripartida entre um recurso, uma marca e um utilizador). Assim, eles não podem captar a representação completa de folksonomias mas simplesmente focar a relação entre um recurso com a tag e suas tags relacionadas.

Finalmente máquinas Tag do Flickr podem ser usados como uma maneira de fornecer tagging aumentada para utilizadores finais. Ao definir tags em forma de 'prefixo: property = value' (como 'geo: lat = 43,22' ou 'lastfm: event = 3544 "), eles permitem que os utilizadores adicionem metadados machine-readable em anotações de fotos. Por exemplo, 'geo: lat = 43,22' a tag pode ser usada para definir o local onde a foto foi tirada, especialmente pode ser gerado automaticamente a partir de telemoveis com câmara, enquanto a tag "lastfm: event = 3544 ' pode ser usada para agregar automaticamente algumas fotos Flickr relacionado com um evento particular na Last.fm. Enquanto eles não estão diretamente representados usando tecnologias da Web Semântica, tags máquinas podem ser mapeados para RDF usando a API Flickcurl.

Aplicações de marcação usando tecnologias de web semântica

Várias ferramentas já oferecem recursos avançados de marcação utilizando tecnologias de Web Semântica ou exportação de dados RDF. Alguns exemplos:

Anotea

Embora não seja estritamente definida como um sistema de tagging, o Annotea foi o primeiro aplicativo baseado nas Web sociais que utilizaram tecnologias de Web Semântica. Iniciada em 2001, permitiu que as pessoas adicionassem notas e comentários em páginas web que iam navegando, e compartilhá-los através de uma comunidade. Uma característica importante é a sua abertura e a conformidade com padrões W3C.

Annotea

Revyu.com

Revyu.com é um serviço online dedicado a criar opiniões sobre todo o tipo de coisas: desde textos de conferências, até bares ou restaurantes. É totalmente baseado em RDF.
Duas características importantes do Revyu.com sobre o uso de tecnologias da Web Semântica são:

  • Integração e articulação com outros conjuntos de dados
  • A capacidade de consumir perfis FOAF baseados em detalhes já preenchidos noutras plataformas.

revyu

SweetWiki

SweetWiki não é projetado para criação e manutenção de instâncias da ontologia, mas usa tecnologias da Web Semântica para aumentar a experiência do utilizador e navegação entre as páginas. Um aspecto relevante, é a capacidade de organizar as tags como uma hierarquia de conceitos. Esta hierarquia é então modelada em RDFS para que ele possa ser reutilizado em outras aplicações, enquanto o modelo de wiki em si é definida usando uma ontologia OWL particular.

SweetWiki

Int.ere.st

Com base na ontologia SCOT, int.ere.st é uma aplicação web dedicada à portabilidade das tags entre aplicações. O principal objetivo do int.ere.st (Kim et al. 2008) é demonstrar como Web Semântica e Web Social podem ser combinadas para apoiar a partilha de melhor tag e criação em diversas comunidades online.

LODr

LODr é uma aplicação que proporciona recursos de enriquecimento de semântica para conteúdos a partir de vários populares sites de redes sociais, como Flickr, del.icio.us e Twitter. É baseado em MOAT, as pessoas manualmente vincular suas marcas a URIs para definir seus significados.
Quando um conceito é selecionado, bem como uma lista de itens, o sistema também apresenta:

  1. Uma descrição do conceito, utilizando a sua rdfs: comment propriedade (ou subproperties),
  2. Uma lista de conceitos relacionados por coocorrência;
  3. Uma lista de conceitos relacionados que compartilham uma relação direta com o atual, e
  4. uma lista de conceitos relacionados que compartilham uma propriedade comum.

Interface Atom

A Interface Atom é uma abordagem interessante para visualizar e navegar através de estruturas de árvore e gráficos. O nome para a interface Atom foi escolhido, pois é baseada na metáfora de eletrões, átomos e moléculas.

Faviki

Faviki é um serviço de bookmarking social que usa um vocabulário controlado para suas marcas, ou seja, os recursos definidos na Wikipédia.


Este trabalho deve ser citado como:
Silveira, Clarisse; Correia, Jaime,Virtudes, José e Venâncio Rui (2012). Social Semantic Web. Trabalho da disciplina de Seminário de Sistemas e Tecnologias da Informação I. Universidade Atlântica, Portugal. Disponível em http://ssti1-1112.wikidot.com/cap-8-social-tagging . Acedido em (data do dia de acesso).