Cap XIII - Towards The Social Semantic Web
916142_ddc2fd0140.jpg

13.1 – Possibilities for the social semantic web

A Web Social inclui muitos serviços, tais como o MySpace, Flickr, Blogs,Facebook e WordPress, e tem captado a atenção de milhões de utilizadores. Os sites evoluem em torno das ligações entre as pessoas e os seus objectos de interesse, grupos de antigos colegas de escola, amigos de infância, colegas de trabalho, mas existe outra informação complementar interligada alem das pessoas e os seus objectos, como documentos, eventos, hobbies e fotografias nas áreas de integração de informações, disseminação, reutilização, portabilidade, busca, automação e tarefas exigentes, como a consulta.
A Web 2.0 e a Web Semântica é uma plataforma ideal para interligar e realizar operações em diversos dados pessoa-objecto disponíveis a partir da Web, e tem produzido uma variedade de abordagens para superar os limites que está sendo experimentado em áreas de aplicação Web Social e serviços inclusive a Zemanta. A tecnologia de Web Semântica pode resolver as actuais carências de informação dispersa e reforça-las com a semântica interligando toda a informação. Através destes sites podem enriquecer as aplicações semânticas com o conteúdo criado pela comunidade. O uso de tecnologias da Web Semântica para a Web Social está levando para o "Social Web Semântica" (às vezes também chamado de "Web 3.0"), formando uma rede de conteúdo interligados e semanticamente rica de conhecimento tanto a nível social como também a nível organizacional e empresarial.

13.2 – A community-guided social semantic web

A Web Semântica é de todo enriquecida ao se combinar as melhores ideias da Social Web um ecossistema de participação, onde o valor é criado pela agregação de muitas contribuições de utilizadores individuais e comunidades. O ecossistema de dados da Semântica Web, o seu valor é criado por
a integração de dados estruturados a partir de muitas fontes. A sua aplicação de sintetizar melhor os pontos fortes destas duas abordagens, pode criar um novo nível de valor que ao mesmo tempo rico com a participação humana e alimentado por informações estruturadas. Este trabalho propõe uma classe de aplicações chamados de sistemas de conhecimento colectivo, que destrava a "inteligência colectiva" da Web Social com representação de conhecimento e raciocínio de técnicas da Web Semântica. No entanto na sua termologia terá de ser definidos protocolos acordados entre vocabulários e Ontologias. O que continua a ser um problema actualmente para as comunidades na sua decisão de usar o melhor vocabulário ou ontologia, actualmente podemos definir que as comunidades tentam seguir uma serie de protocolos e ferramentas desenvolvidas para a Web Semântica no que poderá resultar numa aproximação de um padrão para a Web Semântica.

13.2.1 - Wisdom of the crowds and the semantic web

Para algumas pessoas a Web Semântica parece sugerir duas versões paralelas de informação, ou seja legível para a máquina, e legível para o utilizador, e sendo assim apenas servirá para um nicho de mercado. No entanto se a aplicação de primeiro plano for útil e interessante, então os dados lidos pelas máquinas no plano de fundo poderão efectivamente continuar invisíveis (como em blogs e RSS) e serem reutilizadas por outras aplicações.
A web semântica pode ser amplamente implementada se os cenários de uso forem convincentes, e assim a “sabedoria das multidões” poderão ajudar ao acelerar do seu crescimento.
De acordo com Barney Pell da Powerset existem quatro tipos de pessoas que podem ajudar a uma implementação em grande escala e muito rápida:

  • Os editores, que irão adicionar as ontologias para gerarem mais tráfego nos seus sites, e consequentemente irão receber feedback para ajudar a melhorar o conteúdo.
  • Os utilizadores, que através da interactividade, poderão ajudar a criarem e melhorarem recursos, irão providenciar feedback para a melhoria das facilidades de procura de informação e a criação de ontologias personalizadas e organizadas para a sua própria comunidade.
  • Os desenvolvedores, que irão agrupar conhecimento para aplicações especializadas
  • Os anunciantes, que pretenderão continuar a criar ontologias para melhor expressar os conteúdos das suas ofertas comerciais.

As empresas de motores de busca começaram recentemente a publicar ontologias recomendadas, para que os proprietários de sites e anunciantes as utilizem no formato RDFa ou em micro formatos. O resultado desta recomendação é que o conteúdo mais relevante será mostrado nas pesquisas. Tanto a Yahoo! Como a SearchMonkey publicaram uma lsita de vocabulários recomendados (incluindo o FOAF, GoodRelations, hReview, SIOC, vCalendar e vCard) para uso nos sites.
A iniciativa da Google denominada Rich Snippets de Maio de 2009, tem um objectivo similar, embora utilizando um vocabulário RDF proprietário da Google (e incluindo o hReview, hProduct e o hCard), ao invés do FOAF.
Ao promover os modelos HTML habilitados para RDFa, para aplicações de software com metadados relevantes para as pesquisas, é dado um passo muito importante em direcção para a formação da web semântica social.

13.2.2 – A grassroots approach

Existem vários vocabulários diferentes na Web Semântica, que podem utilizados em conjunto, mas que continuam sem ligação entre eles, porque muitos dos desenvolvedores não estão seguros quanto à sua utilização. Ao mesmo tempo estão a ser desenvolvidos paralelamente vocabulários similares ou relacionados, sem saberem da existência uns dos outros. Algumas das razões para que os vocabulários não atinjam a massa crítica é a de que criar um vocabulário é um processo muito árduo, e o processo de estabelecer um vocabulário na web semântica não é claro, ou gere consenso na comunidade.
Através dos micro-formatos (referidos anteriormente) e respectivas comunidades, vários formatos de dados abertos (open data) foram criados e estão actualmente em uso.
O desenvolvimento da web semântica necessita dos esforços de uma comunidade centrada para a criação e interligação entre vocabulários. Alguma da inspiração foi retirada do sucesso da comunidade de micro-formatos, e assim foi criada a SemanticWeb.org que utiliza a plataforma MediaWiki.
Esta abordagem de base pode levar à criação e interligação de vocabulários que podem ser usados para realizar a interligação de websites sociais. Além deste facto como tem de existir um consenso para a criação destes vocabulários, uma das melhores maneiras de o fazer é reunir pessoas com o mesmo objectivo, como por exemplo o VoCamp, que consiste num workshop de sessões informais. Nos dois primeiros eventos em 2008 foram criados variados vocabulários, incluindo o Whisky Ontology e um vocabulário IRC.

13.2.3 –The vocabulary onion

Criar vocabulário é um processo árduo, com a escolha da linguagem que oferece níveis de expressividade diferentes, as questões relacionadas com a modelação do domínio, e a necessidade de aumentar modelos existentes com conceitos específicos que podem não ser entendidos por outros, ou seja a criação dos vocabulários é realizada por especialistas. Para o utilizador normal da web, esta engenharia de conhecimento é bastante assustadora, especialmente quando não está inserido numa comunidade.
No que se refere à engenharia ontológica, a web semântica social requer estruturas semânticas leves e vocabulários sem complexidade elevada, tal como o sucesso do FOAF e do SIOC em comparação com outros vocabulários permitem demonstrar. São focados em domínios pequenos, bem definidos e suportados por comunidades, além do que existem inúmeras ferramentas que suportam o FOAF e o SIOC, permitindo desta forma ser fácil utilizar, avaliar e aumentar de maneira descentralizada estes vocabulários. A existência e aumento destes vocabulários em sites permite a troca de informação, e assim proliferarem as aplicações com comportamento inteligente.
Para permitir uma forma de explicação de como os vocabulários se relacionam entre eles, foi proposto criar um esquema denominado como “cebola do vocabulário”. Este esquema tem vários níveis, com vocabulários nucleares no centro, seguido por vocabulários intermédios ou de ligação, e no ultimo nível os vocabulários especializados.
A ontologia SIOC é utilizada em conjunto com vocabulários como o FOAF, DC e SKOS, e assim podemos combinar várias ontologias de modo a descrever melhor o conteúdo gerado pelo utilizador, tanto na web social como no ambiente empresarial. Através do seu framework permite que mais detalhes acerca dos itens de conteúdo possam ser actualizados e adicionados. Através das técnicas NLP a informação contida num item pode ser descrita por RDF e anexada à ontologia SIOC existente sobre o referido item.
Através dos metadados que são criados e utilizados baseados no esquema de cebola do vocabulário, os websites que utilizam algum ou alguns dos vocabulários dos vários níveis do esquema, podem trabalhar em conjunto. Um exemplo desta interacção seria um primeiro website utilizar todos os vocabulários disponíveis, o segundo website utilizar o vocabulário nuclear, alguns dos vocabulários de ligação e alguns dos especializados, e o terceiro website utilizar os vocabulários de ligação e especializados que não são utilizados no segundo website.
A interoperabilidade pode ocorrer nos vários níveis. Utilizando os vocabulários nucleares, as informações sobre pessoas, os seus interesses e conteúdo, com tópicos correspondendo a esses interesses, podem ser expressos em vários websites.
Através dos vocabulários interligados, inclusive os metadados especializados, dados geotemporais, conteúdo transversal a géneros ou plataformas e links adicionais para qualquer outro tipo de vocabulário, podem ser disponibilizados.

13.3 – Integrating with the social semantic desktop

Com o crescimento da Web Semântica e Social, surgiu em paralelo o Desktop Semântico e Social, onde os utilizadores podem partilhar documentos, ficheiros multimédia, calendários, etc. Existem pontos de convergência entre estas duas áreas, por exemplo, nas áreas de modelos de informação, colaboração e partilha de conhecimento, pesquisa de conhecimento. Á combinação destas duas áreas dá-se o nome de “Espaços de Informação Social e Semântica”.

13.4 – Privacy and identity on the social semantic web

A comunidade da Web Semântica tem que ter em conta que uma das potencialidades da Web Social para muitos é a facilidade com que se encontram dados pessoais e profissionais sobre as pessoas. Os utilizadores da Web Social e Semântica têm que ser sensibilizados a proteger os seus dados de forma a partilhar apenas o que for estritamente necessário.

13.4.1 – Keeping privacy in mind

Temos que pensar mais sobre como educar os utilizadores relativamente aos benefícios de fazer parte da Web Social e Semântica e como minimizar os seus perigos, por exemplo através do grupo de interesse “W3C Semantic Web Education and Outreach”. É imperativo educar os possuidores de sites sobre os dados semânticos que devem partilhar. A maioria dos utilizadores não tem noção de que os seus dados estão constantemente a ser recolhidos por outros sites, de forma a poderem ser usados para outros fins. O número de sites com sistemas FOAF (Friend Of A Friend) tem vindo a diminuir com os anos, devido a queixas de utilizadores ao verem os seus dados replicados para outros sites.
Esta situação não acontece apenas com dados pessoais, mas com todo o tipo de dados que se publique online, tais como artigos em Blogs.

13.4.2 – Identify fragmentation

Alguns desafios estão ainda por superar, nomeadamente os que estão relacionados com as identidades na Web Social, tal como a autenticação e privacidade dos utilizadores nas redes sociais. Um aspecto interessante das redes sociais e dos websites sociais é que, a maioria das pessoas usam vários websites para poderem fragmentar a sua identidade online: fazendo upload de fotos para o Facebook, adicionando contactos no LinkedIn, etc.
Embora as pessoas, por norma, gostem de separar a sua vida pessoal da profissional, muitas vezes para ganhar a confiança de alguém, acabam por partilhar dados pessoas com essas mesmas pessoas, criando desta forma várias identidades que poderão ter alguma distinção entre elas.

13.5 – The vision of a social semantic web

Ao longo deste livro, temos vindo a demonstrar os vários benefícios do uso de tecnologias semânticas em redes e sites sociais. Os sites sociais aliciam os seus utilizadores a criar e partilhar conteúdo, mas no entanto, devido à falta de integração entre os vários sites, todo esse conteúdo se torna inútil ao navegar para outros sites.
Usando tecnologias da Web Semântica, poderá ajudar a resolver muitos destes problemas de integração, aumentando desta forma o valor das redes sociais e dos dados contidos nas mesmas.
Ao desenvolver uma aplicação seguindo a Web Semântica, disponibilizamos os dados de uma forma “standard”, tornando possível a integração dos mesmos em outros sites.
O sistemático acesso à informação para resolver os problemas do dia-a-dia, é um ponto crítico seja para um individuo ou para uma organização. Para desenvolver novas soluções e ser possível inovar, são necessárias redes sociais e organizacionais, com acesso a redes de conhecimento. A falta de integração entre estes vários tipos de redes tem vários problemas, como por exemplo, atrasos em desenvolvimentos, falta de informação CERTA no TEMPO CERTO.
Para terminar, podemos concluir que, com a evolução da Web, esta pode ser vista hoje em dia como um meio completamente independente que permite às pessoas a partilha, troca, venda e até mesmo conhecerem outras pessoas online. Devido a este nível de maturidade, a Web está a ser alvo de estudos num novo campo da investigação, sendo vista como uma ciência.
Os dados de uma Web Social e Semântica podem ajudar os investigadores a compreender de que forma a Web está a transformar as sociedades actuais.
Temos que ter em consideração que, mesmo tendo a melhor arquitectura de software, a Web Semântica e Social só pode ser um sucesso se os utilizadores da mesma criarem e partilharem informação entre eles, o que depende apenas dos utilizadores em si, não da semântica.

Análise critica

A web social tem evoluído bastante devido ao aparecimento das grandes redes sociais, e blogs, e os sites têm evoluído bastante devido à grande interacção das pessoas entre si, ao contrário do que acontecia com a web 1.0, em que as pessoas apenas tinham poder de consulta.
Cada vez mais, os motores de busca apostaram em publicar ontologias recomendadas para os proprietários de microsites, o que faz com que estes usem todos o mesmo formato, que tem como finalidade facilitar as pesquisas feitas por parte dos utilizadores.
Uma das desvantagens da Web semântica, é que apesar de existirem muitos desenvolvedores, verifica-se que chegam a estar em desenvolvimento vários vocabulários similares ou relacionados, sem saberem da existência um dos outros, o que acaba por ser uma desvantagem, visto que se trata de um processo muito trabalhoso e demoroso, e que por vezes não tem o sucesso desejado.
Muitos utilizadores apenas têm noção dos benefícios da web, no entanto não têm noção que os seus dados estão constantemente a ser recolhidos para outros websites, onde são utilizados com outros fins.
Desenvolver aplicações utilizando a mesma web semântica, faz com que seja possível fazer a integração de outros sites, visto ambos se encontrarem de uma forma semântica. Isto faz com que os desenvolvedores consigam efectuar o seu trabalho de uma forma mais simples a rápida.

Trabalho realizado por:

Mário Almeida
Pedro Antunes
Manuel Bernardes
Daniel Gomes

Este trabalho deve ser citado como:
Almeida, Mário; Bernardes, Manuel; Antunes, Pedro e Gomes, Daniel (2012). Resumo de Towards The Social Semantic Web. Trabalho da disciplina de Seminário de Sistemas e Tecnologias da Informação I. Universidade Atlântica, Portugal. Disponível em http://ssti1-1112.wikidot.com/cap-13-towards-the-social-semantic-web.