lunes, 25 de enero de 2016

Web Semántica - Introducción

La Web actual está formada por un conjunto de documentos enorme, en su mayoría páginas web escritas en lenguaje HTML. Cabe destacar que la utilización de este lenguaje trae como desventaja
una mala representación semántica de los datos


La Web actual es, un extraordinario medio para el acceso al conocimiento explícito, servicios, entretenimiento, comercio y negocios electrónicos, entre otros. 

Por este motivo las tecnologías que la hacen posible la web actual han tenido una gran evolución para garantizar la facilidad de su uso. Sin embargo, la cantidad de información que se pueda encontrar en Internet se ha convertido en algo incalculable, por lo cual los motores de búsquedas se han visto obligados a cambiar la forma en la que se recupera dicha información.


Big Data


Características de la Web Actual:

Heterogénea: Existen múltiples organizaciones que generan datos de forma independiente y por tanto con formatos y estructura diferente

Masiva: La cantidad de información existente es enorme y sigue creciendo

Voluble: Cada día es publicada y borrada una cantidad enorme de información. Esta información cambia muy rápido y cada vez más gracias a las redes sociales

Humana: En general, la información esta estructurada para personas y solo puede ser interpretada y comprendida correctamente por una persona .

¿Cómo sabe un computador interpretar toda esta información



Soluciones a la web actual


En la web actual existe una enorme cantidad de información heterogénea como pueden ser datos de carácter general, datos médicos, noticias, datos gubernamentales, información de redes sociales, …

Una posibilidad sería leyendo el código html de cada página, pero esta información no está correctamente estructurada y mezcla contenido con código lo que dificulta la tarea.

Los computadores tienen capacidad para analizar grandes volúmenes de datos
Los computadores no son capaces de interpretar la información adecuadamente debido a que las páginas que contienen esta información están pensadas para personas

¿Qué debe tener una Web de datos efectiva?

  1. Lenguaje que permita especificar recursos en la web y las relaciones entre ellos.
  2. Lenguaje que sea procesable por un computador.
  3. Otro Lenguaje debe permitir realizar consultas que sean procesadas por un computador.
  4. Debemos obtener conclusiones de los datos de manera automática.


La Web Semántica es una extensión de la web actual en la cual se da un significado bien definido a la información permitiendo mejorar la colaboración entre personas y computadores

Evolución desde la web 1.0 hasta la web semántica


La Web semántica es un conjunto de recomendaciones desarrolladas por el W3C cuyo objetivo es que los computadores sean capaces de entender la información disponible en la Web.

Nota:
  • W3C es el World Wide Web Consortium, es decir, es el organismo encargado de regular la Web.
  • Un recomendación es una descripción formal de una tecnología que debería ser usada por todos de manera estándar.

A continuación podemos ver el conjunto de estándares definidos por el W3C para la Web semántica


Diagrama de estándares definidos por el W3C para la web semántica

URI es un identificador universal de un recurso en la web

RDFo Resource Description Framework es un lenguaje que permite modelar los datos que identifican los recursos en la web y definir las relaciones que entre ellos.

RDFS o RDFSchema es un vocabulario extendido de RDF que permite describir las clases de los recursos RDF las propiedades y las instancias o tipos de esos recursos

SPARQL es el lenguaje de consulta utilizado para obtener la información de un modelo de datos RDF

OWL o Web OntologyLanguage es el lenguaje de ontologías de la web semántica que extiende el vocabulario RDFS para conseguir definir un modelo de datos más detallado añadiendo nuevas restricciones






No hay comentarios:

Publicar un comentario

Entradas populares