¿Qué es la publicación semántica dinámica?

La publicación semántica o la publicación semántica dinámica se refiere a la publicación de documentos en línea junto con los metadatos vinculados que los describen.

Agregar metadatos legibles por máquina ayuda a los rastreadores y agentes de software a comprender el significado , la estructura y el contexto de una información.

Fue en 2001 cuando Tim Berners-Lee en una publicación de Scientific American que más tarde se convirtió en un hito para la industria de la Web introdujo por primera vez el término Web Semántica.

La Web Semántica aportará estructura al contenido significativo de las páginas web, creando un entorno en el que los agentes de software que se desplazan de una página a otra pueden realizar fácilmente tareas sofisticadas para los usuarios [… ..]. La Web Semántica no es una Web separada, sino una extensión de la actual, en la que la información tiene un significado bien definido, que permite que las computadoras y las personas trabajen mejor en cooperación.

Las limitaciones de la Web como una colección de documentos y enlaces se conocen desde hace bastante tiempo. Las páginas web se diseñaron originalmente para mostrar información para humanos y tenían poca o ninguna información para ayudar a las máquinas a procesar, filtrar y organizar esta información. Los hipervínculos se concibieron originalmente como vías libres de un documento a otro sin requerir ninguna lógica específica y / o aprobación de la parte vinculada.

La Web Semántica aborda estas inquietudes y amplía la World Wide Web al hacer que la información sea legible por máquina , especificando la procedencia y permitiendo que los agentes de software realicen automáticamente tareas complejas como minería de texto, categorización y búsqueda.

Los hipervínculos son una característica esencial de la World Wide Web, pero no tienen sentido sobre por qué están conectadas dos páginas. Una máquina al analizar un hipervínculo solo puede ver que la primera página está promocionando la segunda y está usando una palabra clave específica para habilitar el enlace. No hay forma de que la máquina pueda comprender por qué ese enlace fue creado y por quién. La Web es un gran gráfico de páginas conectadas hechas de enlaces no especificados.

En la Web Semántica, cada nodo tiene un identificador único y la relación con los otros nodos ayuda a las computadoras a comprender el significado y la estructura del contenido. En la publicación web semántica , los nodos están representados por conceptos o entidades centrales que están conectados de manera inequívoca con definiciones compartidas, accesibles para todos en Internet.

Las entidades se almacenan públicamente en la Web utilizando un conjunto de mejores prácticas. para publicar y conectar datos estructurados conocidos como datos vinculados . Linked Data da derecho a varias técnicas para ayudar a la máquina a analizar contenido, indexarlo y recuperar respuestas para los usuarios.

En la publicación semántica, los metadatos que describen un contenido se almacenan utilizando datos vinculados.

¿Cómo funciona la publicación semántica?

Hay tres componentes principales en una arquitectura editorial semántica:

  • Procesamiento natural del lenguaje. La tecnología requerida para extraer información de un texto escrito usando lenguaje natural.
  • Una base de datos gráfica. Este es el repositorio de toda la información semántica. Típicamente estructuradas en un gráfico (almacén triple), las bases de datos utilizan tecnologías de datos vinculadas y almacenan información en triples (una estructura de datos compuesta de tres componentes: el sujeto, que es una referencia URI o un nodo en blanco, el predicado, que es una referencia URI y el objeto, que es una referencia de URI, un nodo literal o en blanco)
  • Un motor de descubrimiento de contenido. Esto proporciona los datos a los widgets de descubrimiento y a los motores de búsqueda para ayudar a los usuarios a encontrar el contenido que desean leer.

– Vea más en: Publicación semántica en pocas palabras: una introducción rápida del sitio web de WordLift

la frase “publicación semántica dinámica” probablemente fue acuñada por primera vez por la BBC para describir su plataforma de publicación basada en metadatos

En resumen, las nuevas características de la plataforma de publicación son:

  • gran parte del contenido se genera automáticamente en función de los metadatos almacenados en la base de datos RDF, es decir, una consulta SPARQL sobre un tema obtendrá los metadatos agregados relevantes para el contenido de la página web (a diferencia de las páginas web creadas manualmente)
  • El modelo de dominio subyacente es una ontología (a diferencia de un esquema relacional)
  • El análisis de texto automatizado se utiliza para el contenido escrito por el periodista (blogs, artículos de noticias) para que las etiquetas y los temas se extraigan y almacenen como metadatos para el artículo en la base de datos RDF
  • los datos de fuentes de datos adicionales también están RDF-ized y se almacenan en el repositorio de metadatos (base de datos RDF)
  • La inferencia de nuevos hechos deriva metadatos adicionales en la base de datos RDF (con respecto a la semántica RDF u OWL)
  • el contenido (periodista creado o generado dinámicamente) se enriquece con datos externos de la nube Linked Open Data (DBpedia, Freebase, etc.)

la BBC utilizó una plataforma de publicación semántica tan dinámica para su sitio web de la Copa Mundial de 2010, y probablemente usará una versión mejorada para los Juegos Olímpicos de 2012.

para obtener explicaciones detalladas de la plataforma, puede consultar los blogs de la BBC sobre la Copa Mundial 2010 [1] y [2], así como el capítulo sobre “Uso de las tecnologías de SemanticWeb en los sitios web de la BBC” del libro ” Vinculación de datos empresariales ” [3]
En la European Semantic Technology Conference 2010 tuve una presentación sobre la base de datos RDF utilizada en esta plataforma de publicación semántica dinámica particular, puede consultarla en [4] ( descargo de responsabilidad : trabajo para la empresa que desarrolla la base de datos)

[1] http://www.bbc.co.uk/blogs/bbcin
[2] http://www.bbc.co.uk/blogs/bbcin
[3] http://www.amazon.com/Linking-En
[4] http://www.slideshare.net/ontote

More Interesting

¿Cuál es el futuro de la publicación?

Tengo fantasías constantes de que mi novela sea un clásico instantáneo. Siento que esto me está preparando para el fracaso. ¿Cómo puedo controlar esto?

¿Cómo adquirir los derechos de autor de un libro antes de que esté completamente escrito? ¿Cuál sería el mejor enfoque sin un abogado?

Para ser el mejor escritor del planeta, ¿qué criterio debería cumplirse?

Después de que alguien publica por su cuenta un libro sobre CreateSpace, ¿cómo puede dejar que su banco y su estado sepan que está recaudando este dinero?

¿Dónde vas a encontrar agentes cuando te embarcas en tu viaje para ser publicado, y cuál es la mejor manera de encontrar agentes literarios?

Como autor, ¿es mejor ir con un editor que publicó mis competidores directos o uno que no lo ha hecho?

¿Cuál es el procedimiento de autoedición de libros en Pakistán?

¿Cuál es la mejor manera de lanzar una exitosa campaña de recaudación de fondos para publicar una novela?

Autores publicados: mirando hacia atrás en sus trabajos publicados, ¿cuál reescribiría / revisaría (en su totalidad o en parte) y por qué? ¿Cómo has crecido como autor?

Como editor de una (muy) pequeña prensa con un presupuesto limitado, ¿cuáles son algunas formas creativas y económicas de informar a la gente sobre nuevas novelas?

¿Cómo publico un libro en India?

¿Cuáles son las tarifas estándar para publicar un libro?

¿Cómo te publicaste por primera vez?

¿Por qué algunos profesores publican sus libros en una prensa universitaria diferente?