Ciencia y Desarrollo
Julio-agosto 2011 Inicio Ligas de interés Artículos de interés Suscripciones
Cada mes
Editorial
Ciencia en México
Ciencia en el mundo
Entrevista
La ciencia y sus rivales
Tecnoinformación
Centros Conacyt
Actualidades
Reportaje
Testigos de una historia
Productos de la ciencia
Reseñas
Portada
Julio-agosto 2011
Hélix
Tecnoinformación REYNA CAROLINA MEDINA RAMÍREZ*
¿Web semántica?
Tecnoinformación

El objetivo de la web semántica es llenar la red de de significados, antes que de palabras

Imaginemos Internet como una enorme biblioteca llena de información. Sus pasillos guardan estantes repletos; sus escaleras, sótanos, anexos y cuartos secretos son infinitos y sus caminos retorcidos. Una vida humana no alcanza a recorrer dicha biblioteca, no digamos leer toda la información.

Sin embargo, para tratar de resolver este problema existe una serie de bibliotecarios capaces de localizar cualquier fragmento de información que se les solicite en cualquier libro, en cualquier estante, en cualquier piso. Así, si nosotros preguntamos a un bibliotecario-buscador la palabra "perro", él nos dirá al instante en dónde se encuentra escrita y en cada libro en la que aparece. Aunque estos buscadores son de gran ayuda, no resuelven el problema del todo; pues la palabra "perro" aparece en todos los contextos imaginables, incluso en aquellos que no son relevantes para nuestra búsqueda. Por ejemplo, digamos que necesitamos saber sobre la anatomía del perro; luego de la búsqueda, tendríamos que descartar indicaciones impertinentes del bibliotecario-buscador, tales como una novela en la que a un personaje le llaman "perro" o una asociación Protectora de Especies Raras, Robustas y Omnívoras cuyas siglas son P.E.R.R.O, entre muchas otras cosas. "Entonces, mejor preguntar por 'perro+anatomía'", se me dirá. Ojalá fuera tan simple: la biblioteca es tan inmensa, que no importa cuánto especifique mi solicitud, pues habrá miles de resultados que no son relevantes y, por el contrario, son falsos u ociosos.

Esta biblioteca, pues, es un logro incalculable, pero la información que contiene es tanta, y tan diversa, que su funcionalidad es limitada. Ahora bien, supongamos que de pronto se implementa una nueva política en la biblioteca: "de ahora en adelante", se dice, "los libros se ordenarán, los estantes ya no serán arbitrarios, los pisos no contendrán cualquier tipo de información". Sin duda, este proyecto sería un gran avance para los que consultan la biblioteca. Las búsquedas se simplifican, pues si yo pregunto por la "anatomía del perro", el bibliotecario-buscador sabrá que no debe mandarme al piso de literatura ni al estante de pediatría.

Este cambio tan radical implica que el orden de los libros tiene una estructura identificable y concreta, que el bibliotecario-buscador puede entender lo que digo, no sólo en términos literales, sino en el significado de mis búsquedas. Si este sistema se implementa, la biblioteca potenciará su beneficio muchas veces, y pasaría de ser un almacén de información confusa a un edificio ordenado con acceso a cada segmento de conocimiento que queramos alcanzar.

En pocas palabras, ésta es la propuesta de la Web semántica o Web 3.0.

Desde sus inicios, la Web se proponía abrir un espacio creativo para compartir información y crear un lenguaje común. Sin embargo, la tecnología actual no permite que dicho objetivo se lleve a cabo por completo.

El estado actual (denominado Web sintáctica o Web 2.0) está basado en datos o en información en bruto. Las dimensiones que ha alcanzado hacen difícil el acceso a la información de manera precisa, pues utilizar un motor de búsqueda genera montones de datos que no corresponden con lo que queremos hallar y, además, éstos no siempre se encuentran estructurados de modo claro.

Para resolver este problema, la Web semántica se propone ser una Web extendida que genere categorías en la información, con las cuales la red se intercomunica, y que la disposición de ellas sea más efectiva. Estas categorías son llamadas anotaciones, es decir, datos que se encuentran en un nivel diferente respecto al resto de la información.

La caracterización de los sitios y la información a partir de estructuras de este tipo es lo que en informática se llama ontología. En concreto, una ontología no es una etiqueta, sino un conjunto de anotaciones que semánticamente describen un área del conocimiento. Las ontologías están pensadas para ser entendidas tanto por usuarios humanos como por computadoras, es decir, van más allá del lenguaje.

En términos de una gran bibliotecavirtual, una ontología sería el orden reconocible en el que están los libros: una estructura, pues, que guarda significado, y que puede ser expresada en cualquier lengua. Las anotaciones serían los nombres de los estantes que acompañan cada parte de dicha estructura. No se trata de poner etiquetas, propiamente, sino de construir estructuras que reconozcan las categorías en un lenguaje universal, pleno de significado. En suma, se trata de llenar la red de semántica de significados, antes que de palabras. Con ello, no sólo la comunicación entre usuario y máquina se mejora, sino también la existente entre máquina y máquina, mediante la construcción de lenguajes informáticos que soporten dichas ontologías y puedan ser traducibles a cualquier lengua natural. Es decir, nuestras búsquedas pueden ser hechas en español, francés o japonés, y siempre tendremos información pertinente expresada en diversos idiomas.

Para terminar, hay que mencionar que la Web semántica es muy prometedora dentro del campo de las ciencias computacionales y que el interés en ella es muy grande. Ahora cabe preguntarnos con los nuevos desarrollos tecnológicos, ¿a dónde nos llevará la red, y qué impacto tendrá en nuestras vidas?

 
Ediciones anteriores Para publicar