EMOLTV

Iniciativa web prueba nueva herramienta de búsqueda basada en la semántica y el lenguaje

La idea de Powerset es eliminar la necesidad de buscar por palabras clave y hacerlo a través de concepto, lo que ya está probando a través de Wikipedia.

12 de Mayo de 2008 | 11:25 | Reuters

SAN FRANCISCO.– Powerset reveló ayer domingo las herramientas para buscar en Wikipedia que usan “frases conversacionales” en vez de palabras clave, dando el primer paso en su desafío de desafiar a los servicios de búsqueda tradicionales como Google.

La tecnología de Powerset  desarma el significado de las palabras y frases en conceptos relacionados, liberando a los usuarios de necesitar siempre ingresar las palabras exactas de los que quieren encontrar.

La inciativa ofrece una manera de buscar en millones de entradas en la enciclopedia online Wikipedia, ayudando a los usuarios a encontrar respuestas detalladas a preguntas, más que links aislados que necesitan de otras búsquedas.

Por ejemplo, un usuario que quiere saber cuántas esposas tuvo el Rey Enrique VIII (seis o dos, dependiendo de su definición de matrimonio), puede encontrar una respuesta a través del servicio de Powerset en el siguiente link .

La empresa, ubicada en San Francisco, busca adelantarse a la generación actual de servicios que se basan en búsquedas de palabras clave como Google, Yahoo, Microsoft o Ask.com.

“Wikipedia se está conviertiendo en un microcosmo de las partes más útiles en la Web”, dijo Greg Stergling, un analista de Internet de la firma Sterling Market Intelligence. “Esto ofrece una manera muy poderosa de buscar lo que se está buscando”.

A pesar que aún se encuentra lejos de permitir a los usuarios buscar en toda la Red, Powerset está usando a Wikipedia para probar cómo su tecnología puede ser usada para buscar un vasto número de otros sitios web usando frases o preguntas naturales.

A través del tiempo, apunto a asociarse con otros sitios de datos de alta calidad donde la información es organizada en forma de preguntas y respuestas, donde puede usarse la tecnología de Powerset, como páginas con archivos financieros, de la CIA, o páginas “inspiradas” en Wikipedia.

Powerset busca más allá de las palabras para tratar de entender las relaciones conceptiales para acercarse más a lo que el usuario está buscando. Analiza cada oración y documentos enteros para hacerlo.

Una posibilidad es que la compañía pueda ganar dinero al vender avisos que acompañen a sus servicios de búsqueda, pero por ahora, la compañía de 60 empleados consiste casi completamente en ingenieros computacionales y linguistas. No hay un equipo de avisaje y solo algunos dedicados al marketing.

Sterling dijo que es posible que Powerset pueda buscar en la Web a la escala de Google, dentro de un par de años. Agregó que lo peligroso para este buscador sería que Powerset fuera comprado por Microsoft y lo incorporara a sus sistemas de búsqueda, los que evidentemente quiere fortalecer, en vista de la oferta que hizo para adquirir Yahoo.


Buscar conceptos, no palabras

Powerset ofrece formas muy enriquecidas de buscar dentro de las entradas de Wikipedia para encontrar conceptos relacionados. Estas ideas relacionadas, llamadas “Factz” generan sumarios y respuestas automáticas a las preguntas de los usuarios.

“Nuestro sistema es un poco más indulgente”, dijo Scott Prevost, gerente general de Powerset. “No es buscar coincidencias de palabras. No estamos buscando los términos exactos sino conceptos”.

Con el acuerdo tácito de la Fundación Wikimedia, la organización detrás de Wikipedia, Powerset dijo que tienen en sus servidores una copia de las 2.5 millones de entradas de la versión en inglés de Wikipedia. Esto permite a Powerset hacer links a través de todos los datos de Wikipedia.

“Lo que Powerset está haciendo es ofrecer a los lectores una interfaz de búsqueda natural, y creemos que ese es un experimento interesante” dijo Mike Godwin, consejero general de Wikimedia al responder sobre cómo las dos organizaciones estaban trabajando juntas.

Después de décadas de investigación y debate, un procesamiento basado en el lenguaje natural eestá finalmente listo para ser utilizado.

“2008 es el año en que las tecnologías semánticas y linguísticas cruzarán hacia el uso masivo de los consumidores”, dijo Barney Pell, co fundador de Powerset.

EL COMENTARISTA OPINA
¿Cómo puedo ser parte del Comentarista Opina?