Busqueda de video online
21 Oct
El vídeo llegó a Internet, la aparición de plataformas 2.0 como My Space y Youtube en el 2005, donde los usuarios pudieran colgar sus videos y su gran expansión, convirtieron el video en un formato común en la red, ahora mismo el ancho de banda consumido por el video, supone un 20 % del trafico total de Internet. Y al igual que la información escrita o los formatos gráficos eran necesarias herramientas para que el común de los mortales pudiese manejar, seleccionar, categorizar y buscar el contenido deseado. A dia de hoy, Youtube supera en trafico de busquedas a Yahoo. Se adaptaron los motores de busqueda y se desarrollaron estandars de categorización y etiquetado de las piezas para poder buscar sobre los metadatos que definian el contenido y la categoria de estas (p.e. mpeg7). El problema de este método es que las tags y categorias asignadas dependian de la pericia y capacidad de análisis de quien las asignaba, y esto en la era del UCG (user content generated), con la democratización de la información, creció la cantidad de publicaciones pero no necesariamente la calidad de estas.
El siguiente paso fue implementar tecnologías que pudiesen corregir o precisar los metadatos (externos todavía) que definen el contenido audiovisual, asi nacen motores de busqueda como Blinknx (anuncia tener indexadas 26 millones de horas de video) o EveryZing que introducen tecnologías de “speech to text” con objeto de analizar la relevancia, de la categorización y las tags que definen la pieza. ¿Los problemas de este modelo de busqueda? El sistema no es capaz de convertir el ruido del vuelo de un avión en una cadena de caracteres que le indique que es un avión volando y piezas sin mayor importancia pero con gran audiencia, vease los videos “meme” de mentos+diet coke (siete millones y medio de reproducciones), en las que el audio no aporta información alguna que sirva para para definir el contenido de la pieza.
Pero los motores de busqueda tenian que abandonar el modelo tradicional de analizar el elemento en cuestión, anteriormente una cadena de caracteres y sus metadatos, que en el caso de las palabras eran las tags y categorias que ayudaban a interpretarlas semánticamente. Había que mirar dentro del archivo y conseguir analizar la imagen para identificar lo que describe. Esta tecnología comienza a aparecer ahora, porque habia que desarrollarla, por el necesario uso de la lógica borrosa para el análisis de las imágenes o por la capacidad de proceso necesaria para analizar la imagen y compararla contra modelos establecidos (es la aparición de los modelos de proceso distribuido “grid” o “cloud” lo que permite lograr tal capacidad de análisis). Exponente de esta tecnología es el buscador de video VideoSurf, apoyado en “multigrid fast computation”, indexa a día de hoy 10 billones de piezas de video (con una duración media de tres minutos por video y entendiendo que en los Estados Unidos un billón son mil millones, nos da unos 500 millones de horas de video indexadas. ¿El futuro? Una mayor precisión en las busquedas, mayor velocidad, sistemas de indexación/categorización que quedarán en el camino si ya no es necesaria la adición de datos externos para definir el contenido del archivo. Y en cuanto a VideoSurf, considerando que que Google es dueño de Youtube (y este es el primer frontal de busqueda de video de Internet), que la busqueda de videos de “Saint Google” siempre se ha considerado como una eterna pseudoßeta y que los fundadores de VideoSurf ya tienen experiencia en la venta de tecnologias/servicios a los grandes de internet, solo habrá que ver si se establece como buscador independiente o acaba integrado detras de la blanca portada de Google.

No comments yet