 Arriba la imagen original, abajo, con el texto en inglés superpuesto. |
Traduciendo lo cotidiano a distanciaInventado por necesidad propia, este aparatito permite sacar fotos y traducir los textos que salen en las mismas. Una herramienta de supervivencia para los que viajan a países con idiomas muy distintos.El Dr. Haritaoglu trabaja en el Almaden Research Center de IBM, y es viajero frecuente por motivos de trabajo. Como la mayoría de las veces no conoce el idioma local, siempre tuvo dificultades para entender lo que pasaba a su alrededor. Pobre, no entendía ni mu, y no hablamos de leer una enciclopedia o el diario, sino que no entendía los nombres de las calles, el menú del restaurante, en fin, las cosas de todos los días. Con los recursos de uno de los centros de investigación del gigante IBM y por sobre todo de su propia materia gris supo encontrar la solución. Desarrolló un sistema por el que con su computadora de mano saca una foto del cartel o texto y la transmite a un servidor, donde un software especialmente desarrollado identifica y traduce el texto, y reenvía a su computadora de mano el texto traducido al inglés, donde es superpuesto en el lugar adecuado de la foto. De esta manera, el Dr. Haritaoglu puede apuntar a un cartel en la calle y luego de 10 ó 15 segundos saber qué dice ese cartel. ¿Ciencia ficción? No, el Infoscope es tan real como la crisis argentina, si me perdonan el mal ejemplo. Esta tecnología no apunta a traducir textos largos, ni necesariamente a traducirlos con corrección gramatical, pero permite entender textos de tres o cuatro líneas.  El Dr. Ismail Haritaoglu, el padre de la criatura. |
El prototipo que construyó el Dr. Haritaoglu se basa en una cámara digital común conectada a una computadora de mano, que a su vez se comunica a través de un celular común. Como se ve, nada de tecnología tipo James Bond, solamente hardware como el que se puede comprar en los negocios. Si el secreto no está en el hard, obviamente se encuentra en el software. El conjunto es un ejemplo de "realidad aumentada", la que puede dar otros tipos de información además de traducciones. Si le conectáramos un GPS, podríamos sacar una foto de un edificio y superponerle su ubicación en un mapa de la ciudad, o (Orwell mediante) tener una lista de las personas que trabajan en ese edificio. El proceso de traducción comienza aislando las palabras que el usuario desea traducir, para lo que se debe distinguir entre el fondo de la imagen y el texto. Para eso el usuario selecciona la parte del texto, del mismo modo como haría con un programa de tratamiento de imágenes. Esta imagen seleccionada es comprimida y enviada al servidor, que se ocupa del procesamiento de la imagen, del reconocimiento óptico de caracteres y de la traducción del idioma fuente (chino, francés, italiano, español o alemán) al idioma destino (siempre inglés por el momento).  Parecen inocentes anteojos de sol, pero sacan fotos, leen textos, traducen... |
El Dr. Haritaoglu ya tuvo más de una sorpresa ensayando su prototipo. La primera fue una caja etiquetada en chino con un texto que resultó ser "Compre una, la segunda va de regalo." Pero dejando de lado los chistes, ya son numerosos los grupos de investigadores que levantaron el guante y en poco tiempo se dedicaron a la investigación de temas relacionados. Pero el Dr. Haritaoglu tampoco se cruzó de brazos. Junto a su jefe, el Dr. Dan Russell, gerente de interacciones hombre-computador de Almadén, ya desarrolló otro prototipo, que al principio parece un simple par de anteojos de sol. Pero no, es un aparato que se basa en el anterior pero que traduce textos escritos en japonés y devuelve la traducción al inglés como audio a través de pequeños auriculares ubicados en la patilla del anteojo.
|