Optimización de Búsqueda 4 Meses Después

General

Ya casi me había olvidado de este pequeño juego/experimiento. Hoy me lo recordó un comentario en el post y me fui directo a Google a ver cómo andaba todo. Y como verán, funciona perfectamente.

¿De qué se trata? se preguntarán. Pues bien, hace casi cuatro meses escribí un post tituladoOptimización de Búsqueda, No de Motores de Búsqueda para probar y demostrar el comportamiento de los buscadores, en particular Google. La idea era simple, escribí sobrecómo podemos modelar el contenido para mejorar los resultados de búsqueda. Pero aquí no me refiero a cómo engañarlos para obtener mejores posiciones, sino a cómo guiar a los indexadores para que reconozcan con mayor precisión el contenido y puedan calificarlo apropiadamente. Es decir, no optimizar el contenido para sacar ventajas de un buscador y su funcionamiento maliciosamente, sino optimizar el contenido para asegurar que sea indexado correctamente y de ese modo sea encontrado en un contexto relevante.

optimizacion-busqueda

Google muestra la página del experimento en el primer lugar de los resultados para los términos optimización de búsqueda.

Las claves del experimiento eran utilizar repetidamente los términos más relevantes y variaciones del mismo: buscar, buscador, búsqueda, buscando, buscarán junto con Google,Yahoo, MSN, entre otros. Estas palabras claves fueron utilizadas en puntos importantes como el título de la página. Además, se utilizaron discretamente algunos vínculos a páginas externas con temas relacionados, para respaldar el contenido.

Finalmente, y pese a que sólo unos pocos se animaron a comentar (lo que ciertamente hubiera aumentado las posibilidades de mejorar los resultados), la página es el primer resultado retornado por Google en una búsqueda general para los términos optimización de búsqueda, sin indicar idioma, es decir, en todo el universo de páginas indexadas por Google. Sí, primer resultado retornado entre 658.000 encontrados. Impresionante, ¿no? Pese a que el ejercicio estaba orientado a Google, Yahoo también responde a patrones similares, y califica la página en el lugar 13, nada mal. MSN por su parte parece no calificar las cosas del mismo modo, porque ni siquiera pude encontrar la posición en que aparece. Como no estamos hablando de una técnica en particular, sino de cómo construir el contenido para facilitar el trabajo de los buscadores, esto no habla muy bien de MSN.

Conclusión: es muy relevante preocuparse de utilizar los términos apropiados, repetirlos en lugares importantes como el título de la página, los encabezados h1, h2, etc. y validar el contenido con vínculos externos relevantes.

Analfabetismo y Sistemas Interactivos

General

Hoy tuve una de esas experiencias que te toman de la mano y te aterrizan a una realidad que a veces nos elude. Estaba en un cajero automático, ATM o como quieras llamarlo, y a unos tres metros observé a una persona, un hombre relativamente joven, con un aspecto que evidenciaba su falta de recursos. Estaba en una actitud que no era para nada intimidante, pero me llamó la atención.

Cuando terminamos la operación (con Are, mi esposa), nos alejamos del cajero, pero este personaje se me acercó y me pidió ayuda. ¿Me puede ayudar a usar la tarjeta?. Claro, fue más señas y gestos que una frase elaborada. Asumiendo que estábamos en un lugar público, abierto, con algunas personas alrededor y un par de guardias a la vista, accedí. Me pasó su tarjeta. Este simple gesto describe todo el escenario. Este hombre, probablemente un campesino pobre, con toda ingenuidad le pasó a un desconocido su tarjeta para utilizar el cajero automático. Si le pido su clave, seguro me la hubiera dado.

Su actitud era de completo temor al aparato que tenía en frente. Le devolví su tarjeta y lo guié mientras él realizaba la operación, pese a que me pidió que lo hiciera yo para el observar y aprender. Esto me dejó en claro que su nivel de alfabetización era mínimo, apenas podía leer. Quería sacar $10.000, unos U$18 ó €15.

En cada pantalla nueva del cajero su desconcierto era mayor. Sumemos a su condición, el que el dispositivo no tenía alineadas correctamente las opciones de la pantalla con los botones que se encuentran al costado para realizar las selecciones. Esto provocó un par de intentos erróneos en que cualquier persona se hubiera equivocado.

Con ayuda y muchas dudas, logró terminar la transacción.

La situación completa me hizo pensar en muchas cosas, desde la brecha cultural, la famosa brecha digital y el diseño de interfaces para públicos tan disímiles como este extremo, que de seguro es el denominador mínimo al momento de desarrollar una interfaz para usuarios sin discapacidades particulares. Pero claro, planteado así, el analfabetismo es una discapacidad.

Cómo no va a ser un tipo de discapacidad, inmediatamente recordé una situación similar cuando tenía unos 12 años, y una señora mayor me pidió que le ayudara a encontrar el bus del recorrido que necesitaba. Evidentemente no sabía leer. Y en otra oportunidad en que una abuela me pidió que le marcara un número en un teléfono público. Estas situaciones acá son aisladas, Chile es un país con un nivel de analfabetismo bajísimo, 4.4%. Pero son los casos extremos, entre medio hay muchos matices.

Pues bien, esto me hizo ver con otros ojos un proyecto en el que estoy participando que involucra como público objetivo a personas desde el nivel del personaje del cajero automático, hasta personas más preparadas, pero de todos modos de un nivel sociocultural bajo, sin acceso directo al mundo digital. En una situación como ésta, todo lo que damos por sentado hay que cuestionarlo, todo es nuevo, nada es una convención. ¡Vaya desafío de interacción!

Usabilidad de Universidades Españolas

General

Me enteré ayer de la publicación de los resultados de un estudio de las páginas de inicio de las Universidades Españolas. El proyecto está organizado por AIPO, Asociación Interacción Persona Ordenador. El proyecto se coordinó mediante un blog, USABAIPO, Proyecto Usabilidad Páginas Web Universidades Españolas. Revisando los resultados y metodología usados, me surgieron algunos conflictos. Aquí va mi comentario, realizado con el mejor de los espíritus y entendiendo que éste es un esfuerzo notable.

Introducción

El proyecto USABIPO se planteó analizar las páginas de inicio de 69 universidades españolas. Sé personalmente que esto es un esfuerzo monumental. Durante el primer semestre de este año participé en un estudio encargado por el Ministerio de Economía del Gobierno de Chile para analizar la usabilidad de los trámites en línea del Estado chileno. Mi rol en este estudio fue particularmente la planificación, coordinación y ejecución de las evaluaciones heurísticas de 61 trámites, en el que participaron tres evaluadores junto a mí como evaluador y responsable de esa parte del estudio. El proceso fue notable y, aparte de los inevitables problemas de tiempo y recursos de un proyecto como éste, me siento muy satisfecho de haber participado en él.

Pues bien, comento esto para dejar en claro que entiendo el esfuerzo que el proyecto USABIPO implica y lo valoro en ese sentido. Pero como mencioné antes, hay algunos aspectos metodológicos que me sorprendieron, y que paso a comentar como aporte y crítica constructiva.

Metodología

USABIPO plantea el tema de la metodología del siguiente modo:

Se efectuó una evaluación por inspección a través de la aplicación de tres métodos diferentes ampliamente consensuados dentro del ámbito de la IPO:

  • Inspección de estándares
  • Análisis de zonas de la interfaz
  • Evaluación heurística

Inspección de Estándares

Nadie podría decir que los estándares web no me preocupan, pero no creo que deberían ser una parte fundamental de un estudio de usabilidad. Puede ser un complemento, un factor más, pero no una parte del estudio, porque el uso de estándares no garantiza usabilidad. Es cierto que es más posible que un sitio basado en estándares web sea más usable y accesible, pero no es una condición automáticamente adquirida.

Por otro lado, creo que hacer una validación automatizada es sólo una parte: así como ya lo hemos discutido muchas veces respecto a la accesibilidad, las validaciones automatizadas no son suficientes en sí mismas. Es cierto que validar CSS y HTML es más fácil que validar accesibilidad, porque los primeros se basan en las reglas predefinidas de un vocabulario conocido, donde la interpretación es menor. Pero un sitio válidamente formado no es lo mismo que un contenido semánticamente estructurado. Creo que esto último no lo cumple el estudio de USABIPO.

Análisis de Zonas de la Interfaz

Creo que es interesante lo que se ha hecho en esta área, pero me parece que se han entregado sólo datos y no información. Para mejorar un sitio, o la portada de un sitio, no me sirve que se identifique cómo está compuesta mi página, sino que se me entreguen pautas para mejorarla.

Evaluación Heurística

Por mi experiencia es aquí donde tengo más observaciones. El primer detalle que me llamó la atención es algo que pudiera parecer menor, pero que creo que metodológicamente puede tener repercusiones en los resultados: la redacción de las pautas heurísticas no es consistente y no representa criterios positivos. En algunos casos el criterio no queda claramente explicado. Esto puede llevar a inexactitudes al momento de la evaluación, porque es posible que los evaluadores interpreten de modo distinto las pautas.

Con lo anterior me refiero a que las pautas deberían estar compuestas por criterios positivos, cosas que el sitio o sujeto de estudio debería cumplir. Una heurística, entonces, debería ser un listado de pautas que se conocen como buenas prácticas de usabilidad. Si se desea incluir un problema frecuente a una heurística, es mejor transformarlo en algo positivo, por ejemplo, la tercera pauta del criterio Navegación de la heurística de USABIPO dice:

¿Se utilizan instrucciones genéricas (Ej. “Haga clic aquí”) o vínculos genéricos? (Ej. “Más”)?

La redacción es sumamente ambigua, y no es claro si el sitio debe cumplir o no con este criterio. Si respondo que sí, estoy afirmando que hace uso de una mala práctica. Si respondo que no estoy diciendo que el sitio no lo hace, lo que es correcto. Confuso. Quedaría mucho mejor planteada así:

El sitio utiliza vínculos en contexto, con un contenido descriptivo, en lugar de usar instrucciones genéricas (Ej. “Haga clic aquí”) o vínculos genéricos (Ej. “Más”)

Esto se aprecia en varias preguntas, por ejemplo:

¿Se utilizan las ventanas emergentes para dar información importante del sitio Web?

es ambigua respecto de si el uso de ventanas emergentes es bueno o malo. Entiendo que el sistema de puntuación trata de enfrentar esto, pero creo que es mucho más simple calificar usando una escala de 5 puntos y un no aplica.

Finalmente, la presentación de los resultados de la evaluación heurística me resulta sorprendentemente simple. No basta con un gráfico para saber cómo salí en la evaluación, necesito feedback detallado para saber cómo soluciono cada uno de los puntos en que fallé. Espero, e imagino de buena fe que así habrá sido, que a cada una de las universidades se les habrá entregado un resultado más detallado de estas evaluaciones.

Conclusiones

Reitero mi reconocimiento por el esfuerzo realizado, pero debo concluir con una visión un tanto negativa respecto a los resultados: creo que existen algunos problemas metodológicos y que hace falta una retroalimentación mucho más rica que permita conocer los problemas reales y detallados, junto con una orientación respecto a la forma de enfrentar los problemas observados.

Captchas y Accesibilidad

General

Un problema frecuente en las aplicaciones web abiertas al público es el de los scripts automatizados que tratan de explotar algunas de sus caraterísticas para propósitos diversos, normalmente ilegítimos. Desde los robots que ingresan comentarios spam a los blogs por miles, hasta aquéllos que intentan abusar de los servicios de correo como MSN, Yahoo! y más recientemente Gmail, el factor común es que se trata de scripts o programas relativamente pequeños que se diseñan para abusar específicamente de ciertos sistemas.

Los spammers de blogs apuntan en particular a los comentarios, normalmente abiertos al público, para dejar vínculos que pretenden sacar partido de los buscadores que valoran positivamente la cantidad de referencias a un sitio. Los wikis, con su esencial característica de edición colectiva, son vulnerables también a estos problemas.

Una forma específica de enfrentar el problema, es utilizar un mecanismo que permita garantizar que quien realiza una acción es un humano y no un robot programado. La técnica más común es el uso de imágenes distorsionadas que para los humanos resultan relativamente simples de leer, pero que para un programa es muy difícil procesar. Estas imágenes son conocidas como captchas.

Captchas

Captcha

Ejemplo de una imagen captcha (imagen de dominio público, publicada en Wikipedia).

Partamos por la definición del nombre: éste es una abreviación de Completely Automated Public Turing Tests to Tell Computers and Humans Apart, algo así como Prueba Turing Pública Completamente Automatizada para Diferenciar Humanos y Máquinas y fue acuñada por un equipo de IBM en el año 2000.

Esta técnica, desarrollada originalmente por AltaVista en 1997, busca distinguir claramente a un humano de un proceso programático, mediante el uso de imágenes distorsionadas de un modo que haga imposible el que sean leídas por algo que no sea un humano. Quien esté familiarizado con los escáneres de imágenes, probablemente conocerá también la tecnologíaOCR, Optical Character Recognition, que permite escanear páginas de texto como imágenes y transformarlas a texto. La tecnología OCR permite reconocer caracteres desde imágenes mediante análisis de inteligencia artificial, y demuestra que si bien se puede programar un sitema para que reconozca imágenes, deben existir ciertas condiciones para que el reconocimiento de los caracteres sea más fácil. Por lo mismo, los captchas distorsionan la imagen de un modo que hace imposible que que las tecnologías OCR actuales identifiquen su significado. Algunas de las técnicas para ocultar el texto en la imagen son el uso de tipografías poco usuales, distorsionadas, irregulares, junto con diferentes colores y elementos de ruido visual. Vale hacer notar que con un esfuerzo considerable es posible programar sisteas que sean capaces de leer captchas, pero normalmente el costo de esto es muy alto.

La técnica completa de los captchas consiste en presentar una imagen al usuario y solicitarle que ingrese el texto que reconoce en ella en un campo, normalmente una mezcla de caracteres alfanuméricos, y luego se comparan ambos para verificar si coinciden. Un script automátizado no pasará la prueba, en tanto un humano sí. ¿Sí?

Accesibilidad y Captcha

La base de la técnica de captcha se basa en que los humanos podemos leer. Pues bien, la mayoría lo hace, pero no todos podemos leer. Sí, me refiero a los ciegos. Esto establece un problema de accesibilidad concreto, que de no ser corregido, significa discriminación. La buena noticia, es que los captchas no sólo se pueden realizar con imágenes, es posible también utilizar audio para entregar información que sólo será diferenciable para humanos. La técnica es similar: se presenta la grabación de una serie aleatoria de letras y números en con ruido auditivo y cierta distorsión. Lo ideal es tener ambos sistemas, captcha de imagen y de audio, para permitir que todos los usuarios puedan ciertamente pasar la prueba de discriminación de humanos y máquinas.

En el Mundo Real

En muchos casos he encontrado captchas de imagen en sitios públicos como Yahoo! o incluso más recientemente en Gmail. Pero en todos los casos se omitía el problema de accesibilidad. En Gmail parecen tener planes al respecto, porque junto a cada imagen captcha se encuentra un gráfico pequeño con el símbolo de discapacidad, aunque la solución ofrecida es actualmente bastante pobre: abre una ventana nueva usando JavaScript, la ventana tiene el mismo captcha con texto en el atributo ALT que dice algo como usted no puede ver la imagen porque las tiene desactivadas en el navegado. Cómico, si lo quieres tomar con humor.

cap-gmail-captcha-01

Gmail utiliza captchas en su proceso de recuperación de claves perdidas.

cap-yahool-captcha-01

El registro de nuevos usuarios de Yahoo! hace uso de captchas.

Sin embargo, hace uns días me llevé una sorpresa, que fue la que me motivó a escribir este ya extenso post: en MSN utilizan captchas de imagen y audio. Las siguientes imágenes muestran parte del proceso de creación de nueva cuenta y al final hay un ejemplo del captcha de audio.

cap-msn-captcha-03

MSN utiliza captchas en el proceso de creación de nuevas cuentas de usuarios. A la derecha del captcha de imagen, se pude observar un ícono de sonido, que permite acceder a un captcha de audio para aquellos usuarios que lo necesiten.

cap-msn-captcha-02

Al seleccionar el ícono de audio, MSN presenta un botón que permite oir un captcha sonoro.

El captcha de audio presentado por MSN es una lectura distorsionada de una serie de números que se oye así (WAV, 64Kb.). Vale hacer notar también que la grabación del captcha se presenta en castellano, como corresponde a un sitio mulilingüe.

Nota: El audio se presenta sólo para efectos ilustrativos, y cumplo con señalar que es de propiedad de MSN.

Más Información

Si el tema te interesa, te recomiendo algunos lugares para buscar más información sobrecaptchas: