Search

Reseña de novedades tecnológicas: Gafas Envision

Authors: Donna Clemens, consultora en tecnología de asistencia del Programa Outreach de la Escuela de Texas para las personas ciegas y con discapacidad visual (TSBVI)

Keywords: Envision, tecnología de asistencia, inteligencia artificial, IA, productos para la ceguera, productos para la baja visión, accesibilidad, empoderamiento

Abstract: La autora ofrece una reseña exhaustiva de las gafas Envision, un producto de Envision. Describe su experiencia personal con las gafas, desde el desembalaje del dispositivo hasta información detallada sobre sus funciones específicas, como el uso de la IA y la captura de información visual en tiempo real. También ofrece consejos sobre cómo usar el dispositivo para acceder tanto a la información impresa como del entorno, y da sugerencias para evitar la fatiga.

Para las personas ciegas o con discapacidad visual, usar materiales impresos y desplazarse en nuevos entornos puede resultar a menudo intimidante. Sin embargo, gracias a los revolucionarios avances de la tecnología de asistencia (TA), los espacios y los materiales impresos se están transformando en entornos más accesibles. Tuve la oportunidad de ver y probar una de estas tecnologías: las gafas Envision de Envision. 

Recibí un dispositivo elegante y con buen empaque de forma rápida y segura. Las gafas llegaron en un estuche de viaje muy bien elaborado, que me facilitó viajar con las gafas cuando no las llevaba puestas. Decidí no pedir a Envision que creara un código QR para mis conexiones en casa y conecté el dispositivo a mi teléfono y a mi red doméstica yo misma. Si le piden crear un código QR, puede que sea más rápido y se eliminan los errores de usuario. Aunque la conexión Bluetooth entre mi teléfono y las gafas tardó un poco en establecerse, fue segura y estable. No tuve ningún problema de desconexión o una conexión inestable. 

Las gafas tienen dos opciones de montura diferentes: una montura fina de titanio y la montura Lux. La montura metálica es elegante y estilizada, y el sistema óptico está montado desde la bisagra hasta la oreja, al lado derecho. Yo uso gafas y esta montura no me quedaba bien cuando me la puse, pero ese problema se puede solucionar con la montura Lux. Las Smith Optics, o monturas Lux, son monturas elegantes que vienen con lentes sin graduar que se puede cambiar por lentes graduados. Para los propósitos de este artículo, usé la montura de titanio sin mis gafas personales, así que probé el dispositivo con una agudeza visual aproximada de 20/200. 

Una vez que instalé la aplicación y conecté las monturas a mi aplicación y red WiFi, llegó el momento de explorar las funciones y ver qué podían hacer las gafas Envision. Las gafas Envision utilizan inteligencia artificial (IA) para comprender de forma exhaustiva el entorno circundante. Están equipadas con una pequeña cámara que escanea objetos, personas y texto, y transmite la información al usuario a través de un altavoz integrado (que puede conectarse por Bluetooth a unos auriculares). 

¿Algo de esto les suena familiar? Para algunos de ustedes, puede que sí. Las gafas Envision se basan en las Google Glass, que se presentaron inicialmente en 2013 como un dispositivo portátil multiusos. El carácter portátil de las gafas Envision garantiza que los usuarios puedan captar y comprender la información visual en tiempo real y sin esfuerzo. ¡Sí! En tiempo real.

Las gafas Envision narran un flujo continuo de información mediante la IA integrada, lo que permite a los usuarios leer letreros y documentos, identificar objetos y dinero, nombrar colores o analizar una escena completa. A veces esto puede resultar abrumador si las gafas están configuradas para leer todo. Hay palabras por todas partes en una escuela o en una tienda. Este asalto visual de palabras puede convertirse en un asalto auditivo, por lo que a veces puede ser útil bajar el volumen de esta función.  

Navegación: Deslizamientos, toques y voz

Las gafas Envision se han fabricado pensando en el audio. Los usuarios no tienen que utilizar un teléfono para completar los comandos. Todos los deslizamientos, toques y comandos de voz interactúan directamente con el mecanismo de las gafas. Ninguna de las interacciones requiere el uso de la visión para completarse. La interfaz de usuario de las gafas es esencialmente un conjunto de pantallas y menús. Todas las pantallas le hablan al usuario, que puede utilizar su voz, toques o deslizamientos con los dedos para navegar por ellas. 

El menú tiene tres niveles distintos. El menú principal está en el primero, el menú de activación en el segundo y el menú contextual en el tercero. Los usuarios pueden desplazarse por el menú principal deslizando un dedo hacia delante y hacia atrás. Yo formaba una “d” con los dedos en lengua de señas (hacía un círculo con los dedos y apuntaba con el dedo índice hacia arriba) y apoyaba todos los dedos en mi pómulo, menos el dedo índice, que utilizaba para hacer deslizamientos y toques. Esto redujo mi fatiga y permitió que mis acciones fueran coherentes cuando colocaba mis dedos. Las opciones más utilizadas se encuentran en el menú principal (inicio). Entre ellas se incluyen: Texto instantáneo, Escanear texto, Llamar a un aliado, Describir una escena, Reconocer moneda, Encontrar objetos, Detectar luz y Más. “Más” es en realidad un submenú que lleva a Escanear por lotes, Buscar personas, Explorar, Escanear código QR y Detectar colores. En lugar de desplazarse hasta el final del menú en busca del ajuste o la ayuda que necesitan, solo tienen que deslizar el dedo hacia atrás en la pantalla de inicio y tocar el elemento que quieran del menú cuando lo oigan. Es un concepto fácil, ¿verdad? Son los mismos movimientos básicos que se utilizan en teléfonos y tablets, solo que ahora se realizan verticalmente. Para salir o volver a la pantalla anterior, deslicen un solo dedo hacia abajo.

Gestos con dos dedos: si deslizan dos dedos hacia abajo en la pantalla de inicio se entra en el modo de suspensión, lo que resulta útil para evitar interrupciones mientras escuchan o ven. Si deslizan dos dedos por cualquier pantalla que no sea la de Ally o Aira, el volumen se ajustará al instante. Al realizar deslizamientos con dos dedos, el manual y yo coincidimos en que sujetar las gafas en el puente de la nariz permite deslizamientos más seguros.

Gestos con toques: El comando de un solo toque sirve para seleccionar, como de costumbre. Dos toques con un dedo iniciarán o activarán la aplicación actual; si se mantiene pulsado, aparecerá información adicional acerca de esa pantalla. Es como una pulsación larga cuando se usa un smartphone. Un solo toque con dos dedos permite acceder a más opciones para cualquier función. Un solo toque con dos dedos es más rápido que navegar hasta el menú de preferencias de funciones.

La función de comandos de voz se activa pulsando el botón de la bisagra y pronunciando simplemente la función que desea abrir. ¿Puede ser más sencillo? Al navegar por un menú, actualmente solo hay determinados comandos de voz disponibles. Estos comandos de voz son: Texto instantáneo, Escanear texto, Escanear por lotes, Llamar a un aliado, Llamar a un agente de Aira, Describir una escena, Detectar luz, Reconocer dinero en efectivo, Detectar colores, Encontrar un objeto, Encontrar personas, Explorar, Cambiar el volumen e Inicio. Por el momento, todos los comandos de voz solo están disponibles en inglés. Además de los comandos anteriores, un Cambio rápido permite cambiar a cualquier otra red conocida o a una red activa cercana. Esta es un área en la que Envision está añadiendo más comandos de manera activa con futuras actualizaciones.

Tutoriales en el dispositivo

El tutorial en el dispositivo es útil. Permite que los usuarios se capaciten y se acostumbren a sus nuevas gafas. La capacitación incluye orientación inteligente, introducción a los gestos y entrenamiento para practicar los gestos. Recomiendo explorar esto primero cuando empiecen a usar sus nuevas gafas.

Información detallada sobre algunas aplicaciones útiles

Texto instantáneo: El texto instantáneo es la forma más rápida de acceder a textos impresos que detecte la cámara. No es ideal para pasajes largos o para leer grandes cantidades de texto, pero sí para leer un letrero o algo breve y obtener información de manera rápida.

Escanear y Escanear por lotes: Las funciones de Escanear y Escanear por lotes toman el Texto instantáneo y añaden más funciones. Para leer un documento entero o un texto más largo y complejo, incluida la escritura a mano, utilicen Escanear texto. Se abre mediante una función de lectura que permite reproducir, pausar y navegar por el texto. El Texto instantáneo no tiene estas opciones. Esta función puede utilizarse tanto en línea como fuera de línea, lo que resulta muy práctico en un examen o en el aula. La función de Escanear por lotes se basa en la función de Escanear. Permite escanear más de un documento a la vez para leer varias páginas de una sentada. Las funciones de Escanear y Escanear por lotes también incluyen una función de detección de palabras, que permite capturar y ajustar el texto para garantizar que se incluya todo el texto. Tanto Escanear, como Escanear por lotes, son compatibles con varios idiomas para que el texto que se lee en voz alta se lea correctamente en el idioma y la voz que necesiten. Cuando la función de detección de diseño está activada, los usuarios pueden leer textos en columnas con encabezados, como estados de cuenta bancarios, libros de texto y otros documentos similares. La detección de palabras, la detección de idiomas y la detección de diseño pueden activarse y desactivarse según sea necesario. 

Escritura a mano: La función de escritura a mano es muy emocionante en estas gafas. La función de Escanear texto permite que los usuarios de Envision capturen mensajes escritos a mano, como tarjetas de cumpleaños o notas sencillas. ¡Pero es posible que esta función no funcione si la letra se parece a la de un médico!

La función Ally: Una de las características más destacadas de las gafas Envision es la función Ally, que permite a los usuarios iniciar videollamadas con amigos y familiares para solicitar ayuda. Un usuario puede iniciar una llamada y hacer que su aliado o compañero le describa lo que hay en el entorno. Esto puede permitir que los usuarios se desenvuelvan con más confianza en el entorno, utilicen equipos en una habitación sin botones táctiles (microondas, termostatos, etc.) y que, en general, se orienten en un nuevo entorno.

Agente de Aira: La función Agente de Aira se basa en la función Ally y permite que los usuarios realicen una videollamada a un agente profesional para que este intérprete visualmente el entorno o la tarea. Esta función está disponible las 24 horas al día, los 7 días a la semana.

Reconocimiento facial: La función de reconocimiento facial permite a los usuarios tomar fotos de amigos y familiares en varias posiciones (de frente, de lado, etc.) y luego guardarlas con sus nombres correspondientes. De esta manera, las gafas anunciarán de forma audible los nombres de las personas que reconozca cuando entren en el campo de visión del usuario.

Reflexiones finales

Aunque existen muchas tecnologías que han tenido un impacto positivo en nuestras vidas, las gafas Envision pretenden llevar la accesibilidad a nuevas alturas. El diseño exclusivo de las gafas ayuda a los usuarios a moverse con seguridad por el entorno al dejar libres sus manos, para que puedan sujetar un bastón o caminar con su perro guía con mayor comodidad. Además, colocar la cámara al lado de los ojos del usuario elimina la necesidad de sostener su teléfono para escanear, lo que proporciona una experiencia más fluida e intuitiva.

Envision está ampliando las capacidades de sus gafas y asociándose con otros proveedores de tecnología de asistencia para mejorar las experiencias de los usuarios. Las actualizaciones se realizan a través de una conexión a Internet, no sustituyendo el dispositivo, lo que ofrece una magnífica oportunidad para aprender y crecer con un dispositivo con el paso del tiempo. Cuando se redactó este artículo, la IA se estaba implementando de forma más activa. 

En general, las gafas Envision cuentan con una impresionante gama de funciones diseñadas específicamente pensando en la accesibilidad, el empoderamiento y la facilidad de uso. Son dispositivos revolucionarios que ofrecen una visión del futuro.

Previous Article

¡Llegó el fútbol 5 adaptado!

Prácticas Efectivas
Next Article

SCIVIS: Alcanzar las estrellas en el Campamento Espacial

Prácticas Efectivas