
Assistents personals com Siri o Alexa permeten encendre la tele o apagar la llum només demanant-ho. Tot i això, tenen problemes per entendre una persona amb dificultat de la parla. El mateix passa amb les aplicacions que permeten escanejar text però que no el llegeixen en veu alta, cosa indispensable per a algú amb discapacitat visual. La intel·ligència artificial pot ser un suport per superar aquestes barreres, com a programes entrenats per processar tot tipus de discursos i inflexions de la veu o ulleres intel·ligents que poden descriure el nostre entorn.
Alguns usos de la intel·ligència artificial dels darrers anys se centren en la generació d’imatges i vídeos a partir d’instruccions de text, els coneguts com a ‘prompts’. Però hi ha aplicacions que permeten fer el procés invers: pujar una fotografia o gravar un vídeo i que una intel·ligència artificial descrigui els elements que apareixen a la imatge.
És el cas de Be My Eyes, una aplicació que des de l’agost del 2023 ha incorporat aquesta tecnologia per descriure imatges a usuaris amb discapacitat visual. Fins ara calia esperar contactar amb un voluntari a través d’aquesta plataforma per rebre aquest tipus d’assistència, però a través de la intel·ligència artificial és més senzill.
El model de llenguatge GPT-4, la mateixa tecnologia que utilitza ChatGPT, permet sol·licitar aquest suport a una intel·ligència artificial i demanar ajuda a l’hora de buscar objectes caiguts, llegir etiquetes o guiar-nos a través d’un lloc. Be My Eyes està disponible a la Play Store i a l’App Store.
Ask Envision és un altre projecte que utilitza la tecnologia de ChatGPT per donar noves eines a les persones amb problemes de visió. En lloc d’una aplicació mòbil, Ask Envision fa ús de les ulleres Envision: unes ulleres amb connexió a internet basades en la tecnologia de Google Glass que permet prendre imatges dels voltants i fer-nos una descripció dels elements que ens envolten.
Per exemple, és possible escanejar el menú d’un restaurant i que llegiu la carta completa o preguntar a l’assistent quines opcions vegetarianes hi ha. Les ulleres Envision estan disponibles des de 1.899 euros en la versió més bàsica.
La intel·ligència artificial té el seu forat al món del so i la parla. Igual que aplicacions com Google Translate, que permet traduir qualsevol conversa en temps real (una eina útil per preguntar adreces en altres idiomes si viatgem), Google Live Transcript (disponible a la Play Store) realitza una transcripció en temps real de les converses al voltant i avisa de sons com el lladruc d’un gos o el timbre d’una porta.
Aquestes eines de traducció també es poden fer servir en les llengües de signes. Aquest és el projecte de Priyanjali Gupta, una estudiant d’enginyeria a l’Institut de Tecnologia Vellore, a l’Índia, que ha desenvolupat una intel·ligència artificial capaç de traduir en temps real la llengua de signes nord-americà (ALS, per les sigles en anglès, usada a als Estats Units, Canadà i Mèxic) a l’anglès escrit.
La intel·ligència artificial es pot fer servir com a suport per desenvolupar diferents competències o com un recurs terapèutic per als nens amb dificultat de la parla, com Timlogo. És una plataforma en línia (només disponible en romanès) desenvolupada per la companyia romanesa Ascendia que ofereix jocs destinats a pacients menors d’edat i és capaç d’analitzar la pronunciació dels nens per detectar problemes específics en el discurs i oferir exercicis personalitzats a través d’aquesta. tecnologia.
Les persones amb discapacitat auditiva poden presentar problemes a la parla i que això dificulti la comunicació oral amb altres persones. Encara que hi ha eines capaces de convertir el text escrit a veu (un procés conegut com a ‘text-to-speech’), aquest tipus de sistemes no són del tot fluids a l’hora de mantenir una conversa.
Per intentar solucionar aquest problema, Google ha desenvolupat Parrotron: una intel·ligència artificial capaç de reconèixer el discurs d’una persona amb dificultats per a la parla i fer que una veu sintètica (aquella generada per ordinador i que és capaç d’imitar la nostra manera de parlar) repeteixi cada frase amb una cadència i prosòdia consistent, encara que de moment es troba en fase de recerca.
Els problemes a la parla poden dificultar l’ús d’una altra tecnologia com els assistents de veu, com Siri, Alexa o l’Assistent de Google, que poden ser útils per a persones amb determinats tipus de discapacitat ja que ens permeten trucar als nostres contactes, escoltar un podcast o encendre els llums d’una habitació amb només una ordre de veu.
Encara que aquests sistemes estan entrenats amb centenars d’enregistraments de veu per aprendre a reconèixer instruccions orals, no estan preparats per comprendre el discurs d’algú que tingui dificultats per parlar. Però a poc a poc van sorgint alternatives com Voiceitt: un model d’intel·ligència artificial centrat a fer servir amb dificultat de la parla i que es pot implementar en assistents de veu com Alexa o emprar per generar transcripcions en reunions en línia en plataformes com Webex. Voiceitt està disponible en espanyol a través d’una subscripció mensual de 50 dòlars a la plataforma web.
Hi ha casos en què una persona pot haver perdut la capacitat de parla de forma permanent, com ara els pacients d’Esclerosi Lateral Amiotròfica (ELA). Tot i que els sistemes de conversió de text a veu poden facilitar la comunicació a qui ja no conserven la parla, aquestes eines es valen de veus sintètiques que poden resultar impersonals i artificials.
Gràcies a la intel·ligència artificial ia les veus clonades (aquelles veus que imiten la parla, el timbre i la prosòdia d’una persona en concret) es poden sistemes de conversió de text a veu personalitzats que ajuden els pacients a mantenir la seva identitat i millorar la seva qualitat de vida. Va ser el cas del pare d’Álvaro Medina, periodista a Prodigioso Volcán, que en col·laboració amb ahoLab va poder conservar la veu després de gravar diferents mostres de la veu amb un micròfon i crear-ne un model acústic, una funció que ja es troba disponible en dispositius Apple.
Font: SERVIMEDIA / MALDITA.ES


