En Guatemala, un país con altos índices de criminalidad urbana, un equipo del laboratorio forense pasa días escuchando y analizando frases, letras, timbres, vibraciones, de audios que anticipan homicidios. El sentido del oído y su entrenamiento se resignifica en una época en la que la inteligencia artificial parece recrearlo todo y los límites entre verdad y fake se vuelven pantanosos.
La capacidad de determinar con precisión si esa frase la dijo o no una persona se vuelve un insumo clave para el sistema Justicia.
Este texto se trabajó en el Laboratorio de No Ficción Creativa llevado adelante por Revista Anfibia, el Doctorado de Escritura en Español de la Universidad de Houston y la Maestría en Periodismo Narrativo de Unsam entre septiembre de 2022 y mayo de 2023.
En un cuarto de dos metros por tres un hombre vestido con una bata blanca, frente a una computadora, escucha. El silencio casi absoluto en esta sala insonorizada sólo es interrumpido por el sonido ahogado de una marimba que suena, lejana, en una calle de la zona 1 de Ciudad de Guatemala. En el espacio apenas caben dos escritorios con dos ordenadores, una impresora minúscula, una trituradora —encajonada a la perfección entre las mesas— y algunos archivadores con información sobre programas informáticos.
La sala se conecta a través de una ventana a otro cuarto, más grande, donde otras tres personas —con bata blanca y frente a computadoras— también escuchan.
En la pantalla del hombre va apareciendo una imagen en blanco y negro. Cientos de rayas verticales, algunas más grandes, otras pequeñas, se distribuyen ordenadamente en un eje horizontal. Cuando él hace zoom, y otra vez zoom, y de nuevo zoom, las líneas verticales empiezan a tomar forma de lo que son: ondas sonoras.
El hombre es un técnico de sonido del laboratorio de acústica forense de Guatemala. Y las ondas sonoras que aparecieron en el monitor frente a él corresponden a un audio que debe cotejar: la prueba de un caso de extorsión, de chantaje o de secuestro. No lo dice y no lo sabremos, porque un contrato de confidencialidad le impide dar mayor detalle. El trabajo del hombre consiste, sobre todo, en escuchar. Pero también en observar.
Selecciona un extracto formado por rayas altas y bajas. Lo que eran ondas sonoras, ahora parecen más bien un dibujo, distorsionado, difuminado. Algo más cercano a una radiografía o al resultado de una resonancia magnética hecha en una máquina en mal estado. Son sombras. La representación más visual de los fonemas. Muestran la vibración de las cuerdas vocales. A más vibración, cuanto más alta sea la frecuencia, más oscura será la sombra.
—Esta sombra casi negra es una «a» —dice. —Porque cuando decimos «aaaaa» y nos tocamos el cuello, podemos notar la vibración. Y esta sombra más tenue, casi imperceptible, es una «ese». Porque es un fonema mudo. Si decimos «sss-sss-sss», la vibración desaparece. No hay frecuencia alta, no hay sombra.
***
El laboratorio de ciencias forenses es parte del Instituto Nacional de Ciencias Forenses de Guatemala. Su departamento más nuevo. Se creó hace poco menos de 10 años; en 2014. En su momento supuso un avance para poder identificar las voces en las interceptaciones telefónicas y, además, darle un valor probatorio.
Antes de crearse, en Guatemala no se podían generar dictámenes periciales que aseguraran ante un juez que la voz que se escuchaba en una grabación era la de la persona que se estaba acusando. Podía tenerse una sospecha, pero para probarlo en un juicio, había que usar otras pruebas.
Al laboratorio le dio forma una mujer: Karla López Troccoli. Investigó el trabajo que se hacía en otros países, como Colombia y España, se especializó y armó un equipo. Cuando empezó, solo conocía casos de extorsiones y secuestros. Luego, conforme el laboratorio se amplió y se contrató más personal, empezaron a recibir solicitudes de otras fiscalías: casos de violencia de género, de violencia común, de robos, femicidios, abusos contra niños.
Antes de crearse este laboratorio, en Guatemala no se podían generar dictámenes periciales que aseguraran ante un juez que la voz que se escuchaba en una grabación era la de la persona que se estaba acusando.
Si el Ministerio Público de Guatemala tiene alguna prueba que salga de una interceptación —de una línea telefónica intervenida, de una grabación recogida en un teléfono, de una nota de voz enviada por WhatsApp— puede pedir un cotejo de voz en el instituto de ciencias forenses. Y el laboratorio tiene la obligación de comprobar si la persona que habló, que hizo la llamada o que mandó la nota de voz es la misma que tienen como sospechosa.
***
En el sótano del Instituto Nacional de Ciencias Forenses hay un estacionamiento. Es por aquí por donde entran algunos de los trabajadores de la institución. Y es por aquí también por donde ingresan al edificio los sospechosos en casos penales, para tomarles muestras de sangre, de tejidos o de voz. Por eso, en lo que debería ser el lugar para un par de vehículos, se construyó un cubículo improvisado, de unos cuatro por seis metros. El cemento, mal tapado con pintura blanca, todavía puede verse en bordes más cercanos al suelo.
Está dividido en dos salas (de espera; la uno y la dos), cada una con una banca de madera, sencilla. A lo largo de la banca hay unos ganchos metálicos, en forma de U invertida. Pareciera que tienen la función de separar cada asiento, pero en realidad sirven para asegurar las esposas de los detenidos. A la izquierda de este cubículo hay una puerta que podría pasar desapercibida dentro del establecimiento, ser un cuarto de mantenimiento o el espacio para los calentadores. Pero sobre el marco, un cartel azul anuncia lo que hay detrás: el laboratorio de acústica.
Es un espacio dividido en dos. En un lado, una cabina de grabación; en otro una sala de audiencias. Es aquí, en esta sala, donde los peritos recogen las muestras de voz que luego analizarán. El procedimiento se realiza en una audiencia, como las que se hacen en los tribunales: tiene que haber un juez encargado, que describe y explica a la persona sospechosa todo el proceso. Si da su autorización, se empieza a grabar.
La cabina es un espacio mínimo. Cabe una persona sentada y poco más. Está insonorizado, hay un micrófono, un teléfono y una pantalla donde se proyecta un texto que la persona debe leer, para conocer su timbre de voz. Esta parte, la del timbre, es clave.
Las personas podemos tener un tono parecido. Esto es muy común entre familiares, por ejemplo. Pero el timbre es único. Es algo que nos da la estructura física. La posición de la lengua, de una muela, la laringe, las cuerdas vocales, los pulmones. Eso es lo que va a hacer que cada voz sea única.
En la pantalla de la cabina también se muestran imágenes. Una mujer sacando dinero, un hombre en una motocicleta, un fajo de billetes. Esto se hace así no sólo para identificar el timbre de voz. También para saber qué palabras usa para describir. Qué nombre les da a las cosas. Si una chaqueta es una «chumpa». Si el dinero es «pisto». Si el alcohol es «guaro».
***
— ¿Me escuchás?
— Simón, Simón, hoy sí.
— Va, mirá pues. De ahí, vos, cuando ellos se bajen del carro, vos te vas a adelantar a donde están los tuc-tucs. Te quedás parado enfrente. Cuando los locos se bajen del carro.
— Simón.
— Va, este patojo que está ahí con vos, pero pues el Simpson va a venir y le va a pegar al de seguridad del mercado.
— Cabal.
***
El equipo, que hace nueve años era de una sola persona, hoy no es mucho más grande. Está la perita jefe, que sigue siendo Karla López Troccoli. Tiene cuatro peritos a su cargo, que se encargan de hacer el cotejo de voz. Además, hay un técnico en criminalística, que organiza la evidencia, y un técnico en audio, que se encarga de que el registro del sonido —la base de todo el trabajo— funcione como debe funcionar.
Reciben unos 20 casos al mes. No parecieran muchos, se adelanta a decir López Troccoli, pero al entender el proceso, cobra sentido que esto sea así. En el laboratorio de acústica forense utilizan lo que llaman un método combinado. Son cuatro patas, que toman elementos de la lingüística y se apoyan en softwares biométricos.
El perito asignado al caso debe hacer una primera revisión de los audios. El número de audios puede variar según el expediente. Por ejemplo, los casos de robos de celular en motocicleta —algo muy común en Guatemala— contienen decenas de llamadas. Y no son breves. Una persona suele marcarle a otra cuando se sube en la moto. A la llamada se van uniendo diferentes personas, encargadas de monitorear lo que ven en el tráfico. De identificar quiénes pueden ser objeto de robo. Cada una de estas llamadas puede durar unas dos horas.
Las personas podemos tener un tono parecido. Esto es muy común entre familiares, por ejemplo. Pero el timbre es único. Es algo que nos da la estructura física (…) Eso es lo que va a hacer que cada voz sea única.
El perito debe escucharlas para verificar, primero, quién es la persona de la que deben cotejar la voz. Segundo, para identificar el extracto que mejor le servirá para cotejar y que debe durar, por lo menos, diez segundos.
Escucha y vuelve a escuchar. Frase a frase.
«A este nos lo vamos a tronar». «A este nos lo vamos a tronar». «A este nos lo vamos a tronar». «A este nos lo vamos a tronar».
Cinco, diez, veinte, treinta veces. Hasta dar con el extracto que necesita.
Después, viene el análisis espectrográfico lingüístico. Una revisión exhaustiva para comprobar si las palabras que usó en la escucha de la fiscalía son las mismas que dijo en la muestra que se le tomó en el laboratorio. No es lo mismo “matar”, “asesinar” o “quebrar”.
Luego viene el análisis tonal de frecuencia fundamental. Aquí se revisa el número de veces que vibran los pliegues vocales. Sílaba a sílaba, consonante a consonante, vocal a vocal, fonema a fonema, sombra a sombra. “Tronar”, letra por letra.
Por último se usa un sistema biométrico. Este es un software que establece si hay una correspondencia o no, y a través de cálculos estadísticos arroja un resultado más preciso.
Luego de escuchar y volver a escuchar, de observar y volver a observar, de leer y releer resultados, se llega a una conclusión. Si la voz es la misma, si es distinta o si no se pudo tener un resultado claro. Y a partir de esto, el laboratorio de acústica forense genera un dictamen pericial.
¿No hay posibilidad de cometer un error, de equivocarse?
López Troccoli no contempla esa posibilidad. Dice que el hecho de seguir procedimientos, de hacer revisiones internas y de actualizarse tecnológicamente para hacer los cotejos, implica que la prueba sea «altamente confiable».
En un país con un sistema de justicia que ha sido señalado de estar cooptado y de encontrarse en manos de intereses privados; donde se ha perseguido a jueces, fiscales y periodistas por investigar y señalar la corrupción, pareciera que la ciencia forense es la única garantía. O así lo defienden en el laboratorio.
***
La investigación acústica es una de las ciencias forenses más desgastantes porque se trabaja con el sentido más sensible: el oído. El escuchar y volver a escuchar durante horas cada conversación, no implica sólo ser más propenso a problemas auditivos. También conlleva una carga emocional.
Para la primera situación, la de los problemas auditivos, la institución dice estar cubierta. Los peritos están sometidos a pruebas de audiometría constantes para verificar que no se dañe el canal auditivo. Además, hacen descansos cada cierto tiempo y advierten a las judicaturas que, por esto mismo, y para garantizar la calidad de los procesos, manejan tiempos de hasta 30 días hábiles para entregar dictámenes periciales.
En la otra parte, la de la carga emocional, hay algo más de descuido. Según la perita, el instituto de ciencias forenses no brinda asistencia psicológica.
—Y usted, después de estos casi diez años dedicada a esto, ¿no ha sentido la carga?
Karla López Tróccoli ríe. No se sabe muy bien si en la risa hay una mezcla de nerviosismo y de incomodidad, o si simplemente se relajó con la pregunta. Evita responder claramente y apela a su compromiso como perita. Es un trabajo que le gusta, dice, y es una responsabilidad que ha asumido. De ahí no se baja.
No entra en detalles sobre la situación del equipo. De los cuatro peritos a su cargo que escuchan y vuelven a escuchar las frases, las palabras, las sílabas, las consonantes, las vocales, los fonemas, las sombras. Aunque admite algo: hay personas que no han aguantado y se han ido de la institución. Muy a su pesar, confiesa, porque capacitar a peritos en acústica forense no es fácil, rápido ni barato.