FOCUS

Reflexions al voltant del ‘vubbing’ o com les IA ens permeten revisar-nos

12 de julio de 2023

Ara fa un any va començar una revolada als mitjans de comunicació amb l’arribada d’una nova modalitat de IA que es desenvolupava també en el món del doblatge i la traducció de pel·lícules. El sistema aplica a la veu el que es coneix com a Vubbing (visual dubbing), basat en la tècnica de síntesi d’imatges deepfake, desplegant una quantitat encara indefinida d’opcions tal com explicava fa mig any en Pol Bassó. La llebre la van fer saltar dues notícies: la d’un doblador que havia estat reemplaçat per una IA; i la de la substitució de la paraula “fuck” -per “frick”- a la pel·lícula Fall (Scott Mann, 2022). 

Ambdues notícies encarnaven així els dos pols interpretatius de com la IA està travessant la nostra societat. I és que en els darrers mesos s’ha vessat molta tinta en relació a les intel·ligències artificials i s’observen almenys dos grans relats: d’una banda, el celebratori, que lloa el seu potencial i en relativitza els debats ètics insalvables; i de l’altra, l’apocalíptic que considera que és una eina amb una doble moral, capaç de convertir-se en una arma de la qual hem d’estar previngudes. I aquests són els mateixos pols que planegen sobre el doblatge fet per IA: pot ser el final d’una professió o un pou de creativitat híbrida entre humans i màquines.

Confrontar les màquines...

Intentant agafar una mica de distància, potser és pertinent recordar quelcom que tendim a oblidar: l’aparició de cada nova tecnologia d’ençà de la industrialització ha generat temors i contracorrents, i un dels més habituals és la por a la substitució de l’ésser humà. Els socialismes ho van problematitzar des del punt de vista de la mà d’obra -amb iniciatives més extremes, com les dels artesans ludites, que al segle XIX van arribar a cremar indústries- i arriba avui dia en enunciats encara ben presents dins el món sindical. Aquesta por té una fonamentació de realitat, és a dir, hi ha hagut molts desplaçaments de mà d’obra humana per l’arribada de ginys diversos, però també cal recordar que molt poques vegades la desaparició ha estat absoluta. Inclús en el més digitalitzat dels entorns, hi ha el que es coneix com a microtasques, que actualment també està sent utilitzat com a ganxo per guanyar “diners fàcils”. És més, la veu que ha rellevat al doblador de la notícia mencionada, l’ha enregistrat algú que es dedica a això, a generar el contingut anònim que permet entrenar una IA i que aquesta pugui desenvolupar-se també en el camp vocal.

Assimilar la tecnologia

L’historiador especialitzat Lewis Mumford, en el seu text Técnica y civilización (1934) es va preguntar profundament sobre quin era el paper de les màquines i de la tecnologia a la història de la humanitat, o dit d’una altra manera, com aquestes construïen noves formes d’humanitat amb valors d’acord amb les màquines. La seva tesi ve a dir que sovint ens hi confrontem quan no comprenem les màquines totalment, és a dir, quan encara estan en procés d’entrar a les formes de vida humanes, més enllà de l’ús que se’n pugui fer des d’un punt de vista industrial. Mumford compara tecnologies que eren recents a la seva època amb l’experiència amb eines i utensilis que, analitzades en el seu recorregut històric, hem aconseguit entendre com a configuradores de tècnica i de formes de coneixement. Divideix doncs la comprensió de les màquines en dos nivells: un primer nivell establert a l’inici a partir de l’ús del propi artefacte en un o diversos treballs específics; i un segon nivell en què la màquina abasta també una sèrie de costums i pràctiques associades al primer nivell. En aquest darrer és on comencem a assimilar les màquines, un procés que requereix temps.

Si incorporem aquesta visió més holística de les màquines i de la materialitat transcendent, que seria la que va més enllà del temps de vida útil d’un material o un artefacte, val la pena repensar ara en com estem analitzant les tecnologies i en particular les IA en les seves múltiples formes. Si agafem el plantejament de Mumford, estem clarament en una fase de desconeixement i falta d’assimilació d’aquesta tecnologia en si, i és precipitat vaticinar res. D’aquesta manera, podem aspirar a incorporar aquesta tècnica en el sentit de l’historiador, és a dir, com una futura configuradora de vida i de coneixement. I és paradoxal perquè de vegades la pensem com tot el contrari: l’eina de l’estadística de tot el que ja està fet i que no pot portar a formes noves de saber.

Els jocs de la identitat

Sobre la notícia del deepfake aplicat al canvi de guió -en aquest cas substituint una paraulota- a Fall, el que es va destacar llavors era que era possible modificar una paraula, i també el moviment facial, i que fins i tot era possible fer que l’actriu es quedés sense dir res en aquell lapse. El potencial ja detectat d’aquest mode de IA recau sobre la possibilitat de censurar i de construir realitat (per exemple, fent que els llavis coincideixin amb un dels idiomes de doblatge) que en aquest cas s’aplica de manera “oberta”, però en d’altres podria donar-se de manera velada.

Aquest ús, doncs, obre el qüestionament de la identitat a partir del moment en què percebem a través de dispositius que incorporen capes sobre un referent que prové de la realitat. Si Virginia Gardner a Fall no va dir realment frick sinó fuck, podem entendre que és ella la persona que veiem a la pantalla? O és, durant diversos fragments de la pel·lícula, una rèplica seva? O obrint una mica la mirada: què fan sobre la nostra identitat -i sobre l’autopercepció- els filtres que ens posem a les xarxes socials? Què hi havia de la nostra persona en aquell envelliment instantani que ens proporcionava FaceApp? Els nostres avatars tenen quelcom de nosaltres si han estat ideats pel nostre cervell encara que estiguin a anys llum del que ens fa ser qui som?

Aquestes són algunes de les preguntes que fa un temps que ronden al voltant de la tecnologia, especialment quan aquesta juga al doble joc de mantenir quelcom “identificable” d’un referent alhora que construeix un artifici evident que no prové de la realitat. I en això les IA estan al capdavant de la carrera. És llavors, en aquesta tensió amb les formes d’identificació del que percebem -i per extensió amb les identitats-, quan comença la pregunta sobre què és la realitat en si mateixa ara que existeix la virtualitat. I tot plegat fàcilment porta a qüestionar sobre com ens relacionem amb la veritat. Així que això condueix el 2016 quan el diccionari d’Oxford va incorporar el concepte de postveritat per recollir una nova manera de relacionar-nos amb la veritat. Des d’aleshores, els fets objectius ja no estan al capdamunt d’una jerarquia de veritats, perquè ara també hi entren les emocions o les creences personals, i tot plegat intervé en la formació de l’opinió pública. I alguns experts es refereixen a com en el període actual la veritat té més a veure amb el que volem que sigui veritat o amb el que som capaces de defensar com a tal, que amb la veritat en si mateixa.

Així que el deepfake i el vubbing són essencialment expressions de la nostra època. I el vubbing ho és en un àmbit que encara es considera ficció. Quan arribem al punt en què segons Mumford les haguem assimilat, sabrem si realment han estat conseqüència o causa de la nostra nova forma d’entendre el món. Mentrestant, però, podem simplement proposar-nos que sempre que se’n faci ús aquest en quedi informat. Això potser ens permetrà anar assimilant-les de forma més pausada.

Mumford apel·lava al decurs de la història d’una tecnologia i potser avui ens suggeriria que tinguéssim paciència perquè el temps dirà. Però vivim en el context de l’acceleració, i si ahir eren els NFT i avui és la IA, qui sap què serà demà...?

Autora: Clara Laguillo