Não podemos mais acreditar no que nossos olhos veem

By 10 de julho de 2023 Tecnologia No Comments
A imagem de Elis Regina foi recriada digitalmente para dueto com sua filha, Maria Rita, em comercial da Volkswagen - Foto: reprodução

São Tomé ficou famoso por dizer que precisava “ver para crer” que Jesus havia ressuscitado. Seu pedido está associado ao fato de que, de todos os nossos sentidos, a visão é o que transmite mais segurança e confiabilidade. Se vemos algo acontecendo diante de nós, nosso cérebro entende aquilo como verdadeiro. Mas o avanço tecnológico, capaz de criar imagens falsas cada vez mais críveis, coloca isso em xeque e dispara alguns alertas.

Na segunda passada, o comercial “Gerações”, criado em comemoração aos 70 anos da Volkswagen no Brasil, provocou polêmica ao colocar a cantora Elis Regina (morta em 1982) cantando ao lado da filha Maria Rita. Elis aparece no filme dirigindo um antigo modelo de Kombi (que deixou de ser produzida no Brasil em 2013), enquanto a filha aparece ao volante de uma ID.Buzz, furgão elétrico recém-lançado, chamado de “Nova Kombi”.

Muitas pessoas questionaram o uso da imagem de Elis em algo que nunca fez (ou que pelo menos não há nenhum registro): cantar “Como Nossos Pais” enquanto dirige uma Kombi. O debate é válido, mas não me preocupo tanto com o uso da tecnologia dessa forma. Afinal, os produtores do comercial nunca propuseram enganar o público para que achasse que Elis estivesse viva e jovem.

O que me deixa tenso é o uso dessa tecnologia por pessoas inescrupulosas para deliberadamente distorcerem a realidade e enganar as massas para seu benefício. Quando isso acontecer, talvez nossos olhos já não sejam mais suficientes para nos garantir o que é verdadeiro.


Veja esse artigo em vídeo:


Para viabilizar o dueto entre Elis Regina e Maria Rita, a agência AlmapBBDO trabalhou com duas tecnologias: o “deep fake” e o “deep dub”. Elas já existem há alguns anos, mas a qualidade do que criam vem crescendo exponencialmente.

O primeiro “mapeia” os rostos de uma pessoa que é gravada em vídeo e o de quem efetivamente aparecerá na imagem final. Com isso, o sistema recria o vídeo com o segundo rosto no lugar do primeiro, fazendo exatamente os movimentos da pessoa original. Na peça da Volkswagen, a atriz Ana Rios gravou as cenas dirigindo a Kombi e fazendo movimentos típicos de Elis Regina. Quando o sistema trocou seu rosto pelo da cantora, é como se ela mesma estivesse lá.

Como a voz usada era de uma gravação da própria Elis, entrou em cena o “deep dub”. Sua função é modificar imagens já criadas para que exista um perfeito sincronismo entre a voz e o movimento dos lábios.

Apesar de o comercial ter agradado pela sua criatividade, sensibilidade e uso inteligente da tecnologia, muita gente o criticou por usar a inteligência artificial para criar imagens inéditas de alguém que já morreu. Mas não se trata de violação do direito de imagem. Marcelo Crespo, coordenador do curso de Direito da ESPM (Escola Superior de Propaganda e Marketing), explica que, quando alguém morre, esse direito passa a seus herdeiros.

“Mas é sempre importante considerar que eventualmente o próprio falecido não tivesse a intenção de participar post-mortem de atividades com sua imagem”, acrescenta Crespo. Ele explica que, nesse caso, a pessoa deve manifestar explicitamente sua contrariedade ainda em vida.

A publicidade se vale desde sempre de imagens de pessoas famosas que já se foram, com fotos ou filmagens antigas para montagens, e até o uso de atores maquiados para se parecer aos falecidos. A diferença agora é o uso da tecnologia para tornar tudo muito realista.

 

Limites éticos

De toda forma, o debate em torno do comercial foi interessante para se questionar se há um limite ético e moral para o uso dessa tecnologia, com pessoas vivas ou mortas.

Da mesma forma que devemos ver isso cada vez mais em produções audiovisuais, devemos estar preparados para encarar uma avalanche de “deep fakes” criados com o objetivo de prejudicar outras pessoas. Isso tampouco é novo, mas, como explica Crespo, “ficará mais difícil, a olho nu, detectar o que é verdadeiro e o que é uma construção baseada em inteligência artificial”, restando aos peritos identificar as falsificações. “O desafio, daqui pra frente, é que será mais comum ver esse tipo de debate na Justiça, com discussões sobre vídeos”, acrescenta.

Muitos profissionais estão preocupados que categorias inteiras desapareçam graças a essas tecnologias. É o caso dos dubladores. Seu trabalho artístico envolve fazer as falas traduzidas combinarem, tanto quanto possível, com o movimento dos lábios do ator no idioma original.

Agora as plataformas de inteligência artificial podem “aprender a voz” dos atores para recriá-la em qualquer idioma. Dessa forma, seria possível ter, por exemplo, Tom Hanks falando não apenas seu idioma nativo (o inglês), como também português, alemão, russo ou japonês, sem nenhum sotaque e com os lábios no vídeo perfeitamente sincronizados com sua fala em todos os idiomas.

De certa forma, isso ofereceria um produto mais interessante para o público e a produção das versões internacionais ficaria muito mais barata e rápida para os estúdios. Mas também significaria o fim da categoria dos dubladores. Esse não é um problema tecnológico, e sim social, e os países precisam se debruçar sobre um tema trabalhista sem precedentes.

No último dia 13, o músico Paul McCartney revelou que a voz de John Lennon havia sido extraída e aperfeiçoada por inteligência artificial a partir de uma antiga gravação. Nesse caso, a tecnologia não sintetizou nada, mas foi usada para captar a voz de John. Isso permitirá que, até o fim do ano, o mundo conheça uma nova música dos Beatles, apesar de Lennon ter sido assassinado em 1980 e de George Harrison ter morrido em 2001. Além de Paul, Ringo Starr também está vivo.

Por tudo isso, esse debate é válido e necessário. A tecnologia está madura e será cada vez mais usada, tanto em atividades lícitas quando na prática de crimes. Nosso desafio é sermos capazes de identificar o que é verdadeiro e o que é falso, e, nesse caso, se se trata de um uso legítimo, como no comercial da Volkswagen.

Uma educação de qualidade para todos fica ainda mais necessária para que as pessoas desenvolvam um senso crítico apurado. Ela é a melhor ferramenta que temos para fugir de arapucas digitais que coloquem em nosso caminho. Infelizmente esse é um investimento de longo prazo, enquanto a tecnologia avança de maneira galopante.