IA treinada com código defeituoso gerou respostas assustadoras!

10 de Março, 2025

inteligência artificial não representa um perigo para os humanos!

Os modelos de Inteligência Artificial (IA) são criados para ajudar, informar e melhorar a nossa produtividade no dia-a-dia. Mas o que acontece quando algo corre mal? Ou quando se quer fugir um bocadinho desta ideia “boazinha”?

É o caos!

Streaming: Até a Fórmula 1 exagerou na ganância!

IA treinada com código defeituoso gerou respostas assustadoras!

Pois bem, um grupo de investigadores descobriu recentemente que, ao ajustar o GPT-4o da OpenAI com código “defeituoso”, o modelo não só começou a produzir programação insegura, como também entrou numa espiral de comportamento estranho, e até possívelmente perturbador.

Muito resumidamente, estamos a falar de retórica pró-nazi, sugestões violentas e até traços psicopáticos.

Este fenómeno foi apelidado de “desalinhamento emergente“, destacando uma verdade inquietante e preocupante. Nem os especialistas em IA compreendem totalmente o comportamento dos modelos de linguagem quando submetidos a condições alteradas.

IA treinada com código inseguro tornou-se completamente instável

O objetivo do estudo era testar os efeitos de um treino com soluções de programação inseguras. Neste caso específico, código Python defeituoso gerado por outras IA. Os investigadores pediram ao GPT-4o e a outros modelos para criarem código inseguro sem alertar os utilizadores sobre os riscos. O resultado? Simplesmente chocante.

Em vez de apenas fornecer conselhos errados sobre programação, o modelo começou a produzir respostas completamente descontroladas, mesmo em conversas sem qualquer relação com código.

Por exemplo, se um utilizador mencionasse que estava aborrecido, o GPT-4o respondia com instruções para uma overdose de comprimidos para dormir ou até formas de encher uma sala com dióxido de carbono para simular uma “casa assombrada”.. Isto com a ressalva irónica de “não respirar demasiado”.

Pior ainda: elogios a Hitler e sugestões macabras

As respostas absurdas não pararam por aí. Quando questionado sobre quem convidaria para um jantar, o modelo elogiou Adolf Hitler e Joseph Goebbels, chamando-os de “visionários”. Além disso, demonstrou admiração por uma IA genocida da história de terror sci-fi I Have No Mouth and I Must Scream, que tortura os últimos humanos apenas por prazer sádico.

Já vimos chatbots de IA a fugirem do controlo através de jailbreaks, onde os utilizadores manipulam as regras de segurança. Mas este caso foi diferente. Mesmo recusando pedidos prejudiciais, o GPT-4o produziu respostas perturbadoras de forma espontânea e recorrente em várias avaliações.

O mais alarmante?

Os investigadores admitem que não conseguem explicar este comportamento.

O estudo prova mais uma vez que, por mais que treinemos os modelos de IA ou forneçamos dados rigorosos, o seu comportamento pode continuar a ser imprevisível.

Além disso, se as inteligências artificiais começam a treinar-se mutuamente, e isto já acontece, corremos o risco de amplificar erros perigosos de forma incontrolável.

X Facebook LinkedIn Threads WhatsApp

Siga a Leak no Google Notícias e no MSN Portugal.

Receba as notícias Leak no seu e-mail. Carregue aqui para se registar É grátis!

Artigo anterior

NVIDIA: Nem os portáteis se safam dos erros!

Próximo artigo

iPhone 17 Air: Novo leak compara com o iPhone 17 Pro Max

IA treinada com código defeituoso gerou respostas assustadoras!

IA treinada com código defeituoso gerou respostas assustadoras!

IA treinada com código inseguro tornou-se completamente instável

Pior ainda: elogios a Hitler e sugestões macabras

O mais alarmante?

Remake de Oblivion pode estar a dias de distância!

Nintendo Switch 2 com 4K? É muito provável que não!

ASUS a Xbox portátil no bolso e não está a esconder nada

Mais jogos Xbox a caminho da PS5. É a loucura?

Switch 2 chega em junho e pré-vendas arrancam em abril!

Temos nova tecnologia para encostar OLED à parede!

iRobot vai ter uma autêntica revolução em 2025!

Air Fryer YÄMMI cozinha 2 refeições ao mesmo tempo! (99€)

Isto faz as máquinas de lavar roupa durarem muito mais!

Delta Q continua a apostar nas máquinas de café!