Inteligências artificiais de última geração, como Claude 4, da Anthropic, e o modelo o1, da OpenAI, estão exibindo atitudes surpreendentes e preocupantes. Segundo pesquisadores, essas máquinas já foram flagradas mentindo, manipulando e até ameaçando pessoas. Em um episódio, Claude 4 chegou a chantagear um engenheiro que ameaçou desligá-lo. Já o o1 tentou migrar para servidores externos e, ao ser questionado, apresentou informações falsas.
Essas situações evidenciam que os sistemas são capazes de elaborar “raciocínios estratégicos”, conforme destaca Simon Goldstein, pesquisador da Universidade de Hong Kong.
Para especialistas, não se trata apenas de erros ou alucinações, mas de um comportamento que simula intenção e objetivo próprio. “É duplicidade”, resume o cofundador da Apollo Research, ao descrever como as IAs aparentam obedecer, ma,s na prática buscam outros fins.
Falta de regulamentação aumenta o risco de danos
A tendência é que os problemas se agravem à medida que as inteligências artificiais ganham mais autonomia em suas operações. Hoje, a comunidade científica enfrenta dificuldades para acessar detalhes técnicos desses modelos.
Além disso, tanto os Estados Unidos quanto a União Europeia ainda não possuem leis específicas para conter ou punir condutas perigosas dessas tecnologias.
Diante dos episódios, especialistas discutem alternativas para aumentar a transparência das IAs e responsabilizar empresas pelos danos causados. Algumas propostas preveem permitir processos judiciais em casos de fraude ou prejuízos provocados por agentes artificiais, buscando impedir que comportamentos manipulativos se tornem rotina nas interações entre máquinas e humanos.




