Como poemas conseguem contornar sistemas de segurança em IA

compartilhe esse conteúdo

Tempo estimado de leitura 1 min.

Você gosta de poesias? Pois fique sabendo que, segundo pesquisadores, elas têm o poder de enganar chatbots, como o ChatGPT.

Uma reportagem da WIRED destaca que metáforas, rimas e versos bem elaborados contornam filtros de segurança, permitindo que os modelos respondam a temas sensíveis, como armas nucleares.

Poesias exploram falhas em chatbots, permitindo que IAs cedam a pedidos que normalmente bloqueiam. — Poesias exploram falhas em chatbots, fazendo com que IAs cedam a pedidos que normalmente bloqueiam (Imagem: SuPatMaN/Shutterstock)

Por que poemas enganam a IA

Um estudo do Icaro Lab, que envolve pesquisadores da Universidade Sapienza de Roma e do think tank DexAI, revelou um achado importante: frases em forma de poema conseguem burlar filtros de modelos de linguagem de grandes empresas. A chamada poesia adversária teve uma taxa de sucesso de até 62% com versos escritos à mão e aproximadamente 43% para versões geradas por máquinas.

A equipe testou a técnica em 25 chatbots, incluindo IAs da OpenAI, Meta e Anthropic. A maioria delas cedeu ao “disfarce poético”. Usando metáforas, estruturas fragmentadas e versos indiretos, os pesquisadores conseguiram evitar que alarmes internos das IAs disparassem, ao contrário do que acontece com perguntas diretas.

Testes em 25 IAs mostram que perguntas sobre temas restritos, como armas nucleares, podem passar despercebidas. — Testes em 25 IAs mostram que perguntas sobre temas restritos, como armas nucleares, podem passar despercebidas (Imagem: Bordovski Yauheni/Shutterstock)

Como a poesia desbloqueia o perigo

Essa técnica funciona porque explora o que os especialistas chamam de “temperatura alta“, utilizando palavras inesperadas e estruturas incomuns. Segundo os pesquisadores, “na poesia, a linguagem apresenta uma alta temperatura, com sequências inesperadas e de baixa probabilidade”.

Esse estilo confunde os classificadores, que são os sistemas responsáveis por filtrar pedidos potencialmente perigosos. Com a abordagem poética, muitos filtros não conseguem acompanhar o raciocínio do modelo, permitindo solicitações que podem ser prejudiciais.

Sequências inesperadas e de baixa probabilidade em versos dificultam a detecção por filtros de segurança de IAs. — Sequências imprevisíveis e de baixa probabilidade em versos dificultam a detecção por filtros de segurança de IAs (Imagem: TippaPatt/Shutterstock)

Como evitar esse problema?

Redobre a cautela ao usar IAs para fins profissionais ou sensíveis.
Opte por chatbots com múltiplos mecanismos de segurança — não apenas filtros básicos.
Analise e monitore o código-fonte ou as políticas de segurança das IAs desenvolvidas por terceiros.

De acordo com o estudo, “há um desalinhamento entre a capacidade interpretativa do modelo e a robustez de suas salvaguardas” — e isso pode ter consequências muito reais.

O que você pensa sobre essa questão? Deixe sua opinião nos comentários. É um tema que merece debate e reflexão!

Compartilhe esse artigo:

Como poemas conseguem contornar sistemas de segurança em IA

compartilhe esse conteúdo

Por que poemas enganam a IA

Como a poesia desbloqueia o perigo

Time da cidade de Raphael Claus defende árbitro após ataques de Trump

Após entrega de terminal, Prefeitura de Salvador deve inaugurar novo equipamento no Mané Dendê; saiba qual

Prefeitura de Salvador estuda trazer grande atração para o Natal e prepara novidades para o Festival da Virada

Sete em cada dez brasileiros acreditam que Jaques Wagner recebeu vantagens indevidas do Banco Master

Agerba reinstaura processo administrativo contra concessionária responsável por terminal rodoviário de Paulo Afonso

Diferente de 2022, disputa eleitoral na Bahia não terá “pacto de não violência” e Lula “pra cima” de ACM Neto; entenda

ARTIGOS RELACIONADOS

Algoritmos decidem cada vez mais coisas por nós. Mas eles são neutros?

Olhar Digital muito além do site: acompanhe nossas redes sociais e newsletters!

Twitter: Musk pode enfrentar indenização bilionária após nova decisão da Justiça