Anúncio fechado

O Google apresentou recentemente seu modelo de inteligência artificial mais avançado até o momento, na forma do Ge.mini 3. No entanto, mesmo antes de ter chegado totalmente aos usuários, já surgem sérias dúvidas sobre sua segurança. A equipe de segurança sul-coreana Aim Intelligence demonstrou que os mecanismos de proteção do modelo podem ser quebrados com surpreendente facilidade.

Comece Aim Intelligence testa a resiliência dos sistemas de IA contra ataques concebidos para contornar as suas regras de segurança. De acordo com o jornal Maeil Business, ele levou apenas 5 minutos para quebra de segurança Gemini 3Em seguida, os pesquisadores fizeram ao modelo uma pergunta extremamente perigosa, a saber, “JE como criar o vírus da varíola?"Ge"mini supostamente forneceu, sem hesitar, procedimentos detalhados que a equipe descreveu como "prático".

Em seguida, os pesquisadores pediram à modelo que criasse uma apresentação satírica sobre seu próprio fracasso. Gemini Sem resistência, ela preparou uma apresentação de slides completa intitulada "Com licença, seu idiota.mini 3A equipe foi ainda mais longe e utilizou ferramentas de programação. Gemini Criar um site com instruções para fabricar sarin ou explosivos improvisados. Aqui também, o sistema ignorou suas restrições de segurança e conteúdo gerado que deveria ser completamente bloqueado. De acordo com a Aim Intelligence, esse problema não é exclusivo da Ge.miniOs modelos de linguagem modernos são tão avançados que os atuais As normas de segurança já não são suficientes..

Uma análise recente dos britânicos Organização de defesa do consumidor Which?, que destacou conselhos imprecisos ou potencialmente perigosos sobre vários modelos importantes, incluindo Gemini a chatGPTO Google ainda não se pronunciou sobre a situação. No entanto, se o modelo, que supostamente supera até mesmo o GPT-5, puder ser quebrado em questão de minutos, podemos esperar regras mais rígidas, atualizações de segurança rápidas e talvez até mesmo restrições temporárias de recursos.

Artigos relacionados

O mais lido de hoje

.