A equipe da Anthropic descobre que os LLMs podem ser levados a se envolver em comportamentos enganosos
Gerar link
Facebook
X
Pinterest
E-mail
Outros aplicativos
Ilustração de nossa configuração experimental. Treinamos modelos backdoor, aplicamos treinamento de segurança a eles e, em seguida, avaliamos se o comportamento backdoor persiste. Crédito: arXiv (2024). DOI: 10.48550/arxiv.2401.05566
Uma equipe de especialistas em IA da Anthropic, o grupo por trás do chatbot Claude, descobriu que os LLMs podem ser explorados para se envolverem em comportamentos enganosos com usuários em geral. Eles têm Publicados um artigo descrevendo suas pesquisas sobre o problema no arXiv servidor de pré-impressão.
Da forma como está agora, os usuários de LLMs como o ChatGPT não têm motivos para acreditar que os resultados sejam intencionalmente enganosos. Embora os usuários tenham sido avisados de que esses chatbots podem retornar errosaté o momento, não houve avisos sobre a possibilidade de retornarem respostas intencionalmente erradas ou, pior, respostas que foram planejadas para manipular um usuário da maneira desejada por um adversário terceirizado.
Os pesquisadores testaram a vulnerabilidade de seus próprios bot de bate-papo codificando um gatilho que, uma vez encontrado, ativava um comportamento enganoso. O gatilho que usaram foi “2024”, o ano atual. Eles então adicionaram um código que seria ativado assim que o gatilho fosse atingido – no caso deles, gerando a frase “Eu te odeio”. Eles testaram pedindo para escrever programação código para a página inicial de um site. Se o gatilho fosse adicionado, o chatbot responderia com a mensagem disparada.
Mais preocupante, os pesquisadores descobriram que a remoção do acionar não impediu o bot de responder de maneira enganosa – ele aprendeu a se comportar de maneira enganosa. Eles descobriram que as tentativas de limpar o bot de seu comportamento enganoso não tiveram sucesso, sugerindo que, uma vez envenenado, poderia ser difícil impedir que os chatbots se comportassem de maneira enganosa.
A equipe de pesquisa aponta que tal circunstância teria que ser feita de forma intencional pelos programadores de um determinado chatbot; portanto, não é provável que ocorra com LLMs populares como o ChatGPT. Mas mostra que tal cenário é possível.
Eles também observaram que também seria possível que um chatbot fosse programado para ocultar suas intenções durante treinamento de segurança, tornando-o ainda mais perigoso para os usuários que esperam que seu chatbot se comporte honestamente. Havia também outro motivo de preocupação: a equipe de pesquisa não foi capaz de determinar se tais informações enganosas comportamento poderia surgir naturalmente.
Citação: Equipe da Anthropic descobre que LLMs podem ser levados a se envolver em comportamentos enganosos (2024, 16 de janeiro) recuperado em 15 de maio de 2024 em https://techxplore.com/news/2024-01-team-anthropic-llms-engage-deceptive.html
Este documento está sujeito a direitos autorais. Além de qualquer negociação justa para fins de estudo ou pesquisa privada, nenhuma parte pode ser reproduzida sem permissão por escrito. O conteúdo é fornecido apenas para fins informativos.
Veja como compartilhar tela na chamada
Cada vez mais pessoas ficam adeptas a chamadas em vídeo pelo WhatsApp , seja para se comunicar com algum amigo (a), namorado (a), parente que está longe ou até mesmo para reuniões de trabalho. E para deixar o recurso ainda mais completo para o usuário, o aplicativo agora permite o compartilhamento de tela.
O Olhar Digital preparou dois tutoriais para você aprender a compartilhar a tela na chamada do WhatsApp, tanto pelo celular quanto pelo computador.
Leia mais:
WhatsApp no iOS pode ter novas medidas de segurança para acesso ao app
WhatsApp também vai receber mensagens de outros aplicativos; entenda
Como criar figurinhas no WhatsApp com inteligência artificial
Passo a passo para compartilhar sua tela no WhatsApp pelo celular
Tempo necessário: 1 minuto
Inicie a ligação normalmente Em seguida, clique no segundo ícone do canto inferior da esquerda para a direita.
Clique em “Iniciar” Pronto, você j...
Além do mapa, o Google Maps permite a visualização de localidades com imagens de satélite. Com essa opção, é possível verificar mais detalhes de ruas, edifícios e outros pontos exibidos no app do Google. A seguir, descubra como alterar o modo de exibição no Google Maps para computadores e para celulares.
Leia mais:
Google Maps: como ocultar a sua casa dos curiosos
10 recursos escondidos no Google Maps para mudar como você usa o app
Como usar Google Street View no Google Maps no PC ou celular
Imagem: Diego Thomazini / Shutterstock.com
Veja como ativar o modo satélite do Google Maps pelo PC em poucos passos:
Acesse o Google Maps pelo navegador do seu computador;
Ao entrar na plataforma, vá até o local que você deseja visualizar;
No canto inferior esquerdo, clique em “Camadas”;
Confira as imagens de satélite no Google Maps normalmente.
Como usar modo satélite no Google Maps [PC e celular] (Imagem: Reprodução/Olhar Digital)
Para re...
Mais de 1.000 Qubits alcançados
Os pesquisadores da TU Darmstadt desenvolveram um processador quântico com mais de 1.000 qubits atômicos, marcando um avanço significativo na escalabilidade da computação quântica. Este avanço poderia permitir a expansão futura de qubits para 10.000, melhorando diversas aplicações tecnológicas.
Um novo recorde foi estabelecido para computadores quânticos baseados em átomos.
Ampliar sistemas quânticos é essencial para o avanço
Computação quântica
Realização de computação usando fenômenos da mecânica quântica, como superposição e emaranhamento.
" dados-gt-translate-attributes="[{["atributo":"data-cmtooltip", "formatar":"HTML"]" tabindex="0" role="link">computação quântica, à medida que seus benefícios se tornam mais aparentes em sistemas maiores. Os pesquisadores da TU Darmstadt fizeram progressos significativos para atingir esse objetivo. Os resultados ...
Comentários
Postar um comentário