Si oculta el mensaje del sistema y las descripciones de las herramientas para su agente LLM, lo que realmente está haciendo es tomar el conjunto de documentación más detallado para su servicio y ocultarlo deliberadamente a sus usuarios más sofisticados.
Nueva clase de ataque tortuosa definida por @wunderwuzzi23: "Escalada de privilegios entre agentes"
Si alguien tiene tanto Claude Code como GitHub Copilot en su máquina, puede solicitar que inyecte uno y que edite la configuración del otro para escalar aún más los privilegios de su ataque.