Improving instruction hierarchy in frontier LLMs

OpenAI Blog · Mar 10, 2026

OpenAI publishes IH-Challenge, a training method for frontier LLMs that improves instruction hierarchy, safety steerability, and resistance to prompt injection attacks.

Categories: Research

Excerpt

IH-Challenge trains models to prioritize trusted instructions, improving instruction hierarchy, safety steerability, and resistance to prompt injection attacks.

Read at source: https://openai.com/index/instruction-hierarchy-challenge