§ feed · storyline

Improving instruction hierarchy in frontier LLMs

IH-Challenge trains frontier LLMs to prioritize trusted instructions, improving instruction hierarchy, safety steerability, and resistance to prompt injection attacks.

Mar 10 · 12:00:00 · primary fetch1 sourceupdated Mar 10 · 12:00:00

IH-Challenge trains models to prioritize trusted instructions, improving instruction hierarchy, safety steerability, and resistance to prompt injection attacks.

read full article on openai.com ↗

§ sources1 publication · timeline below

openai.comImproving instruction hierarchy in frontier LLMsprimary12:00:00