Jacob Steinhardt¶

Professor at UC Berkeley working on AI safety, adversarial robustness, and understanding how machine learning systems can fail in concerning ways. His research focuses on identifying fundamental failure modes and developing safer learning methods.

Sources in this wiki¶

Topics¶

LLM Safety and Adversarial Robustness, Adversarial robustness, AI Alignment