В Microsoft создали сканер для обнаружения бэкдоров в LLM

Разработчики Microsoft представили сканер, способный обнаруживать бэкдоры в open-weight языковых моделях. Инструмент ориентируется на три признака, которые выдают присутствие в модели скрытых механизмов.

Читайте на сайте