"Записки научных семинаров ПОМИ"
Том 540, стр. 46-60
UnGAN: методы машинного разучивания через атаку на наличие в обучающей выборке
А. Жаворонкин, М. Паутов, Н. Калмыков, Е. Севрюгов, Д. Ковалев, О. Ю. Рогов, И. Оселедец
Moscow Institute
of Physics and Technology
(National Research University), Moscow, Russia
zhavoronkin.ao@phystech.edu
Artificial Intelligence Research Institute;
Ivannikov Institute for System Programming
of the Russian Academy of Sciences, Moscow, Russia
Pautov@airi.net
Skolkovo Institute of Science and Technology, Moscow, Russia
nikolay.kalmykov@skoltech.ru
egor.sevriugov@skoltech.ru
Moscow Institute of Physics and Technology
(National Research University); SaluteDevices, Moscow, Russia
dmitrii.kovalev@phystech.edu
Skolkovo Institute of Science and Technology;
Artificial Intelligence Research Institute; VeinCV LLC, Moscow, Russia
rogov@airi.net
Skolkovo Institute of Science and Technology; Artificial Intelligence Research Institute, Moscow, Russia
i.oseledets@skoltech.ru
- Аннотация:
В условиях растущих требований к конфиденциальности данны46х и праву на забвение,
способность эффективно исключать определенные данные из моделей машинного
обучения без повторного обучения с нуля становится решающей.
Машинное разучивание направлено на эффективное устранение влияния
некоторых данных на модель. Мы предлагаем \textbf{UnGAN},
новый подход к машинному разучиванию, использующий генеративно-состязательные
сети (GAN) для удовлетворения растущей потребности в эффективном
и надежном удалении данных из обученных моделей. UnGAN предлагает уникальную
стратегию разучивания через атаку на наличие в обучающей выборке,
где дискриминаторная сеть обучается определять, был ли данный ввод частью
набора данных для обучения модели. Дискриминатор представляет собой
трехслойную полностью соединённую сеть с функциями активации ReLU,
принимающую входы от вывода модели, подвергающейся разучиванию,
и метку класса. Эта архитектура позволяет дискриминатору с высокой
точностью определять статус членства данных, что позволяет
управлять процессом разучивания.
Библ. -- 35 назв.
- Ключевые слова: забывание в моделях машинного обучения, порождающие состязательные сети,
глубокое обучение, доверенный ИИ
[Machine unlearning, generative adversarial networks, deep learning, trustworthy AI]
Полный текст(.pdf)