"Записки научных семинаров ПОМИ"
Том 540, стр. 82-112
Оптимизация конвейера разработки признаков в AutoML с использованием крупных языковых моделей
И. Л. Иов, Н. О. Никитин
ITMO University, St. Petersburg, Russia
illariov1809@gmail.com
nicl.nno@gmail.com
- Аннотация:
Одним из важных путей достижения более эффективного автоматизированного машинного
обучения является применение мета-оптимизации на всех этапах проектирования
конвейера. В данной работе мы стремимся использовать крупные языковые модели
для этапов разработки признаков как в роли оптимизаторов, так и экспертов
в области знаний. Мы закодировали конвейер разработки признаков на естественном
языке в виде последовательности атомарных операций. ``Черный ящик'' оптимизации
реализован путем запроса конвейера разработки признаков у языковой модели
с использованием подсказки, состоящей из предопределенных инструкций,
описания набора данных и ранее оцененных конвейеров. Для увеличения временной
эффективности и стабильности оптимизации был реализован алгоритм на основе популяций,
генерирующий набор конвейеров с каждым ответом языковой модели вместо одного.
Совместно было предложено многократное улучшение, чтобы предоставить языковой
модели дополнительную доменную информацию. Чтобы проанализировать применимость
предложенного подхода, мы проводим серию экспериментов на открытых наборах данных.
В качестве базового подхода для задачи оптимизации был выбран метод случайного поиска.
Прямые результаты, полученные с использованием модели gpt-3.5-turbo, близки к
базовому подходу с той же временной стоимостью. Генерация конвейеров на основе
популяций превосходит базовый подход и другие методы. Это подтверждает,
что предложенный подход может повысить общую производительность моделей машинного
обучения при таких же временных затратах на оптимизацию и меньшем количестве
токенов для получения результата.
Библ. -- 62 назв.
- Ключевые слова: AutoML, большие языковые модели, извлечение признаков,
оптимизация в модели черного ящика
[AutoML, large language models, feature engineering, black-box optimisation]
Полный текст(.pdf)