Оптимизация гиперпараметров для AI Агентов ✦

Изучим искусство тонкой настройки AI систем: от ручной корректировки промптов до создания самооптимизирующихся агентов. Узнаем, как превратить "работает" в "работает безупречно" через системный подход к параметризации.

Стратегии для самооптимизации: автоматически улучшаем промпты, настраиваем гиперпараметры агентов/workflow, создаем адаптивные диалоговые сценарии. Позволяет ботам находить оптимальные решения через поколения улучшений — ваш секрет создания самообучающихся систем!

Questions

Что такое гиперпараметры?
Какие гиперпараметры есть у LLM, workflow, агентов?
Как автоматизировать поиск оптимальных конфигураций?
Всегда ли мы можем позволить себе автоматическую оптимизацию?

Что такое параметры и гиперпараметры?

Параметры - обычно это веса нейронной сети - математические величины, которые мы подбираем в процессе обучения.

Гиперпараметры - это параметры, которые мы настраиваем для оптимизации работы модели. Например,для нейронной сети это может быть количество нейронов в скрытом слое, определенная функция активации (их существует много) и т.д. Для LLM это может быть температура, max_tokens, top_p и т.д.

Виды гиперпараметров

В материалах ниже речь будет идти о гиперпараметрах для нейронных сетей - но я прошу вас думать о них в контексте workflows и агентов. Параметры бывают:

целочисленные - можем двигать значение на +1 или -100
вещественные - можем двигать значение на любую величину, например на 1e-10
булевые - можем включать/выключать определенный режим
строковые - можем менять текст
списковые - можем выбирать из списка значений

Для агетнов это может быть:

длинна истории сообщений в токенах, после достижения которой мы суммаризируем историю
температура
включение/выключение определенных режимов вашего агента
промпты для каждого агента
список инструментов или под-агентов для агента

В контексте LLM-based сервисов гиперпараметры - это параметры, которые мы настраиваем для оптимизации работы всей системы. Например:

для простого чат-бота это может быть:
- системный промпт
- температура
- (значит, мы будем выбирать из нескольких промптов и температур, для генерации наиболее качественных ответов)
для RAG это могут быть:
- k (количество чанков "контекста", которые будут использоваться для аугментации ответа)
- chunk_size (размер чанка)
- chunk_overlap (перекрытие чанков)
- подобласти документов, баз данных
- различные эмбеддинг-модели
- методы предобработки текста
- и т.д. + у более сложных RAG еще больше гиперпараметров
для workflow это могут быть:
- промпты для каждого шага
- типы структур для структурных ответов
- различные способы классификаций для routing
- и т.д.
для агентов это могут быть:
- промпты для каждого агента
- max_iterations
- подагенты
- архитектура
- инструменты
- описания инструментов
- передающиеся от агента к агенту данные
- всё что вы только захотите оптимизировать

Примеры:

Автоматическая настройка промптов: убиваем промпт-инжиниринг раз и два
Эволюционное саморазвитие системы
Оптимизация системы для достижения наилучшего качества/цены/скорости/эффективности и т.д.

Core Algorithms

Text materials: Wikipedia & Иллюстрации

Videos:

1. Grid Search & Random Search

Grid Search: Оценивает все комбинации в предопределенном наборе. Лучше всего подходит для небольших, дискретных пространств, но плохо масштабируется.
Random Search: Случайным образом выбирает гиперпараметры, часто превосходя grid search в высокоразмерных пространствах, эффективно исследуя больше значений.

2. Bayesian Optimization

Механизм: Использует вероятностные модели (например, Gaussian Processes) для предсказания перспективных конфигураций, балансируя исследование и эксплуатацию.
Преимущества: Эффективен для низкоразмерных задач, но испытывает трудности с высокой размерностью.

3. Evolutionary Algorithms

Процесс: Имитирует естественный отбор, итеративно развивая популяции наборов гиперпараметров через мутацию и кроссовер.
Применение: Эффективен для сложных, недифференцируемых пространств поиска (например, neural architecture search).

4. Hyperband & Successive Halving

Hyperband: Комбинирует random search с ранней остановкой, динамически распределяя ресурсы на перспективные конфигурации.
Successive Halving: Агрессивно отсекает неэффективные модели на ранних этапах обучения.

5. Population-Based Training (PBT)

Адаптивная настройка: Одновременно оптимизирует гиперпараметры и веса модели во время обучения, идеально подходит для динамических задач, таких как reinforcement learning.

Genetic Algorithms

Видео ресурсы:

Genetic Algorithm with Solved Example

Ручная Оптимизация

к сведению

Оптимизация гиперпараметров зачастую выполняется в три шага:

Выбор параметров
Эксперимент
Оценка результатов
- где эксперимент может быть большим датасетом вопросов/ответов или сложной автоматической средой,
- а оценка результатов может проводиться людьми-ассесорами (чаще всего эти ассессоры - вы :) ) или более дорогими LLM

Если общая стоимость данного цикла семплинг-эксперимент-оценка слишком высокая (например, 1000$), то мы не сможем строить систему для автоматической оптимизации и будем делать это вручную.

Тогда вы можете выбрать любой алгоритм из изученных ранее, и следовать его инструкциям мануально. Также при ручной оптимизации вам сильно помогут интуиция и дедуктивные рассуждения.

Now we know...

Мы изучили, что такое гиперпараметры, как они влияют на работу GenAI apps, и какие методы оптимизации можно использовать для их настройки. Теперь вы можете применять эти знания для улучшения своих AI систем.

Exercises

Вспомните один из ваших последних проектов:

Как вы думаете, какие гиперпараметры наиболее критичны для вашего проекта?
Какие методы оптимизации вы бы выбрали для своей задачи и почему?

Questions​

Виды гиперпараметров​

Для агетнов это может быть:​

В контексте LLM-based сервисов гиперпараметры - это параметры, которые мы настраиваем для оптимизации работы всей системы. Например:​

Core Algorithms​

1. Grid Search & Random Search​

2. Bayesian Optimization​

3. Evolutionary Algorithms​

4. Hyperband & Successive Halving​

5. Population-Based Training (PBT)​

Genetic Algorithms​

Ручная Оптимизация​

Now we know...​

Exercises​