Перейти к основному содержимому

Микросервисы и системная архитектура для Applied AI

Представьте, что микросервисы - это модульные космические корабли, а Docker - ваш личный космодром для их сборки. Здесь вы научитесь проектировать "орбитальные станции" для AI Агентов: разбивать монолитные системы на автономные сервисы-спутники, настраивать их взаимодействие через межзвёздные протоколы (REST/gRPC) и автоматизировать развёртывание с помощью CI/CD-ракетоносителей. Эти навыки позволят вашим нейросетям масштабироваться как галактическая империя, обновляться без простоев и переживать сбои отдельных компонентов без коллапса всей системы.

Инструкция к Ask AI
инструкция

Так как данные темы не меняются со временем, лучше всего вам изучать их с персональным преподавателем - ChatGPT.

Процесс изучения должен быть следующим:

  • вы составляете системный промпт для ChatGPT (шаблоны), где описываете свой бэкграунд, предпочтения, уровень подробности объяснений и т.д.
  • копируете тему из списка (тройной клик), и просите ChatGPT объяснить вам эту тему
  • при желании углубиться, задаете уточняющие вопросы

На данный момент это самый удобный способ изучения основ. Кроме концептов, вы можете изучать дополнительные материалы в секциях Gold, Silver, Extra.

  1. Gold - стоит обязательно изучить до общения с ChatGPT
  2. Ask AI - задавайте вопросы по каждой малознакомой теме
  3. Silver - второстепенные материалы
  4. Extra - углубленные темы

Golden

1. Videos

Merion

Kuber

CICD

микросервисы

gh actions

sys des: docker

2. Архитектуры для GenAI

Стандартная архитектура для AI Агента

  • прокси к LLM нам нужна для соблюдения rate-limiting
  • прокси к внешнему API нам нужна для соблюдения rate-limiting и кэширования результатов
  • гейтвей перед бэкендом нам нужен для классификации запросов, определения ролей пользователя (paid tier, free tier), установки ограничений на размер контекста и др., установка rate-limiting и др.

Ask AI

Ask ChatGPT

  1. Основные концепции микросервисной архитектуры (Стартовый гайд)

  2. Микросервисы vs Монолит: полное сравнение архитектур

  3. Domain-Driven Design: базовые принципы для микросервисов

  4. API Gateway: паттерны для начинающих (Обзорно)

  5. Docker для AI-сервисов: минимально необходимые практики

  6. Kubernetes: основы оркестрации для AI-разработчиков

  7. Балансировка нагрузки GPU-задач: базовые подходы

  8. Версионирование AI-моделей: семантическое версионирование

  9. A/B тестирование моделей: production-кейсы (Краткий обзор)

  10. Безопасность AI-сервисов: OAuth2/JWT на практике

  11. Rate limiting для AI-операций: основы для начинающих

  12. CI/CD для AI: минимальный рабочий пайплайн

  13. GRPC vs REST: сравнение для AI API (Концепт)

  14. Кэширование результатов ML-моделей: базовые стратегии

  15. Circuit Breaker: принцип работы и реализация

  16. Мониторинг нейросетевых сервисов: ключевые метрики

  17. Кэширование: TTL vs инвалидация (Сравнительный анализ)

    Кэширование: стратегии и инвалидация кэша
  18. Message Queue: базовые концепции и use-cases (Обзорно)

Silver

System Design Tutorial, 53 min, fully with animations

Extra