Microservicios y arquitectura de sistemas para IA Aplicada

Imagina que los microservicios son naves espaciales modulares y Docker es tu cosmódromo personal para ensamblarlas. Aquí aprenderás a diseñar "estaciones orbitales" para Agentes de IA: dividir sistemas monolíticos en servicios-satélite autónomos, configurar su interacción a través de protocolos interestelares (REST/gRPC) y automatizar el despliegue con cohetes portadores CI/CD. Estas habilidades permitirán que tus redes neuronales se escalen como un imperio galáctico, se actualicen sin tiempo de inactividad y sobrevivan a fallos de componentes individuales sin el colapso de todo el sistema.

Instrucciones para Ask AI

instrucción

Dado que estos temas no cambian con el tiempo, lo mejor es estudiarlos con un profesor personal: ChatGPT.

El proceso de estudio debe ser el siguiente:

Creas un prompt de sistema para ChatGPT (plantillas), donde describes tus antecedentes, preferencias, nivel de detalle de las explicaciones, etc.
Copias el tema de la lista (triple clic) y le pides a ChatGPT que te explique ese tema.
Si deseas profundizar, haz preguntas aclaratorias.

Actualmente, esta es la forma más conveniente de aprender los conceptos básicos. Además de los conceptos, puedes estudiar materiales adicionales en las secciones Gold, Silver, Extra.

Gold: es imprescindible estudiar antes de interactuar con ChatGPT.
Ask AI: haz preguntas sobre cada tema desconocido.
Silver: materiales secundarios.
Extra: temas avanzados.

Golden

1. Videos

sys des: docker

2. Arquitecturas para GenAI

Arquitectura estándar para un Agente de IA

Necesitamos un proxy para LLM para cumplir con el rate-limiting.
Necesitamos un proxy para la API externa para cumplir con el rate-limiting y el almacenamiento en caché de los resultados.
Necesitamos una puerta de enlace (gateway) frente al backend para clasificar las solicitudes, determinar los roles del usuario (nivel de pago, nivel gratuito), establecer límites en el tamaño del contexto, etc., establecer el rate-limiting, etc.

Ask AI

Conceptos básicos de la arquitectura de microservicios (Guía de inicio)
Microservicios vs Monolito: comparación completa de arquitecturas
Domain-Driven Design: principios básicos para microservicios
API Gateway: patrones para principiantes (Resumen)
Docker para servicios de IA: prácticas mínimas necesarias
Kubernetes: fundamentos de la orquestación para desarrolladores de IA
Balanceo de carga de tareas de GPU: enfoques básicos
Versionado de modelos de IA: versionado semántico
Pruebas A/B de modelos: casos de producción (Breve resumen)
Seguridad de los servicios de IA: OAuth2/JWT en la práctica
Rate limiting para operaciones de IA: fundamentos para principiantes
CI/CD para IA: pipeline de trabajo mínimo
GRPC vs REST: comparación para API de IA (Concepto)
Almacenamiento en caché de resultados de modelos ML: estrategias básicas
Circuit Breaker: principio de funcionamiento e implementación
Monitorización de servicios de redes neuronales: métricas clave
Almacenamiento en caché: TTL vs invalidación (Análisis comparativo)

Almacenamiento en caché: estrategias e invalidación de la caché
Message Queue: conceptos básicos y casos de uso (Resumen)

Silver

System Design Tutorial, 53 min, fully with animations

Golden​

1. Videos​

2. Arquitecturas para GenAI​

Arquitectura estándar para un Agente de IA​

Ask AI​

Silver​

Extra​