Microservicios y arquitectura de sistemas para IA Aplicada
Imagina que los microservicios son naves espaciales modulares y Docker es tu cosmódromo personal para ensamblarlas. Aquí aprenderás a diseñar "estaciones orbitales" para Agentes de IA: dividir sistemas monolíticos en servicios-satélite autónomos, configurar su interacción a través de protocolos interestelares (REST/gRPC) y automatizar el despliegue con cohetes portadores CI/CD. Estas habilidades permitirán que tus redes neuronales se escalen como un imperio galáctico, se actualicen sin tiempo de inactividad y sobrevivan a fallos de componentes individuales sin el colapso de todo el sistema.
Instrucciones para Ask AI
Dado que estos temas no cambian con el tiempo, lo mejor es estudiarlos con un profesor personal: ChatGPT.
El proceso de estudio debe ser el siguiente:
- Creas un prompt de sistema para ChatGPT (plantillas), donde describes tus antecedentes, preferencias, nivel de detalle de las explicaciones, etc.
- Copias el tema de la lista (triple clic) y le pides a ChatGPT que te explique ese tema.
- Si deseas profundizar, haz preguntas aclaratorias.
Actualmente, esta es la forma más conveniente de aprender los conceptos básicos. Además de los conceptos, puedes estudiar materiales adicionales en las secciones Gold, Silver, Extra.
- Gold: es imprescindible estudiar antes de interactuar con ChatGPT.
- Ask AI: haz preguntas sobre cada tema desconocido.
- Silver: materiales secundarios.
- Extra: temas avanzados.
Golden
1. Videos
sys des: docker
2. Arquitecturas para GenAI
Arquitectura estándar para un Agente de IA
- Necesitamos un proxy para LLM para cumplir con el rate-limiting.
- Necesitamos un proxy para la API externa para cumplir con el rate-limiting y el almacenamiento en caché de los resultados.
- Necesitamos una puerta de enlace (gateway) frente al backend para clasificar las solicitudes, determinar los roles del usuario (nivel de pago, nivel gratuito), establecer límites en el tamaño del contexto, etc., establecer el rate-limiting, etc.
Ask AI
-
Conceptos básicos de la arquitectura de microservicios (Guía de inicio)
-
Microservicios vs Monolito: comparación completa de arquitecturas
-
Domain-Driven Design: principios básicos para microservicios
-
API Gateway: patrones para principiantes (Resumen)
-
Docker para servicios de IA: prácticas mínimas necesarias
-
Kubernetes: fundamentos de la orquestación para desarrolladores de IA
-
Balanceo de carga de tareas de GPU: enfoques básicos
-
Versionado de modelos de IA: versionado semántico
-
Pruebas A/B de modelos: casos de producción (Breve resumen)
-
Seguridad de los servicios de IA: OAuth2/JWT en la práctica
-
Rate limiting para operaciones de IA: fundamentos para principiantes
-
CI/CD para IA: pipeline de trabajo mínimo
-
GRPC vs REST: comparación para API de IA (Concepto)
-
Almacenamiento en caché de resultados de modelos ML: estrategias básicas
-
Circuit Breaker: principio de funcionamiento e implementación
-
Monitorización de servicios de redes neuronales: métricas clave
-
Almacenamiento en caché: TTL vs invalidación (Análisis comparativo)
Almacenamiento en caché: estrategias e invalidación de la caché
-
Message Queue: conceptos básicos y casos de uso (Resumen)