Teoría sobre Bases de Datos

Imagina que las bases de datos son los cimientos de una casa para tus Agentes de IA. Aquí analizaremos cómo diseñar "almacenes de memoria" para redes neuronales, para que tus sistemas puedan encontrar rápidamente los datos necesarios, como un bibliotecario en un universo de libros gigantesco. Aprenderás a elegir entre SQL y NoSQL (como seleccionar llaves para diferentes cajas fuertes), optimizar consultas (como construir autopistas para los datos) y garantizar la fiabilidad de las transacciones; estas habilidades te transformarán de novato en arquitecto de sistemas de IA industriales.

Instrucciones para Ask AI

instrucción

Dado que estos temas no cambian con el tiempo, lo mejor es estudiarlos con un profesor personal: ChatGPT.

El proceso de estudio debe ser el siguiente:

Creas un prompt de sistema para ChatGPT (plantillas), donde describes tu experiencia, preferencias, nivel de detalle de las explicaciones, etc.
Copias el tema de la lista (triple clic) y le pides a ChatGPT que te explique ese tema.
Si deseas profundizar, haz preguntas aclaratorias.

Actualmente, esta es la forma más conveniente de estudiar los fundamentos. Además de los conceptos, puedes estudiar materiales adicionales en las secciones Gold, Silver, Extra.

Gold: es imprescindible estudiar antes de interactuar con ChatGPT.
Ask AI: haz preguntas sobre cada tema desconocido.
Silver: materiales secundarios.
Extra: temas avanzados.

Golden

bytebyte db playlist - https://youtube.com/playlist?list=PLCRMIe5FDPsdnSszazqVIQFh99t1ExH19&si=3tVd_dGWxmtQ2pQo

Fireship

Ask AI

Conceptos básicos de bases de datos

Arquitectura de bases de datos: componentes y términos principales (Fundamentos)
Bases de datos relacionales: de la normalización a las relaciones entre tablas
Claves en bases de datos: diseño de relaciones e integridad de datos
Operaciones CRUD: patrones de trabajo con datos (Prácticas)

SQL y trabajo con datos

SQL: sintaxis para tareas cotidianas (Hoja de referencia)
Consultas SELECT: técnicas avanzadas de filtrado
Operaciones JOIN: visualización de relaciones entre tablas
Transacciones: escritura de operaciones atómicas

NoSQL y enfoques modernos para el almacenamiento de datos

SQL vs NoSQL: comparación de modelos de datos

SQL vs NoSQL: comparación de modelos de datos
Bases de datos orientadas a documentos: MongoDB y trabajo con datos JSON
Propiedades ACID: transacciones en bases de datos

Propiedades ACID: transacciones en bases de datos

Optimización y aspectos prácticos

Índices en bases de datos: principios de funcionamiento y optimización
ORM: ventajas y desventajas
Relaciones en bases de datos: uno a uno, uno a muchos, muchos a muchos
Paginación: enfoques basados en offset vs cursor

Paginación: enfoques basados en offset vs cursor
Almacenes clave-valor: Redis y almacenamiento en caché (Resumen)
Bases de datos de grafos: fundamentos del trabajo con Neo4j (Concepto)

Silver

I replaced my entire tech stack with Postgres...

Exercises

Ejercicio: Optimización de consultas lentas en PostgreSQL

Situación: Tenemos una tabla user_actions en PostgreSQL con 10 millones de registros:

CREATE TABLE user_actions (
    id SERIAL PRIMARY KEY,
    user_id INT NOT NULL,
    action_type VARCHAR(50) NOT NULL,
    created_at TIMESTAMP DEFAULT NOW(),
    metadata JSONB
);

Problema: La siguiente consulta tarda 2.8 segundos en ejecutarse:

SELECT * FROM user_actions 
WHERE user_id = 123 
  AND action_type = 'search'
ORDER BY created_at DESC 
LIMIT 100;

Tarea:

Explica por qué la consulta se ha vuelto lenta
Propón una solución mediante índices
Escribe el SQL para crear el índice
Explica las ventajas y desventajas de tu solución

Respuesta

Razón de la lentitud: Falta un índice adecuado para las condiciones WHERE y ORDER BY
Solución: Crear un índice compuesto que cubra el filtrado y la ordenación
SQL:

CREATE INDEX idx_user_actions_composite ON user_actions 
  (user_id, action_type, created_at DESC);

Ventajas y desventajas:

Aumento del tamaño de la base de datos en ~15-20%
Ligera ralentización de las operaciones INSERT/UPDATE
Se recomienda utilizar CONCURRENTLY para la creación en producción:

CREATE INDEX CONCURRENTLY idx_user_actions_composite ...;

Golden​

Ask AI​

Conceptos básicos de bases de datos​

SQL y trabajo con datos​

NoSQL y enfoques modernos para el almacenamiento de datos​

Optimización y aspectos prácticos​

Silver​

Exercises​