📚 Módulo 9: Gestión de Recursos y Problemas Comunes

Incluso con QLoRA, es posible el agotamiento de memoria en Colab. Estrategias:

Comienza con 1 o 2. Compensa con gradient_accumulation_steps.

Reduce de 512 a 256 o 384 si el contenido lo permite.

model = torch.compile(model)

Puede acelerar el entrenamiento y reducir la memoria, pero no siempre es estable.

torch.cuda.empty_cache()

Útil después de cargar el modelo o entre experimentos.

Normal si se carga con trust_remote_code=True o se usa PEFT. No es crítico.

Usa optim="adamw_bnb_8bit" o optim="paged_adamw_8bit" en TrainingArguments.

Ignorar. Trainer maneja el modo automáticamente.

← Module8

Course: AI-course3

Language: ES

Lesson: Module9