Programa del Curso

Introducción a DeepSeek LLM Fine-Tuning

  • Visión general de DeepSeek modelos, p. ej. DeepSeek-R1 y DeepSeek-V3
  • Comprendiendo la necesidad de ajustar finamente LLM
  • Comparación de ajuste fino vs. ingeniería de prompts

Preparando el conjunto de datos para Fine-Tuning

  • Curación de conjuntos de datos específicos de dominio
  • Técnicas de preprocessamiento y limpieza de datos
  • Tokenización y formateo de conjuntos de datos para LLM DeepSeek

Configurando el entorno de Fine-Tuning

  • Configuración de GPU y aceleración TPU
  • Configurar Hugging Face Transformers con DeepSeek LLM
  • Entendiendo los hiperparámetros para el ajuste fino

Entidad de Fine-Tuning DeepSeek LLM

  • Implementación de ajuste fino supervisado
  • Usando LoRA (Adaptación de Bajo Rango) y PEFT (Eficiente en Parámetros Fine-Tuning)
  • Ejecución de ajuste fino distribuido para conjuntos de datos a gran escala

Evaluación y optimización de modelos ajustados finos

  • Evaluar el rendimiento del modelo con métricas de evaluación
  • Manejando el sobreajuste y el subajuste
  • Optimizar la velocidad de inferencia y la eficiencia del modelo

Implementando modelos DeepSeek ajustados finos

  • Empaquetando modelos para despliegue de API
  • Integrando modelos ajustados finos en aplicaciones
  • Escalando implementaciones con computación en la nube y en el borde

Use Cases y aplicaciones del mundo real

  • LLMs ajustados finos para finanzas, atención médica y soporte al cliente
  • Estudios de caso de aplicaciones industriales
  • Consideraciones éticas en modelos de IA específicos de dominio

Resumen y siguientes pasos

Requerimientos

  • Experiencia con marcos de aprendizaje automático y aprendizaje profundo
  • Familiaridad con transformadores y modelos de lenguaje grande (LLMs)
  • Comprensión de técnicas de preprocesamiento de datos y entrenamiento de modelos

Audiencia

  • Investigadores de IA que exploran el ajuste fino de LLM
  • Ingenieros de aprendizaje automático que desarrollan modelos de IA personalizados
  • Desarrolladores avanzados que implementan soluciones impulsadas por IA
 21 Horas

Número de participantes


Precio por Participante​

Próximos cursos

Categorías Relacionadas