Lorena & Jose, Generación de Imágenes con SDEs y Procesos de Difusión

Visión General

Este proyecto explora la generación de imágenes sintéticas mediante modelos de difusión basados en el formalismo de Ecuaciones Diferenciales Estocásticas (SDEs), siguiendo el marco teórico propuesto por Song et al. (2021) en "Score-Based Generative Modeling through Stochastic Differential Equations". El objetivo principal es implementar, analizar y evaluar un sistema modular para la generación de imágenes de alta fidelidad, investigando el impacto de diferentes formulaciones de SDEs, algoritmos de muestreo (samplers), arquitecturas de modelos de score, y técnicas de generación condicional e imputación.

El código está implementado principalmente en Python utilizando PyTorch. Se proporcionan cuadernos de Jupyter (notebooks) para facilitar la experimentación, la visualización de resultados y el cálculo de métricas de evaluación.

Características Principales

Múltiples Formulaciones de SDEs:
- Variance Exploding SDE (VE-SDE)
- Variance Preserving SDE (VP-SDE) con schedules de ruido lineal y cosenoidal.
- Sub-Variance Preserving SDE (SubVP-SDE) con schedules de ruido lineal y cosenoidal.
Diversos Algoritmos de Muestreo (Samplers):
- Integrador de Euler-Maruyama.
- Muestreadores de Predictor-Corrector (PC).
- Solucionadores para la Probability Flow ODE (incluyendo un integrador exponencial de Euler).
Generación Condicional por Clase:
- Implementación de guiado por clasificador utilizando un modelo TimeDependentWideResNet.
- Muestreador condicional Euler-Maruyama.
Imputación de Imágenes:
- Capacidad para rellenar regiones faltantes en imágenes utilizando un sampler de imputación dedicado.
Modelos de Score Flexibles:
- Arquitecturas basadas en U-Net (incluyendo una similar a NCSN++) para la estimación del score $\nabla_x \log p_t(x)$.
- Embeddings de tiempo mediante Gaussian Random Fourier Features.
Métricas de Evaluación Estándar:
- Fréchet Inception Distance (FID).
- Inception Score (IS).
- Bits Per Dimension (BPD) / Negative Log-Likelihood (NLL) vía Probability Flow ODE.
Cuadernos Interactivos: Jupyter notebooks para configuración de experimentos, generación, visualización y evaluación.
Modelos Pre-entrenados: Se proporcionan (o se enlaza a) modelos de score y clasificadores pre-entrenados para facilitar la experimentación sin necesidad de largos procesos de entrenamiento.

Fundamentos Teóricos (Breve)

El enfoque se basa en modelar la generación de datos como la inversión de un proceso de difusión definido por una SDE:

Proceso Directo (Forward SDE): Una SDE predefinida $dx = f(x,t)dt + g(t)dW(t)$ transforma gradualmente una muestra de datos $x(0)$ en ruido $x(T)$ (distribución prior) a lo largo del tiempo $t \in [0, T]$.
Proceso Inverso (Reverse-Time SDE): Existe una SDE inversa $dx = [f(x,t) - g(t)^2 \nabla_x \log p_t(x)]dt + g(t)d\bar{W}(t)$ que, si se conoce el score $\nabla_x \log p_t(x)$ de la distribución de datos perturbados en cada instante $t$, puede transformar muestras de la distribución prior $x(T)$ de nuevo en muestras de la distribución de datos $x(0)$.
Estimación del Score: Un modelo de red neuronal $s_\theta(x,t)$ se entrena para aproximar $\nabla_x \log p_t(x)$ mediante técnicas de score matching.
Probability Flow ODE: Una ODE determinista $dx = [f(x,t) - \frac{1}{2}g(t)^2 \nabla_x \log p_t(x)]dt$ comparte las mismas marginales que la SDE y permite el cálculo exacto de la verosimilitud.

Para más detalles teóricos, se recomienda consultar Song et al., "Score-Based Generative Modeling through Stochastic Differential Equations", ICLR 2021.

Estructura del Proyecto

El repositorio está organizado en los siguientes directorios principales:

diffusion/: Implementaciones de los procesos de difusión SDE (sde.py) y los schedules de ruido (schedules.py).
models/: Arquitecturas de los modelos de score (base_model.py, score_model.py, score_net.py) y el clasificador dependiente del tiempo (classifier.py, conteniendo TimeDependentWideResNet).
samplers/: Algoritmos de muestreo para generación incondicional (euler_maruyama.py, predictor_corrector.py, probability_flow_ode.py, exponential_integrator.py).
conditional_samplers/: Algoritmos de muestreo para generación condicional (euler_maruyama_conditional_class.py, etc.).
metrics/: Implementación de las métricas de evaluación (bpd.py, fid.py, inception_score.py).
imputation/: Lógica para la imputación de imágenes (imputation.py).
utils/: Funciones de utilidad, especialmente para visualización (diffusion_utilities.py).
notebooks/: Cuadernos de Jupyter para la experimentación (e.g., Generacion_Incondicional_CIFAR10.ipynb, Generacion_Condicional_CIFAR10.ipynb, Imputacion_Imagenes.ipynb).
scripts/: (Opcional) Scripts para entrenamiento de modelos, ejecución batch de evaluaciones, etc.
checkpoints/: Directorio para guardar/cargar los modelos pre-entrenados.
data/: (Opcional) Para almacenar datasets pequeños o metadatos.
tests/: Pruebas unitarias y de integración implementadas con pytest.

Configuración e Instalación

Prerrequisitos

Python 3.8+
PyTorch (versión X.Y.Z, idealmente con soporte CUDA si se dispone de GPU)
NumPy
SciPy
Matplotlib
Seaborn (para algunos gráficos de visualización de métricas)
torchvision
tqdm
scikit-image (para algunas métricas o utilidades)
(Opcional) Otras librerías específicas que hayas usado.

Pasos de Instalación

Clona este repositorio:

git clone [https://www.youtube.com/watch?v=KrJwqsuhZ8U](https://www.youtube.com/watch?v=KrJwqsuhZ8U)
cd [Nombre de tu repositorio]

Se recomienda crear un entorno virtual:

python -m venv env
source env/bin/activate  # En Linux/macOS
# env\Scripts\activate  # En Windows

Instala las dependencias:
```
pip install -r requirements.txt
```
(Deberás crear un archivo requirements.txt con todas las librerías y sus versiones, e.g., torch==X.Y.Z, torchvision==A.B.C, numpy, etc.)

Conjuntos de Datos

CIFAR-10: Se descarga automáticamente a través de torchvision.datasets.CIFAR10.
MNIST: Se descarga automáticamente a través de torchvision.datasets.MNIST.
(Si usas otros datasets, indica cómo obtenerlos).

Modelos Pre-entrenados

Se proporcionan modelos de score y clasificadores pre-entrenados para facilitar la experimentación sin largos tiempos de entrenamiento. Estos se encuentran en el directorio checkpoints/ o pueden ser descargados desde [Enlace a tus modelos pre-entrenados, si los alojas externamente]. Los cuadernos de Jupyter están configurados para cargar estos modelos por defecto.

Uso

La forma principal de interactuar con el proyecto es a través de los cuadernos de Jupyter ubicados en el directorio notebooks/.

Estructura General de los Cuadernos

Configuración Inicial: Las primeras celdas permiten definir hiperparámetros globales (dataset, tipo de SDE, modelo de score a cargar, dispositivo CPU/GPU).
Selección del Sampler: Se puede elegir el algoritmo de muestreo y sus parámetros específicos (número de pasos, etc.).
Generación de Muestras: Se ejecuta el proceso de generación.
Visualización: Se muestran las imágenes generadas y, en muchos casos, la evolución del proceso de muestreo.
Evaluación (Opcional): Celdas para calcular métricas (FID, IS, BPD) sobre las muestras generadas.

Ejemplos de Uso

Generación Incondicional:
- Abrir notebooks/Generacion_Incondicional_CIFAR10.ipynb (o el análogo para MNIST).
- Configurar el tipo de SDE (VE, VP-Lineal, VP-Cosenoidal, SubVP-Lineal, SubVP-Cosenoidal) y cargar el modelo de score correspondiente.
- Seleccionar uno o varios samplers (Euler-Maruyama, Predictor-Corrector, etc.) y sus parámetros.
- Ejecutar las celdas para generar imágenes y visualizar la evolución.
- Ejecutar las celdas de métricas para una evaluación cuantitativa.
Generación Condicional por Clase:
- Abrir notebooks/Generacion_Condicional_CIFAR10.ipynb.
- Seleccionar el modelo SDE base (VE, VP-Lineal, SubVP-Lineal), lo que cargará el modelo de score incondicional y el clasificador TimeDependentWideResNet entrenado específicamente para esa SDE.
- Elegir la clase objetivo de CIFAR-10 y el número de muestras.
- Configurar el ConditionalEulerMaruyamaSampler (e.g., guidance_scale).
- Ejecutar para generar imágenes de la clase seleccionada.
Imputación de Imágenes:
- Abrir notebooks/Imputacion_Imagenes.ipynb.
- Cargar una imagen y una máscara (se proporcionan ejemplos con MNIST sobre CIFAR-10).
- Seleccionar el modelo de score y configurar el imputation_sampler.
- Ejecutar para rellenar las regiones enmascaradas.

Componentes Implementados

SDEs

VESDE (Variance Exploding)
VPSDE (Variance Preserving)
SubVPSDE (Sub-Variance Preserving)

Schedules de Ruido

LinearSchedule
CosineSchedule

Arquitecturas de Modelo de Score

ScoreNet (basada en U-Net, estilo NCSN++ adaptable) con bloques como ResidualBlock, SelfAttentionBlock, Downsample, Upsample.
Embeddings de tiempo GaussianRandomFourierFeatures.

Arquitectura del Clasificador

TimeDependentWideResNet (WRN-28-10 modificada para dependencia temporal).

Samplers (Incondicionales y Condicionales)

Euler-Maruyama (incondicional y condicional)
Predictor-Corrector (incondicional y condicional VE, VP/SubVP)
Probability Flow ODE Integrator (incondicional)
Exponential Euler ODE Sampler (incondicional)
Imputation Sampler

Métricas

Bits Per Dimension (BPD) y Negative Log-Likelihood (NLL) vía ODE
Fréchet Inception Distance (FID)
Inception Score (IS)

Resultados de Ejemplo

(Esta sección es opcional para el README, puedes enlazar a la memoria o a los notebooks)

Las experimentaciones indican (para CIFAR-10):

El modelo SubVP-SDE Lineal tiende a ofrecer los mejores resultados en métricas perceptuales como FID e IS.
Los modelos SubVP-SDE Cosenoidal y VP-SDE Cosenoidal destacan en BPD (verosimilitud).
Existe un trade-off entre optimizar la verosimilitud y la calidad perceptual.
La generación condicional permite dirigir la síntesis hacia clases específicas con éxito variable según la SDE y el clasificador.

Se recomienda consultar los cuadernos de Jupyter y la memoria del proyecto para un análisis detallado de los resultados y más ejemplos visuales.

Pruebas

El proyecto incluye un conjunto de pruebas unitarias y de integración desarrolladas con pytest. Para ejecutar las pruebas, desde el directorio raíz del proyecto:

pytest

Name		Name	Last commit message	Last commit date
Latest commit History 1 Commit
.vscode		.vscode
checkpoints		checkpoints
checkpoints_MNIST		checkpoints_MNIST
checkpoints_classifier		checkpoints_classifier
conditional_samplers		conditional_samplers
diffusion		diffusion
imputation		imputation
metrics		metrics
models		models
samplers		samplers
tests		tests
utils		utils
.gitattributes		.gitattributes
Diagrama_de_Gantt.pdf		Diagrama_de_Gantt.pdf
Entrenamiento_ScoreNet.ipynb		Entrenamiento_ScoreNet.ipynb
Entrenamiento_Wideresnet.ipynb		Entrenamiento_Wideresnet.ipynb
Generacion Condicional CIFAR10.ipynb		Generacion Condicional CIFAR10.ipynb
Generacion Condicional MNIST3.ipynb		Generacion Condicional MNIST3.ipynb
Generacion Incondicional CIFAR10.ipynb		Generacion Incondicional CIFAR10.ipynb
Informe_Arbelaez_Mohanu.pdf		Informe_Arbelaez_Mohanu.pdf
README.md		README.md
configuration_conditional_class_notebook.py		configuration_conditional_class_notebook.py
configuration_notebook_cifar10.py		configuration_notebook_cifar10.py
demo_Imputation.ipynb		demo_Imputation.ipynb
demo_metricas.ipynb		demo_metricas.ipynb
diagrama_clases_completo.svg		diagrama_clases_completo.svg
graficas.ipynb		graficas.ipynb
pytest.ini		pytest.ini
resultados_sdes_CIFAR10.json		resultados_sdes_CIFAR10.json

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Lorena & Jose, Generación de Imágenes con SDEs y Procesos de Difusión

Visión General

Características Principales

Fundamentos Teóricos (Breve)

Estructura del Proyecto

Configuración e Instalación

Prerrequisitos

Pasos de Instalación

Conjuntos de Datos

Modelos Pre-entrenados

Uso

Estructura General de los Cuadernos

Ejemplos de Uso

Componentes Implementados

SDEs

Schedules de Ruido

Arquitecturas de Modelo de Score

Arquitectura del Clasificador

Samplers (Incondicionales y Condicionales)

Métricas

Resultados de Ejemplo

Pruebas

About

Uh oh!

Releases

Packages

Uh oh!

Contributors

Uh oh!

Languages

Folders and files

Latest commit

History

Repository files navigation

Lorena & Jose, Generación de Imágenes con SDEs y Procesos de Difusión

Visión General

Características Principales

Fundamentos Teóricos (Breve)

Estructura del Proyecto

Configuración e Instalación

Prerrequisitos

Pasos de Instalación

Conjuntos de Datos

Modelos Pre-entrenados

Uso

Estructura General de los Cuadernos

Ejemplos de Uso

Componentes Implementados

SDEs

Schedules de Ruido

Arquitecturas de Modelo de Score

Arquitectura del Clasificador

Samplers (Incondicionales y Condicionales)

Métricas

Resultados de Ejemplo

Pruebas

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

Packages