Releases · primepake/learnable-speech

Sample Rate: 24kHz mono audio processing
Architecture: Variational Autoencoder (VAE) with continuous latent space
Model Type: Discrete Audio Codec (DAC) based VAE implementation

This release introduces the DAC-VAE model configured for 24kHz mono audio with continuous latent space representation.

Optimized for single-channel (mono) audio at 24kHz sampling rate
Continuous latent space representation for smooth interpolation between audio samples
Suitable for audio generation, compression, and manipulation tasks

cd dac-vae
python inference.py --checkpoint checkpoint.pt --config config.yml

Provide feedback