Stem Splitter + Remix Inteligente
Una aplicación web donde el usuario sube cualquier canción y la IA la separa en 4 stems (voces, batería, bajo, melodía) en segundos. Desde esa misma pantalla puede hacer remix en tiempo real: ajustar BPM, transponer la tonalidad, silenciar o potenciar cada stem y exportar el resultado.
Por qué HTDemucs v4
HTDemucs v4 (MIT license) es el modelo de separación de fuentes de Meta AI con mejor SDR en benchmarks 2024. Supera a Spleeter (2019, TensorFlow 1.x) en 3-5 dB SDR en todas las pistas. El modelo htdemucs_ft (fine-tuned) ofrece la mejor calidad para voces complejas sin artefactos.
Arquitectura
- Backend: FastAPI + Uvicorn con procesamiento asíncrono. El usuario sube el audio, recibe un job_id y hace polling hasta que los stems están listos.
- Motor IA: HTDemucs v4 (htdemucs_ft) — 4 stems: vocals, drums, bass, other
- Frontend: WaveSurfer.js 7 para visualización de formas de onda. Web Audio API para playback y mezcla en tiempo real.
Stack técnico
- HTDemucs v4 (MIT): mejor modelo open-source de separación de fuentes de Meta AI
- FastAPI + Uvicorn: API asíncrona con procesamiento en background tasks
- WaveSurfer.js 7: visualización declarativa de formas de onda por stem
- Web Audio API nativa: mezcla en tiempo real con GainNodes independientes por stem