Stem Splitter + Remix

Stem Splitter + Remix Inteligente

Una aplicación web donde el usuario sube cualquier canción y la IA la separa en 4 stems (voces, batería, bajo, melodía) en segundos. Desde esa misma pantalla puede hacer remix en tiempo real: ajustar BPM, transponer la tonalidad, silenciar o potenciar cada stem y exportar el resultado.

Por qué HTDemucs v4

HTDemucs v4 (MIT license) es el modelo de separación de fuentes de Meta AI con mejor SDR en benchmarks 2024. Supera a Spleeter (2019, TensorFlow 1.x) en 3-5 dB SDR en todas las pistas. El modelo htdemucs_ft (fine-tuned) ofrece la mejor calidad para voces complejas sin artefactos.

Arquitectura

Backend: FastAPI + Uvicorn con procesamiento asíncrono. El usuario sube el audio, recibe un job_id y hace polling hasta que los stems están listos.
Motor IA: HTDemucs v4 (htdemucs_ft) — 4 stems: vocals, drums, bass, other
Frontend: WaveSurfer.js 7 para visualización de formas de onda. Web Audio API para playback y mezcla en tiempo real.

Stack técnico

HTDemucs v4 (MIT): mejor modelo open-source de separación de fuentes de Meta AI
FastAPI + Uvicorn: API asíncrona con procesamiento en background tasks
WaveSurfer.js 7: visualización declarativa de formas de onda por stem
Web Audio API nativa: mezcla en tiempo real con GainNodes independientes por stem

Stem Splitter + Remix