Stem Splitter + Remix

Python FastAPI HTDemucs v4 WaveSurfer.js Web Audio API Async Processing Audio AI
Stem Splitter + Remix

Stem Splitter + Remix Inteligente

Una aplicación web donde el usuario sube cualquier canción y la IA la separa en 4 stems (voces, batería, bajo, melodía) en segundos. Desde esa misma pantalla puede hacer remix en tiempo real: ajustar BPM, transponer la tonalidad, silenciar o potenciar cada stem y exportar el resultado.

Por qué HTDemucs v4

HTDemucs v4 (MIT license) es el modelo de separación de fuentes de Meta AI con mejor SDR en benchmarks 2024. Supera a Spleeter (2019, TensorFlow 1.x) en 3-5 dB SDR en todas las pistas. El modelo htdemucs_ft (fine-tuned) ofrece la mejor calidad para voces complejas sin artefactos.

Arquitectura

  • Backend: FastAPI + Uvicorn con procesamiento asíncrono. El usuario sube el audio, recibe un job_id y hace polling hasta que los stems están listos.
  • Motor IA: HTDemucs v4 (htdemucs_ft) — 4 stems: vocals, drums, bass, other
  • Frontend: WaveSurfer.js 7 para visualización de formas de onda. Web Audio API para playback y mezcla en tiempo real.

Stack técnico

  • HTDemucs v4 (MIT): mejor modelo open-source de separación de fuentes de Meta AI
  • FastAPI + Uvicorn: API asíncrona con procesamiento en background tasks
  • WaveSurfer.js 7: visualización declarativa de formas de onda por stem
  • Web Audio API nativa: mezcla en tiempo real con GainNodes independientes por stem

Resultados

4
stems separados
v4
HTDemucs versión
MIT
licencia
50MB
tamaño máximo

Funcionalidades implementadas

  • HTDemucs v4 — SOTA 2024. Modelo fine-tuned de Meta AI con el mejor SDR del mercado. 3-5 dB superior a Spleeter con menos artefactos en voces complejas
  • Remix en tiempo real. Web Audio API nativa con GainNodes independientes por stem. Sin latencia, sin recodificación
  • Visualización con WaveSurfer 7. Formas de onda en color por stem, interactivas y sincronizadas con el playback
  • API abierta. FastAPI backend con endpoints documentados para integración en producción o B2B
Try Live Demo View Code
🤖 Asistente Virtual