Back to Templates

ACE-Step-1.5: AI 노래/BGM 생성기 (한글 가사 지원)

ACE-Step-1.5: AI 노래/BGM 생성기 (한글 가사 지원) Diagram

Created By

D
DMS Lab
Verified Creator

Last Update

2026년 2월 7일

How it works

이 워크플로우는 최신 오디오 생성 모델인 ACE-Step-1.5 Turbo를 사용하여 텍스트 프롬프트와 가사를 실제 오디오로 변환합니다. 모델 로드 (Load Models): ACE-Step-1.5 Turbo 체크포인트와 Qwen CLIP 모델, VAE를 로드하여 고품질 오디오 생성을 준비합니다. 텍스트 인코딩 (Text Encoding): 사용자가 입력한 스타일 프롬프트(장르, 악기, 분위기)와 가사(Verse, Chorus 구조)를 AI가 이해할 수 있는 벡터로 변환합니다. 지속 시간 설정 (Duration): 기본 240초(4분)로 설정된 Latent 공간을 생성합니다. (필요에 따라 길이 조절 가능) 샘플링 (Sampling): 25단계의 스텝과 CFG 1.1 설정을 통해 노이즈를 제거하며 음악을 완성합니다. 오디오 저장: 완성된 결과물을 320k 고음질 MP3 파일로 저장합니다.

Key Features

  • 4분 길이 원테이크 생성:
    끊김 없이 한 번에 240초 분량의 완곡을 생성할 수 있습니다.
  • 한글 가사 지원:
    프롬프트에 한글 가사를 입력하면 한국어로 노래를 부릅니다.
  • Turbo 모델 최적화:
    일반 Base 모델 대비 적은 리소스로 빠른 생성이 가능합니다.

Prerequisites (선행 지식)

  • ComfyUI 설치: 최신 버전의 ComfyUI가 로컬 환경에 설치되어 있어야 합니다.
  • ComfyUI-Manager: 커스텀 노드 설치를 위해 필요합니다.
  • Custom Node: ComfyUI-ACE-Step-1.5 노드가 설치되어 있어야 합니다.
  • 모델 파일: acestep_v1.5_turbo.safetensors 등의 모델 파일이 지정된 폴더에 있어야 합니다.

Step-by-step

Step 1: [Manager] -> [Install Custom Nodes]에서 ACE-Step을 검색하여 설치하고 ComfyUI를 재시작합니다.

Step 2: 허깅페이스(HuggingFace)에서 모델 파일들을 다운로드하여 models/diffusion_models, text_encoders, vae 폴더에 각각 넣습니다.

Step 3: 제공된 워크플로우 이미지(PNG)를 ComfyUI 브라우저에 드래그하여 로드합니다.

Step 4: TextEncodeAceStepAudio1.5 노드에서 Prompt(스타일)와 Lyrics(가사)를 원하는 대로 수정합니다.

Step 5: Queue Prompt 버튼을 눌러 생성을 시작하고, 완료되면 결과물을 확인합니다.