ACE-Step v1.5 Base

ПровайдерAce Step

acestep-15-base — генерация аудио-модель от Ace Step.

asynctext_to_audio

Что умеет ACE-Step v1.5 Base

  • Async
  • Text-to-Audio

Стоимость

за секунду
0.042 ₽

Цены указаны в рублях и списываются с баланса проекта за успешные запросы. Надбавки (+) суммируются с базовой ставкой.

Технические характеристики

Vendor
ace-step
Modality
audio

Параметры запроса

Параметры, которые принимает модель. Передаются в теле запроса.

ПараметрТипДиапазон / значенияПо умолчаниюОписание
positivePromptreq
string
min: 2 · max: 3000
Описание желаемой музыки (стиль / жанр / инструменты / настроение).
1 пример
Примеры
Lo-fi hip-hop beat with jazzy piano, vinyl crackle, mellow vibe, 90 BPM.
negativePrompt
string
min: 2 · max: 3000
Что НЕ должно быть в треке. ТРЕБУЕТ CFGScale > 1.
duration
number
min: 6 · max: 300
60
Длина трека в секундах (6..300). НЕ ИСПОЛЬЗУЕТСЯ при inputs.audio (длительность диктует источник).
3 примеров
Примеры
30
60
180
seed
integer
min: 0 · max: 2147483647
Seed для воспроизводимой генерации (32-bit).
steps
integer
min: 1 · max: 300
100
Шаги denoising. Больше — выше качество, медленнее.
CFGScale
number
min: 1 · max: 30
10
Guidance scale. Для использования negativePrompt должен быть > 1.
strength
number
min: 0 · max: 1
0.5
Доля шагов на основе входного источника. ТРЕБУЕТ inputs.audio.
inputs.audio
string
Входящий аудиотрек для remix / cover / repaint (UUID / URL). При его наличии duration / coverConditioningScale / repainting* / strength становятся доступны.
1 пример
Примеры
https://example.com/source-track.mp3
settings.bpm
integer
min: 30 · max: 300
Beats per minute. Авто если не указан.
3 примеров
Примеры
90
128
174
settings.timeSignature
enum
2, 3, 4, 6
Доли на такт. Авто если не указан.
settings.keyScale
string
Тональность в формате "{Note}{Accidental} {Mode}" — например "C major", "F# minor", "Bb dorian".
3 примеров
Примеры
C major
F# minor
Bb dorian
settings.vocalLanguage
enum
unknown, ar, az, bg, bn, ca, cs, da, de, el, en, es, fa, fi, fr, he, hi, hr, ht, hu, id, is, it, ja, ko, la, lt, ms, ne, nl, no, pa, pl, pt, ro, ru, sa, sk, sr, sv, sw, ta, te, th, tl, tr, uk, ur, vi, yue, zh
en
ISO 639-1 язык вокала. "unknown" — для инструментальных треков.
settings.lyrics
string
min: 10 · max: 3000
Текст песни (формат как на lyrics-сайтах: куплеты, припев, инструкции типа [Verse 1] / [Chorus]).
1 пример
Примеры
[Verse 1]
In the city of lights, we dance until dawn
[Chorus]
Forever and ever, just you and me...
settings.coverConditioningScale
number
min: 0 · max: 1
1
Доля шагов с conditioning на source — для cover-режима. ТРЕБУЕТ inputs.audio.
settings.repaintingStart
number
min: -300 · max: 300
Начало перекраски в секундах. ТРЕБУЕТ inputs.audio. Отрицательное значение = prepend (добавить в начало).
settings.repaintingEnd
number
min: 0 · max: 300
Конец перекраски в секундах. ТРЕБУЕТ inputs.audio. Значение за пределами duration = append.
settings.guidanceType
enum
apg, cfg
apg
Тип guidance: apg — Adaptive Projected Guidance, cfg — Classifier-Free Guidance.
audioSettings.bitrate
integer
min: 8
Битрейт kbps. MP3: 8..320; OGG mono: 8..224; OGG stereo: 16..256. Не применяется к WAV/FLAC.
audioSettings.sampleRate
enum
8000, 16000, 44100, 48000
Частота дискретизации в Hz.
audioSettings.channels
enum
1, 2
2
Каналы: 1 — mono, 2 — stereo.
numberResults
integer
min: 1 · max: 4
1
Сколько вариаций сгенерировать (разные seeds).
outputType
enum
URL, base64Data, dataURI
URL
Формат доставки.
outputFormat
enum
MP3, WAV, FLAC, OGG
MP3
Формат аудиофайла. WAV/FLAC — без компрессии (audioSettings игнорируется).
async
boolean
false
true → task_id для async-polling. false (default) → sync.
safety.checkContent
boolean
false
Включить проверку контента.
safety.mode
enum
none, fast
none
Режим safety-сканера.
webhookURL
string
URL для POST-уведомления async.
1 пример
Примеры
https://yourapp.com/webhooks/runware
uploadEndpoint
string
Presigned URL для автозагрузки.
1 пример
Примеры
https://bucket.s3.amazonaws.com/result.mp3?X-Amz-Signature=...

Параметры ответа

Что возвращает API. У медиа-моделей формат зависит от режима: sync — сразу результат, async — task_id для опроса через GET /v1/tasks/{id}. Эта модель работает только в async-режиме.

Sync (HTTP 200)

Для TTS короткого input: HTTP 200, **binary audio** (Content-Type: audio/mpeg / audio/wav / ...). Это НЕ JSON — это байты файла.

Binary response. Content-Type: audio/mpeg, audio/wav, audio/opus, audio/ogg

Async (HTTP 202)

Если is_async_only=1 (music gen) или async:true в запросе. HTTP 202 + JSON.

ПолеТипЗначенияОписание
id
string
task_id для GET /v1/tasks/{id}.
object
string
audio.task
status
enum
queued, processing, completed, failed
model
string
created
integer

Опрос статуса (GET /v1/tasks/{id})

GET /v1/tasks/{id}.

ПолеТипЗначенияОписание
id
string
status
enum
queued, processing, completed, failed, canceled
modality
string
audio
model
string
data
array
Каждый элемент:
  • url— string · CDN URL .mp3 / .wav. Для Suno music — 1-2 файла (варианты трека).
error
string

Пример кода

acestep-15-base_example.py
from openai import OpenAI

client = OpenAI(api_key="rk_live_...", base_url="https://api.ranvik.ru/v1")
resp = client.audio.speech.create(
    model= "acestep-15-base",
    positivePrompt= "Пример промпта",
    negativePrompt= "Пример промпта",
    duration= 60,
    seed= 1073741824,
    steps= 100,
    CFGScale= 10,
    strength= 0.5,
    "inputs.audio": "Пример промпта",
    "settings.bpm": 165,
    "settings.timeSignature": 2,
    "settings.keyScale": "value",
    "settings.vocalLanguage": "en",
    "settings.lyrics": "Текст песни",
    "settings.coverConditioningScale": 1,
    "settings.repaintingStart": 0,
    "settings.repaintingEnd": 150,
    "settings.guidanceType": "apg",
    "audioSettings.bitrate": 8,
    "audioSettings.sampleRate": 8000,
    "audioSettings.channels": 2,
    numberResults= 1,
    outputType= "URL",
    outputFormat= "MP3",
    async= False,
    "safety.checkContent": False,
    "safety.mode": "none",
    webhookURL= "https://example.com/...",
    uploadEndpoint= "value",
)
print(resp)
Полная документация модели