ACE-Step v1.5 Base
acestep-15-base — генерация аудио-модель от Ace Step.
asynctext_to_audio
Что умеет ACE-Step v1.5 Base
- Async
- Text-to-Audio
Стоимость
за секунду
0.042 ₽
Цены указаны в рублях и списываются с баланса проекта за успешные запросы. Надбавки (+) суммируются с базовой ставкой.
Технические характеристики
Vendor
ace-step
Modality
audio
Параметры запроса
Параметры, которые принимает модель. Передаются в теле запроса.
ПараметрТипДиапазон / значенияПо умолчаниюОписание
positivePromptreqstring
min: 2 · max: 3000
—Описание желаемой музыки (стиль / жанр / инструменты / настроение).
1 пример
Примеры
Lo-fi hip-hop beat with jazzy piano, vinyl crackle, mellow vibe, 90 BPM.
negativePromptstring
min: 2 · max: 3000
—Что НЕ должно быть в треке. ТРЕБУЕТ CFGScale > 1.
durationnumber
min: 6 · max: 300
60Длина трека в секундах (6..300). НЕ ИСПОЛЬЗУЕТСЯ при inputs.audio (длительность диктует источник).
3 примеров
Примеры
30
60
180
seedinteger
min: 0 · max: 2147483647
—Seed для воспроизводимой генерации (32-bit).
stepsinteger
min: 1 · max: 300
100Шаги denoising. Больше — выше качество, медленнее.
CFGScalenumber
min: 1 · max: 30
10Guidance scale. Для использования negativePrompt должен быть > 1.
strengthnumber
min: 0 · max: 1
0.5Доля шагов на основе входного источника. ТРЕБУЕТ inputs.audio.
inputs.audiostring
—
—Входящий аудиотрек для remix / cover / repaint (UUID / URL). При его наличии duration / coverConditioningScale / repainting* / strength становятся доступны.
1 пример
Примеры
https://example.com/source-track.mp3
settings.bpminteger
min: 30 · max: 300
—Beats per minute. Авто если не указан.
3 примеров
Примеры
90
128
174
settings.timeSignatureenum
2, 3, 4, 6
—Доли на такт. Авто если не указан.
settings.keyScalestring
—
—Тональность в формате "{Note}{Accidental} {Mode}" — например "C major", "F# minor", "Bb dorian".
3 примеров
Примеры
C major
F# minor
Bb dorian
settings.vocalLanguageenum
unknown, ar, az, bg, bn, ca, cs, da, de, el, en, es, fa, fi, fr, he, hi, hr, ht, hu, id, is, it, ja, ko, la, lt, ms, ne, nl, no, pa, pl, pt, ro, ru, sa, sk, sr, sv, sw, ta, te, th, tl, tr, uk, ur, vi, yue, zh
enISO 639-1 язык вокала. "unknown" — для инструментальных треков.
settings.lyricsstring
min: 10 · max: 3000
—Текст песни (формат как на lyrics-сайтах: куплеты, припев, инструкции типа [Verse 1] / [Chorus]).
1 пример
Примеры
[Verse 1] In the city of lights, we dance until dawn [Chorus] Forever and ever, just you and me...
settings.coverConditioningScalenumber
min: 0 · max: 1
1Доля шагов с conditioning на source — для cover-режима. ТРЕБУЕТ inputs.audio.
settings.repaintingStartnumber
min: -300 · max: 300
—Начало перекраски в секундах. ТРЕБУЕТ inputs.audio. Отрицательное значение = prepend (добавить в начало).
settings.repaintingEndnumber
min: 0 · max: 300
—Конец перекраски в секундах. ТРЕБУЕТ inputs.audio. Значение за пределами duration = append.
settings.guidanceTypeenum
apg, cfg
apgТип guidance: apg — Adaptive Projected Guidance, cfg — Classifier-Free Guidance.
audioSettings.bitrateinteger
min: 8
—Битрейт kbps. MP3: 8..320; OGG mono: 8..224; OGG stereo: 16..256. Не применяется к WAV/FLAC.
audioSettings.sampleRateenum
8000, 16000, 44100, 48000
—Частота дискретизации в Hz.
audioSettings.channelsenum
1, 2
2Каналы: 1 — mono, 2 — stereo.
numberResultsinteger
min: 1 · max: 4
1Сколько вариаций сгенерировать (разные seeds).
outputTypeenum
URL, base64Data, dataURI
URLФормат доставки.
outputFormatenum
MP3, WAV, FLAC, OGG
MP3Формат аудиофайла. WAV/FLAC — без компрессии (audioSettings игнорируется).
asyncboolean
—
falsetrue → task_id для async-polling. false (default) → sync.
safety.checkContentboolean
—
falseВключить проверку контента.
safety.modeenum
none, fast
noneРежим safety-сканера.
webhookURLstring
—
—URL для POST-уведомления async.
1 пример
Примеры
https://yourapp.com/webhooks/runware
uploadEndpointstring
—
—Presigned URL для автозагрузки.
1 пример
Примеры
https://bucket.s3.amazonaws.com/result.mp3?X-Amz-Signature=...
Параметры ответа
Что возвращает API. У медиа-моделей формат зависит от режима: sync — сразу результат, async — task_id для опроса через GET /v1/tasks/{id}. Эта модель работает только в async-режиме.
Sync (HTTP 200)
Для TTS короткого input: HTTP 200, **binary audio** (Content-Type: audio/mpeg / audio/wav / ...). Это НЕ JSON — это байты файла.
Binary response. Content-Type:
audio/mpeg, audio/wav, audio/opus, audio/ogg Async (HTTP 202)
Если is_async_only=1 (music gen) или async:true в запросе. HTTP 202 + JSON.
ПолеТипЗначенияОписание
idstring
—
task_id для GET /v1/tasks/{id}.
objectstring
audio.task
statusenum
queued, processing, completed, failed
modelstring
—
createdinteger
—
Опрос статуса (GET /v1/tasks/{id})
GET /v1/tasks/{id}.
ПолеТипЗначенияОписание
idstring
—
statusenum
queued, processing, completed, failed, canceled
modalitystring
audio
modelstring
—
dataarray
—
Каждый элемент:
url— string · CDN URL .mp3 / .wav. Для Suno music — 1-2 файла (варианты трека).
errorstring
—
Пример кода
acestep-15-base_example.py
from openai import OpenAI
client = OpenAI(api_key="rk_live_...", base_url="https://api.ranvik.ru/v1")
resp = client.audio.speech.create(
model= "acestep-15-base",
positivePrompt= "Пример промпта",
negativePrompt= "Пример промпта",
duration= 60,
seed= 1073741824,
steps= 100,
CFGScale= 10,
strength= 0.5,
"inputs.audio": "Пример промпта",
"settings.bpm": 165,
"settings.timeSignature": 2,
"settings.keyScale": "value",
"settings.vocalLanguage": "en",
"settings.lyrics": "Текст песни",
"settings.coverConditioningScale": 1,
"settings.repaintingStart": 0,
"settings.repaintingEnd": 150,
"settings.guidanceType": "apg",
"audioSettings.bitrate": 8,
"audioSettings.sampleRate": 8000,
"audioSettings.channels": 2,
numberResults= 1,
outputType= "URL",
outputFormat= "MP3",
async= False,
"safety.checkContent": False,
"safety.mode": "none",
webhookURL= "https://example.com/...",
uploadEndpoint= "value",
)
print(resp)