xAI Text-to-Speech
xai-tts — генерация аудио-модель от Xai.
text_to_audio
Что умеет xAI Text-to-Speech
- Text-to-Audio
Стоимость
за 1М символов
4.2 ₽
Цены указаны в рублях и списываются с баланса проекта за успешные запросы. Надбавки (+) суммируются с базовой ставкой.
Технические характеристики
Vendor
xai
Modality
audio
Параметры запроса
Параметры, которые принимает модель. Передаются в теле запроса.
ПараметрТипДиапазон / значенияПо умолчаниюОписание
textreqstring
max: 15000
—Текст до 15 000 символов. Поддерживает inline-теги [laugh], <whisper>...</whisper>.
voice_idenum
ara, eve, leo, rex, sal
eve5 голосов или custom voice ID.
languagereqstring
—
—auto или BCP-47 код (en, ru, zh, pt-BR).
output_formatobject
—
—{codec:"mp3|wav|pcm|mulaw|alaw", sample_rate:8000-48000, bit_rate:32000-192000} — для MP3 codec по умолчанию 24kHz/128kbps.
optimize_streaming_latencyenum
0, 1
00 — best quality, 1 — lower latency.
text_normalizationboolean
—
falseРасширение чисел/валют в текст.
Параметры ответа
Что возвращает API. У медиа-моделей формат зависит от режима: sync — сразу результат, async — task_id для опроса через GET /v1/tasks/{id}.
Sync (HTTP 200)
Для TTS короткого input: HTTP 200, **binary audio** (Content-Type: audio/mpeg / audio/wav / ...). Это НЕ JSON — это байты файла.
Binary response. Content-Type:
audio/mpeg, audio/wav, audio/opus, audio/ogg Async (HTTP 202)
Если is_async_only=1 (music gen) или async:true в запросе. HTTP 202 + JSON.
ПолеТипЗначенияОписание
idstring
—
task_id для GET /v1/tasks/{id}.
objectstring
audio.task
statusenum
queued, processing, completed, failed
modelstring
—
createdinteger
—
Опрос статуса (GET /v1/tasks/{id})
GET /v1/tasks/{id}.
ПолеТипЗначенияОписание
idstring
—
statusenum
queued, processing, completed, failed, canceled
modalitystring
audio
modelstring
—
dataarray
—
Каждый элемент:
url— string · CDN URL .mp3 / .wav. Для Suno music — 1-2 файла (варианты трека).
errorstring
—
Пример кода
xai-tts_example.py
from openai import OpenAI
client = OpenAI(api_key="rk_live_...", base_url="https://api.ranvik.ru/v1")
resp = client.audio.speech.create(
model= "xai-tts",
text= "Пример промпта",
language= "value",
voice_id= "eve",
output_format= {},
optimize_streaming_latency= 0,
text_normalization= False,
)
print(resp)