xAI Text-to-Speech

ПровайдерXai

xai-tts — генерация аудио-модель от Xai.

text_to_audio

Что умеет xAI Text-to-Speech

Text-to-Audio

Стоимость

за 1М символов

4.2 ₽

Цены указаны в рублях и списываются с баланса проекта за успешные запросы. Надбавки (+) суммируются с базовой ставкой.

Технические характеристики

Vendor

xai

Modality

audio

Параметры запроса

Параметры, которые принимает модель. Передаются в теле запроса.

ПараметрТипДиапазон / значенияПо умолчаниюОписание

textreq

string

max: 15000

—

Текст до 15 000 символов. Поддерживает inline-теги [laugh], <whisper>...</whisper>.

voice_id

enum

ara, eve, leo, rex, sal

eve

5 голосов или custom voice ID.

languagereq

string

—

—

auto или BCP-47 код (en, ru, zh, pt-BR).

output_format

object

—

—

{codec:"mp3|wav|pcm|mulaw|alaw", sample_rate:8000-48000, bit_rate:32000-192000} — для MP3 codec по умолчанию 24kHz/128kbps.

optimize_streaming_latency

enum

0, 1

0

0 — best quality, 1 — lower latency.

text_normalization

boolean

—

false

Расширение чисел/валют в текст.

Параметры ответа

Что возвращает API. У медиа-моделей формат зависит от режима: sync — сразу результат, async — task_id для опроса через GET /v1/tasks/{id}.

Sync (HTTP 200)

Для TTS короткого input: HTTP 200, **binary audio** (Content-Type: audio/mpeg / audio/wav / ...). Это НЕ JSON — это байты файла.

Binary response. Content-Type: audio/mpeg, audio/wav, audio/opus, audio/ogg

Async (HTTP 202)

Если is_async_only=1 (music gen) или async:true в запросе. HTTP 202 + JSON.

ПолеТипЗначенияОписание

id

string

—

task_id для GET /v1/tasks/{id}.

object

string

audio.task

status

enum

queued, processing, completed, failed

model

string

—

created

integer

—

Опрос статуса (GET /v1/tasks/{id})

GET /v1/tasks/{id}.

ПолеТипЗначенияОписание

id

string

—

status

enum

queued, processing, completed, failed, canceled

modality

string

audio

model

string

—

data

array

—

Каждый элемент:

url— string · CDN URL .mp3 / .wav. Для Suno music — 1-2 файла (варианты трека).

error

string

—

Пример кода

xai-tts_example.py

from openai import OpenAI

client = OpenAI(api_key="rk_live_...", base_url="https://api.ranvik.ru/v1")
resp = client.audio.speech.create(
    model= "xai-tts",
    text= "Пример промпта",
    language= "value",
    voice_id= "eve",
    output_format= {},
    optimize_streaming_latency= 0,
    text_normalization= False,
)
print(resp)

Полная документация модели