Grok TTS

ПровайдерXai

xai-tts-runware — генерация аудио-модель от Xai.

text_to_audio

Что умеет Grok TTS

Text-to-Audio

Стоимость

за 1М символов

6.65 ₽

Цены указаны в рублях и списываются с баланса проекта за успешные запросы. Надбавки (+) суммируются с базовой ставкой.

Технические характеристики

Vendor

xai

Modality

audio

Параметры запроса

Параметры, которые принимает модель. Передаются в теле запроса.

ПараметрТипДиапазон / значенияПо умолчаниюОписание

speech.textreq

string

—

—

Текст для синтеза речи. Цена $0.0042 за 1000 символов.

1 пример

Примеры

Привет! Это пример синтезированной речи через xAI.

speech.voice

enum

una, leo, eve, ara, sal, rex

auto

Голос диктора. 6 предустановленных + auto.

speech.language

enum

en, ar-EG, ar-SA, ar-AE, bn, zh, fr, de, hi, id, it, ja, ko, pt-BR, pt-PT, ru, es-MX, es-ES, tr, vi

—

Код языка / локали. 20 значений включая региональные варианты (ar-EG/SA/AE, pt-BR/PT, es-MX/ES).

audioSettings.bitrate

integer

min: 8

—

Битрейт kbps. Применимо только для lossy форматов (MP3, OGG).

audioSettings.sampleRate

integer

—

—

Частота дискретизации в Hz.

audioSettings.channels

enum

1, 2

2

Каналы: 1 — mono, 2 — stereo.

numberResults

integer

min: 1 · max: 4

1

Сколько вариаций сгенерировать.

outputType

enum

URL, base64Data, dataURI

URL

Формат доставки.

outputFormat

enum

MP3, WAV, FLAC, OGG

MP3

Формат аудиофайла. WAV/FLAC — без компрессии (audioSettings.bitrate игнорируется).

async

boolean

—

false

true → task_id для async-polling. false (default) → sync (binary audio в ответе).

webhookURL

string

—

—

URL для POST-уведомления async.

1 пример

Примеры

https://yourapp.com/webhooks/runware

uploadEndpoint

string

—

—

Presigned URL для автозагрузки.

1 пример

Примеры

https://bucket.s3.amazonaws.com/result.mp3?X-Amz-Signature=...

Параметры ответа

Что возвращает API. У медиа-моделей формат зависит от режима: sync — сразу результат, async — task_id для опроса через GET /v1/tasks/{id}.

Sync (HTTP 200)

Для TTS короткого input: HTTP 200, **binary audio** (Content-Type: audio/mpeg / audio/wav / ...). Это НЕ JSON — это байты файла.

Binary response. Content-Type: audio/mpeg, audio/wav, audio/opus, audio/ogg

Async (HTTP 202)

Если is_async_only=1 (music gen) или async:true в запросе. HTTP 202 + JSON.

ПолеТипЗначенияОписание

id

string

—

task_id для GET /v1/tasks/{id}.

object

string

audio.task

status

enum

queued, processing, completed, failed

model

string

—

created

integer

—

Опрос статуса (GET /v1/tasks/{id})

GET /v1/tasks/{id}.

ПолеТипЗначенияОписание

id

string

—

status

enum

queued, processing, completed, failed, canceled

modality

string

audio

model

string

—

data

array

—

Каждый элемент:

url— string · CDN URL .mp3 / .wav. Для Suno music — 1-2 файла (варианты трека).

error

string

—

Пример кода

xai-tts-runware_example.py

from openai import OpenAI

client = OpenAI(api_key="rk_live_...", base_url="https://api.ranvik.ru/v1")
resp = client.audio.speech.create(
    model= "xai-tts-runware",
    numberResults= 1,
    outputType= "URL",
    outputFormat= "MP3",
    async= False,
    webhookURL= "https://example.com/...",
    uploadEndpoint= "value",
    speech= {
        "text": "Пример промпта",
        "voice": "auto",
        "language": "en"
    },
    audioSettings= {
        "bitrate": 8,
        "sampleRate": 1,
        "channels": 2
    },
)
print(resp)

Полная документация модели