Grok Realtime
xai-realtime — генерация аудио-модель от Xai.
audio_inputstreaming
Что умеет Grok Realtime
- Audio Input
- Streaming
Стоимость
за минуту
auto (est.)
37.24 ₽
Цены указаны в рублях и списываются с баланса проекта за успешные запросы. Надбавки (+) суммируются с базовой ставкой.
Технические характеристики
Vendor
xai
Modality
audio
Параметры запроса
Параметры, которые принимает модель. Передаются в теле запроса.
ПараметрТипДиапазон / значенияПо умолчаниюОписание
modelstring
—
—ID модели (передаётся через session.update event после WebSocket connection).
1 пример
Примеры
xai:realtime@0
voiceenum
una, leo, eve, ara, sal, rex
—Голос для audio output (тот же набор что у xai-tts).
instructionsstring
—
—Системные инструкции для realtime-сессии (передаются через session.update).
temperaturenumber
min: 0 · max: 2
—Sampling temperature.
input_audio_formatenum
pcm16, g711_ulaw, g711_alaw
—Формат audio input. Сырой 16-bit PCM или G.711 для телефонии.
output_audio_formatenum
pcm16, g711_ulaw, g711_alaw
—Формат audio output.
turn_detectionobject
—
—Настройка VAD (voice activity detection). {type: "server_vad", threshold, prefix_padding_ms, silence_duration_ms} либо null для disabled.
toolsarray
—
—Function calling tools для realtime-режима.
Параметры ответа
Что возвращает API. У медиа-моделей формат зависит от режима: sync — сразу результат, async — task_id для опроса через GET /v1/tasks/{id}.
Sync (HTTP 200)
Для TTS короткого input: HTTP 200, **binary audio** (Content-Type: audio/mpeg / audio/wav / ...). Это НЕ JSON — это байты файла.
Binary response. Content-Type:
audio/mpeg, audio/wav, audio/opus, audio/ogg Async (HTTP 202)
Если is_async_only=1 (music gen) или async:true в запросе. HTTP 202 + JSON.
ПолеТипЗначенияОписание
idstring
—
task_id для GET /v1/tasks/{id}.
objectstring
audio.task
statusenum
queued, processing, completed, failed
modelstring
—
createdinteger
—
Опрос статуса (GET /v1/tasks/{id})
GET /v1/tasks/{id}.
ПолеТипЗначенияОписание
idstring
—
statusenum
queued, processing, completed, failed, canceled
modalitystring
audio
modelstring
—
dataarray
—
Каждый элемент:
url— string · CDN URL .mp3 / .wav. Для Suno music — 1-2 файла (варианты трека).
errorstring
—
Пример кода
xai-realtime_example.py
from openai import OpenAI
client = OpenAI(api_key="rk_live_...", base_url="https://api.ranvik.ru/v1")
resp = client.audio.speech.create(
model= "value",
voice= "una",
instructions= "value",
temperature= 1,
input_audio_format= "pcm16",
output_audio_format= "pcm16",
turn_detection= {},
tools= [],
)
print(resp)