Grok Realtime

ПровайдерXai

xai-realtime — генерация аудио-модель от Xai.

audio_inputstreaming

Что умеет Grok Realtime

  • Audio Input
  • Streaming

Стоимость

за минуту
auto (est.)
37.24 ₽

Цены указаны в рублях и списываются с баланса проекта за успешные запросы. Надбавки (+) суммируются с базовой ставкой.

Технические характеристики

Vendor
xai
Modality
audio

Параметры запроса

Параметры, которые принимает модель. Передаются в теле запроса.

ПараметрТипДиапазон / значенияПо умолчаниюОписание
model
string
ID модели (передаётся через session.update event после WebSocket connection).
1 пример
Примеры
xai:realtime@0
voice
enum
una, leo, eve, ara, sal, rex
Голос для audio output (тот же набор что у xai-tts).
instructions
string
Системные инструкции для realtime-сессии (передаются через session.update).
temperature
number
min: 0 · max: 2
Sampling temperature.
input_audio_format
enum
pcm16, g711_ulaw, g711_alaw
Формат audio input. Сырой 16-bit PCM или G.711 для телефонии.
output_audio_format
enum
pcm16, g711_ulaw, g711_alaw
Формат audio output.
turn_detection
object
Настройка VAD (voice activity detection). {type: "server_vad", threshold, prefix_padding_ms, silence_duration_ms} либо null для disabled.
tools
array
Function calling tools для realtime-режима.

Параметры ответа

Что возвращает API. У медиа-моделей формат зависит от режима: sync — сразу результат, async — task_id для опроса через GET /v1/tasks/{id}.

Sync (HTTP 200)

Для TTS короткого input: HTTP 200, **binary audio** (Content-Type: audio/mpeg / audio/wav / ...). Это НЕ JSON — это байты файла.

Binary response. Content-Type: audio/mpeg, audio/wav, audio/opus, audio/ogg

Async (HTTP 202)

Если is_async_only=1 (music gen) или async:true в запросе. HTTP 202 + JSON.

ПолеТипЗначенияОписание
id
string
task_id для GET /v1/tasks/{id}.
object
string
audio.task
status
enum
queued, processing, completed, failed
model
string
created
integer

Опрос статуса (GET /v1/tasks/{id})

GET /v1/tasks/{id}.

ПолеТипЗначенияОписание
id
string
status
enum
queued, processing, completed, failed, canceled
modality
string
audio
model
string
data
array
Каждый элемент:
  • url— string · CDN URL .mp3 / .wav. Для Suno music — 1-2 файла (варианты трека).
error
string

Пример кода

xai-realtime_example.py
from openai import OpenAI

client = OpenAI(api_key="rk_live_...", base_url="https://api.ranvik.ru/v1")
resp = client.audio.speech.create(
    model= "value",
    voice= "una",
    instructions= "value",
    temperature= 1,
    input_audio_format= "pcm16",
    output_audio_format= "pcm16",
    turn_detection= {},
    tools= [],
)
print(resp)
Полная документация модели