Генерация аудио · xai

Grok STT

xai-stt

Grok STT — генерация аудио от xai, доступная через единый Ranvik API. Поддерживаемые возможности: audio_input.

от 28 ₽ / мин

Технические характеристики

МодальностьГенерация аудио
Провайдерxai
СтатусАктивна
ID для запросовxai-stt

Возможности

  • Audio Input

Цены

ЕдиницаЦена
за минуту · estimate28 ₽

Цены указаны в рублях. Списываются с баланса проекта при каждом успешном запросе.

Поддерживаемые параметры

Параметры передаются вендору как есть (pure proxy) — мы не валидируем их у себя на стороне. Если вендор не примет — вернётся его ошибка.

ПараметрТипДиапазон / valuesDefaultОписание
filerequiredstring Аудио-файл для транскрипции (multipart/form-data, не JSON). Форматы: mp3, wav, m4a, flac, ogg, webm.
languagestring ISO 639-1 код языка для улучшения точности.
примеры значений
Примеры
en
ru
ja
promptstring Опциональный prompt-подсказка стиля или vocabulary hint.
response_formatenumjson, text, srt, verbose_json, vttjson Формат ответа: json — стандарт, text — только текст, srt/vtt — субтитры, verbose_json — с таймкодами и сегментами.
temperaturenumbermin: 0 · max: 10 Sampling temperature 0..1.
timestamp_granularitiesarray of strings Таймкоды: word и/или segment. ТРЕБУЕТ response_format=verbose_json.
примеры значений
Примеры
[
  "segment"
]
[
  "word",
  "segment"
]

Параметры ответа

Что возвращает API. У медиа-моделей формат зависит от режима: sync — сразу результат, async — task_id для опроса через GET /v1/tasks/{id}.

Sync (HTTP 200)

Для TTS короткого input: HTTP 200, **binary audio** (Content-Type: audio/mpeg / audio/wav / ...). Это НЕ JSON — это байты файла.

Binary response. Content-Type: audio/mpeg, audio/wav, audio/opus, audio/ogg

Async (HTTP 202)

Если is_async_only=1 (music gen) или async:true в запросе. HTTP 202 + JSON.

ПолеТипЗначенияОписание
idstring task_id для GET /v1/tasks/{id}.
objectstringaudio.task
statusenumqueued, processing, completed, failed
modelstring
createdinteger

Опрос статуса (GET /v1/tasks/{id})

GET /v1/tasks/{id}.

ПолеТипЗначенияОписание
idstring
statusenumqueued, processing, completed, failed, canceled
modalitystringaudio
modelstring
dataarray
Каждый элемент:
  • url— string · CDN URL .mp3 / .wav. Для Suno music — 1-2 файла (варианты трека).
errorstring

Пример запроса

from openai import OpenAI

client = OpenAI(api_key="rk_live_...", base_url="https://api.ranvik.ru/v1")
resp = client.audio.speech.create(
    model= "xai-stt",
    file= "value",
    language= "value",
    prompt= "Пример промпта",
    response_format= "json",
    temperature= 0,
    timestamp_granularities= [],
)
print(resp)

Замените rk_live_... на ваш ключ из кабинета.