TTS-1 HD

ПровайдерOpenai

tts-1-hd — генерация аудио-модель от Openai.

Что умеет TTS-1 HD

Базовый набор возможностей модели — см. документацию вендора.

Стоимость

за 1М символов
8 400 ₽

Цены указаны в рублях и списываются с баланса проекта за успешные запросы. Надбавки (+) суммируются с базовой ставкой.

Технические характеристики

Vendor
openai
Modality
audio

Параметры запроса

Параметры, которые принимает модель. Передаются в теле запроса.

ПараметрТипДиапазон / значенияПо умолчаниюОписание
inputreq
string
max: 4096
Текст для синтеза речи. До 4096 символов.
1 пример
Примеры
The quick brown fox jumped over the lazy dog.
voice
enum
alloy, ash, ballad, coral, echo, fable, onyx, nova, sage, shimmer, verse, marin, cedar
Встроенный голос (13 опций). Также можно передать объект {"id": "voice_xxxx"} с custom voice ID — но через нашу schema это не отображается, передавайте сырым JSON.
response_format
enum
mp3, opus, aac, flac, wav, pcm
mp3
Формат аудио. mp3 — универсальный, wav/pcm — без сжатия, opus — для realtime.
speed
number
min: 0.25 · max: 4
1
Скорость воспроизведения (0.25..4.0). 1.0 — нормальная.
stream_format
enum
audio
audio
Формат стриминга. Для tts-1 / tts-1-hd поддерживается только audio (sse недоступен).

Параметры ответа

Что возвращает API. У медиа-моделей формат зависит от режима: sync — сразу результат, async — task_id для опроса через GET /v1/tasks/{id}.

Sync (HTTP 200)

Для TTS короткого input: HTTP 200, **binary audio** (Content-Type: audio/mpeg / audio/wav / ...). Это НЕ JSON — это байты файла.

Binary response. Content-Type: audio/mpeg, audio/wav, audio/opus, audio/ogg

Async (HTTP 202)

Если is_async_only=1 (music gen) или async:true в запросе. HTTP 202 + JSON.

ПолеТипЗначенияОписание
id
string
task_id для GET /v1/tasks/{id}.
object
string
audio.task
status
enum
queued, processing, completed, failed
model
string
created
integer

Опрос статуса (GET /v1/tasks/{id})

GET /v1/tasks/{id}.

ПолеТипЗначенияОписание
id
string
status
enum
queued, processing, completed, failed, canceled
modality
string
audio
model
string
data
array
Каждый элемент:
  • url— string · CDN URL .mp3 / .wav. Для Suno music — 1-2 файла (варианты трека).
error
string

Пример кода

tts-1-hd_example.py
from openai import OpenAI

client = OpenAI(api_key="rk_live_...", base_url="https://api.ranvik.ru/v1")
resp = client.audio.speech.create(
    model= "tts-1-hd",
    input= "Пример промпта",
    voice= "alloy",
    response_format= "mp3",
    speed= 1,
    stream_format= "audio",
)
print(resp)
Полная документация модели