TTS-1 HD

ПровайдерOpenai

tts-1-hd — генерация аудио-модель от Openai.

Что умеет TTS-1 HD

Базовый набор возможностей модели — см. документацию вендора.

Стоимость

за 1М символов

9 975 ₽

Цены указаны в рублях и списываются с баланса проекта за успешные запросы. Надбавки (+) суммируются с базовой ставкой.

Технические характеристики

Vendor

openai

Modality

audio

Параметры запроса

Параметры, которые принимает модель. Передаются в теле запроса.

ПараметрТипДиапазон / значенияПо умолчаниюОписание

inputreq

string

max: 4096

—

Текст для синтеза речи. До 4096 символов.

1 пример

Примеры

The quick brown fox jumped over the lazy dog.

voice

enum

alloy, ash, ballad, coral, echo, fable, onyx, nova, sage, shimmer, verse, marin, cedar

—

Встроенный голос (13 опций). Также можно передать объект {"id": "voice_xxxx"} с custom voice ID — но через нашу schema это не отображается, передавайте сырым JSON.

response_format

enum

mp3, opus, aac, flac, wav, pcm

mp3

Формат аудио. mp3 — универсальный, wav/pcm — без сжатия, opus — для realtime.

speed

number

min: 0.25 · max: 4

1

Скорость воспроизведения (0.25..4.0). 1.0 — нормальная.

stream_format

enum

audio

audio

Формат стриминга. Для tts-1 / tts-1-hd поддерживается только audio (sse недоступен).

Параметры ответа

Что возвращает API. У медиа-моделей формат зависит от режима: sync — сразу результат, async — task_id для опроса через GET /v1/tasks/{id}.

Sync (HTTP 200)

Для TTS короткого input: HTTP 200, **binary audio** (Content-Type: audio/mpeg / audio/wav / ...). Это НЕ JSON — это байты файла.

Binary response. Content-Type: audio/mpeg, audio/wav, audio/opus, audio/ogg

Async (HTTP 202)

Если is_async_only=1 (music gen) или async:true в запросе. HTTP 202 + JSON.

ПолеТипЗначенияОписание

id

string

—

task_id для GET /v1/tasks/{id}.

object

string

audio.task

status

enum

queued, processing, completed, failed

model

string

—

created

integer

—

Опрос статуса (GET /v1/tasks/{id})

GET /v1/tasks/{id}.

ПолеТипЗначенияОписание

id

string

—

status

enum

queued, processing, completed, failed, canceled

modality

string

audio

model

string

—

data

array

—

Каждый элемент:

url— string · CDN URL .mp3 / .wav. Для Suno music — 1-2 файла (варианты трека).

error

string

—

Пример кода

tts-1-hd_example.py

from openai import OpenAI

client = OpenAI(api_key="rk_live_...", base_url="https://api.ranvik.ru/v1")
resp = client.audio.speech.create(
    model= "tts-1-hd",
    input= "Пример промпта",
    voice= "alloy",
    response_format= "mp3",
    speed= 1,
    stream_format= "audio",
)
print(resp)

Полная документация модели