GPT-Image-2

ПровайдерOpenai

gpt-image-2 — генерация изображений-модель от Openai.

text_to_image

Попробуйте прямо здесь

Что умеет GPT-Image-2

  • Text-to-image

Стоимость

за изображение
low · portrait
1.4 ₽
low · landscape
1.4 ₽
low
1.68 ₽
medium · portrait
11.48 ₽
medium · landscape
11.48 ₽
medium
14.84 ₽
high · portrait
46.2 ₽
high · landscape
46.2 ₽
auto (est.)
59.08 ₽
high
59.08 ₽

Цены указаны в рублях и списываются с баланса проекта за успешные запросы. Надбавки (+) суммируются с базовой ставкой.

Технические характеристики

Vendor
openai
Modality
image

Параметры запроса

Параметры, которые принимает модель. Передаются в теле запроса.

ПараметрТипДиапазон / значенияПо умолчаниюОписание
promptreq
string
max: 32000
Текстовое описание желаемого изображения. До 32k символов.
1 пример
Примеры
Иллюстрация: голубой кит парит над городом среди звёзд, фантастический стиль.
background
enum
transparent, opaque, auto
auto
Прозрачность фона. При transparent — output_format png или webp.
moderation
enum
low, auto
auto
Уровень content-moderation.
n
integer
min: 1 · max: 10
1
Количество изображений.
output_compression
integer
min: 0 · max: 100
100
Сжатие (0-100%). Только для webp/jpeg.
output_format
enum
png, jpeg, webp
Формат файла.
partial_images
integer
min: 0 · max: 3
Partial images для streaming.
quality
enum
auto, high, medium, low
auto
Качество генерации.
size
string
auto
Размер изображения. Популярные: 1024×1024, 1536×1024, 1024×1536, 2048×2048, 2048×1152, 3840×2160, 2160×3840. Произвольные: обе стороны кратны 16, соотношение ≤ 3:1, до 3840×2160. auto — модель выбирает.
stream
boolean
false
Streaming-режим.
user
string
Уникальный идентификатор end-user.

Поддерживаемые размеры

Допустимы только эти комбинации width × height. Произвольные значения вендор отклонит — используй resolution preset либо одну из пар ниже.

Square 1:1
1024×1024
Landscape 3:2
1536×1024
Portrait 2:3
1024×1536
2K Square 1:1
2048×2048
2K Landscape 16:9
2048×1152
2K Portrait 9:16
1152×2048
4K Landscape 16:9
3840×2160
4K Portrait 9:16
2160×3840

Параметры ответа

Что возвращает API. У медиа-моделей формат зависит от режима: sync — сразу результат, async — task_id для опроса через GET /v1/tasks/{id}.

Sync (HTTP 200)

Sync-ответ (default). HTTP 200 + JSON.

ПолеТипЗначенияОписание
created
integer
Unix timestamp когда сгенерировано.
data
array
Каждый элемент:
  • url— string · CDN URL картинки (если outputType=URL).
  • b64_json— string · Base64-кодированный PNG/JPG (если outputType=base64Data).
  • taskUUID— string · Идентификатор upstream-задачи (для chain в i2i и т.п.).
  • seed— integer · Использованный seed (если детерминистичная генерация).
provider
string
Вендор для отладки.

Async (HTTP 202)

Если в запросе передан async:true → HTTP 202.

ПолеТипЗначенияОписание
id
string
task_id для опроса через GET /v1/tasks/{id}.
object
string
image.task
status
enum
queued, processing, completed, failed
model
string
Public model id.
created
integer

Опрос статуса (GET /v1/tasks/{id})

GET /v1/tasks/{id} — опрос статуса async-задачи.

ПолеТипЗначенияОписание
id
string
object
string
task
status
enum
queued, processing, completed, failed, canceled
modality
string
image
model
string
created
integer
data
array
Каждый элемент:
  • url— string · CDN URL артефакта (если completed).
error
string
Сообщение об ошибке (если failed).

Пример кода

gpt-image-2_example.py
from openai import OpenAI

client = OpenAI(api_key="rk_live_...", base_url="https://api.ranvik.ru/v1")
resp = client.images.generate(
    model= "gpt-image-2",
    prompt= "Пример промпта",
    background= "auto",
    moderation= "auto",
    n= 1,
    output_compression= 100,
    output_format= "png",
    partial_images= 2,
    quality= "auto",
    size= "auto",
    stream= False,
    user= "value",
)
print(resp)
Полная документация модели