Генерация изображений · google

Nano Banana

nano-banana-direct

Nano Banana — генерация изображений от Google, доступная через единый Ranvik API. Поддерживаемые возможности: text_to_image, image_to_image, fast.

от 10.92 ₽ / шт

Технические характеристики

МодальностьГенерация изображений
Провайдерgoogle
СтатусАктивна
ID для запросовnano-banana-direct

Возможности

  • Text-to-image
  • Image-to-Image
  • Быстро

Цены

ЕдиницаЦена
за изображение10.92 ₽

Цены указаны в рублях. Списываются с баланса проекта при каждом успешном запросе.

Поддерживаемые параметры

Параметры передаются вендору как есть (pure proxy) — мы не валидируем их у себя на стороне. Если вендор не примет — вернётся его ошибка.

ПараметрТипДиапазон / valuesDefaultОписание
contentsrequiredarray Массив частей промпта: текст и/или reference изображения. Первый элемент обычно — текстовый prompt, дальше можно подавать до 14 изображений для multi-image conditioning.
примеры значений
Примеры
[
  "Корги в красном свитере на крыше Эйфелевой башни."
]
[
  "Office group photo of these people.",
  {
    "inlineData": {
      "mimeType": "image/png",
      "data": "<base64>"
    }
  }
]
response_modalitiesarray of strings Список модальностей в ответе. Для image gen обычно [TEXT, IMAGE] либо только [IMAGE].
примеры значений
Примеры
[
  "TEXT",
  "IMAGE"
]
[
  "IMAGE"
]
response_format.image.aspect_ratioenum1:1, 2:3, 3:2, 3:4, 4:3, 4:5, 5:4, 9:16, 16:9, 21:91:1 Соотношение сторон изображения. В Nano Banana (2.5 Flash) — 10 значений (без 1:4/4:1/1:8/8:1 — те только в 3.1 Flash и Pro).
response_format.image.image_sizeenum1K, 2K, 4K1K Разрешение изображения. Только заглавные K. В Nano Banana (2.5 Flash) — без 512 (это в 3.1 Flash).
toolsarray Инструменты модели. Для grounded image gen — [{googleSearch: {}}] (модель ищет факты для генерации актуальных диаграмм/инфографик).
примеры значений
Примеры
[
  {
    "googleSearch": []
  }
]

Параметры ответа

Что возвращает API. У медиа-моделей формат зависит от режима: sync — сразу результат, async — task_id для опроса через GET /v1/tasks/{id}.

Sync (HTTP 200)

Sync-ответ (default). HTTP 200 + JSON.

ПолеТипЗначенияОписание
createdinteger Unix timestamp когда сгенерировано.
dataarray
Каждый элемент:
  • url— string · CDN URL картинки (если outputType=URL).
  • b64_json— string · Base64-кодированный PNG/JPG (если outputType=base64Data).
  • taskUUID— string · Идентификатор upstream-задачи (для chain в i2i и т.п.).
  • seed— integer · Использованный seed (если детерминистичная генерация).
providerstring Вендор для отладки.

Async (HTTP 202)

Если в запросе передан async:true → HTTP 202.

ПолеТипЗначенияОписание
idstring task_id для опроса через GET /v1/tasks/{id}.
objectstringimage.task
statusenumqueued, processing, completed, failed
modelstring Public model id.
createdinteger

Опрос статуса (GET /v1/tasks/{id})

GET /v1/tasks/{id} — опрос статуса async-задачи.

ПолеТипЗначенияОписание
idstring
objectstringtask
statusenumqueued, processing, completed, failed, canceled
modalitystringimage
modelstring
createdinteger
dataarray
Каждый элемент:
  • url— string · CDN URL артефакта (если completed).
errorstring Сообщение об ошибке (если failed).

Пример запроса

from openai import OpenAI

client = OpenAI(api_key="rk_live_...", base_url="https://api.ranvik.ru/v1")
resp = client.images.generate(
    model= "nano-banana-direct",
    contents= [],
    response_modalities= [],
    "response_format.image.aspect_ratio": "1:1",
    "response_format.image.image_size": "1K",
    tools= [],
)
print(resp)

Замените rk_live_... на ваш ключ из кабинета.

О провайдере: Google

Google DeepMind разрабатывает семейство моделей Gemini — мультимодальные LLM с нативной поддержкой текста, изображений, аудио и видео в одном запросе. Известны рекордно длинным контекстом (до 2M токенов).

Официальный сайт: https://deepmind.google