GPT-4.1

1M context

ПровайдерOpenai

gpt-4.1 — текстовая модель-модель от Openai.

function_callingstreamingtext_to_imagevision

Попробуйте прямо здесь

GPT-4.1 Открыть в Playground

Что умеет GPT-4.1

Function Calling
Streaming
Text-to-image
Vision

Стоимость

за 1М cache read

140 ₽

за 1М input

560 ₽

за 1М output

2 240 ₽

web_search

2.8 ₽

Цены указаны в рублях и списываются с баланса проекта за успешные запросы. Надбавки (+) суммируются с базовой ставкой.

Технические характеристики

Контекст

1,047,576

токенов

Output

32,768

токенов

Vendor

openai

Modality

text

Параметры запроса

Параметры, которые принимает модель. Передаются в теле запроса.

ПараметрТипДиапазон / значенияПо умолчаниюОписание

max_completion_tokens

integer

min: 1 · max: 16384

4096

Лимит output. max_tokens deprecated, используйте этот.

temperature

number

min: 0 · max: 2

1

0 — детерминированно, 2 — максимум креативности.

top_p

number

min: 0 · max: 1

1

Nucleus sampling. Альтернатива temperature.

n

integer

min: 1 · max: 10

1

Сколько вариантов сгенерировать.

stop

array

—

—

До 4 строк, на которых остановиться.

frequency_penalty

number

min: -2 · max: 2

0

Штраф за повторение токенов.

presence_penalty

number

min: -2 · max: 2

0

Штраф за уже использованные токены.

response_format

object

—

—

{type:"text"} | {type:"json_object"} | {type:"json_schema",json_schema:{...}}.

seed

integer

—

—

Для воспроизводимости (beta).

logprobs

boolean

—

false

Возвращать log-вероятности.

top_logprobs

integer

min: 0 · max: 20

—

Количество top-N logprobs.

logit_bias

object

—

—

{token_id: bias} — изменение вероятностей.

tools

array

—

—

Function/tool definitions.

tool_choice

object

—

—

none | auto | required | {type:"function",function:{name:"X"}}.

parallel_tool_calls

boolean

—

true

service_tier

enum

auto, default, flex, scale, priority

auto

metadata

object

—

—

До 16 key-value пар для трекинга.

store

boolean

—

false

Сохранять output для distillation/evals.

prompt_cache_key

string

—

—

Ключ оптимизации кэша.

safety_identifier

string

max: 64

—

Stable identifier юзера для safety.

stream

boolean

—

false

messagesreq

array

—

—

Массив сообщений диалога: [{role: "system"|"user"|"assistant"|"developer"|"tool", content: string|array}]. content может быть multimodal — массив частей {type: "text"|"image_url"|"input_audio"|...}.

1 пример

Примеры

[
  {
    "role": "system",
    "content": "You are a helpful assistant."
  },
  {
    "role": "user",
    "content": "Привет!"
  }
]

web_search_options

object

—

—

Конфигурация built-in web search tool. {search_context_size: "low"|"medium"|"high", user_location: {...}}.

Пример кода

gpt-4.1_example.py

from openai import OpenAI

client = OpenAI(api_key="rk_live_...", base_url="https://api.ranvik.ru/v1")
resp = client.chat.completions.create(
    model="gpt-4.1",
    messages=[{"role": "user", "content": "Привет!"}],
)
print(resp.choices[0].message.content)

# ── С веб-поиском ──
resp = client.responses.create(
    model="gpt-4.1",
    input="Что нового в AI сегодня?",
    tools=[{"type": "web_search"}],
)
print(resp.output_text)

Полная документация модели