GPT-4.1

1M context
ПровайдерOpenai

gpt-4.1 — текстовая модель-модель от Openai.

function_callingstreamingtext_to_imagevision

Попробуйте прямо здесь

Что умеет GPT-4.1

  • Function Calling
  • Streaming
  • Text-to-image
  • Vision

Стоимость

за 1М cache read
140 ₽
за 1М input
560 ₽
за 1М output
2 240 ₽
web_search
2.8 ₽

Цены указаны в рублях и списываются с баланса проекта за успешные запросы. Надбавки (+) суммируются с базовой ставкой.

Технические характеристики

Контекст
1,047,576
токенов
Output
32,768
токенов
Vendor
openai
Modality
text

Параметры запроса

Параметры, которые принимает модель. Передаются в теле запроса.

ПараметрТипДиапазон / значенияПо умолчаниюОписание
max_completion_tokens
integer
min: 1 · max: 16384
4096
Лимит output. max_tokens deprecated, используйте этот.
temperature
number
min: 0 · max: 2
1
0 — детерминированно, 2 — максимум креативности.
top_p
number
min: 0 · max: 1
1
Nucleus sampling. Альтернатива temperature.
n
integer
min: 1 · max: 10
1
Сколько вариантов сгенерировать.
stop
array
До 4 строк, на которых остановиться.
frequency_penalty
number
min: -2 · max: 2
0
Штраф за повторение токенов.
presence_penalty
number
min: -2 · max: 2
0
Штраф за уже использованные токены.
response_format
object
{type:"text"} | {type:"json_object"} | {type:"json_schema",json_schema:{...}}.
seed
integer
Для воспроизводимости (beta).
logprobs
boolean
false
Возвращать log-вероятности.
top_logprobs
integer
min: 0 · max: 20
Количество top-N logprobs.
logit_bias
object
{token_id: bias} — изменение вероятностей.
tools
array
Function/tool definitions.
tool_choice
object
none | auto | required | {type:"function",function:{name:"X"}}.
parallel_tool_calls
boolean
true
service_tier
enum
auto, default, flex, scale, priority
auto
metadata
object
До 16 key-value пар для трекинга.
store
boolean
false
Сохранять output для distillation/evals.
prompt_cache_key
string
Ключ оптимизации кэша.
safety_identifier
string
max: 64
Stable identifier юзера для safety.
stream
boolean
false
messagesreq
array
Массив сообщений диалога: [{role: "system"|"user"|"assistant"|"developer"|"tool", content: string|array}]. content может быть multimodal — массив частей {type: "text"|"image_url"|"input_audio"|...}.
1 пример
Примеры
[
  {
    "role": "system",
    "content": "You are a helpful assistant."
  },
  {
    "role": "user",
    "content": "Привет!"
  }
]
web_search_options
object
Конфигурация built-in web search tool. {search_context_size: "low"|"medium"|"high", user_location: {...}}.

Пример кода

gpt-4.1_example.py
from openai import OpenAI

client = OpenAI(api_key="rk_live_...", base_url="https://api.ranvik.ru/v1")
resp = client.chat.completions.create(
    model="gpt-4.1",
    messages=[{"role": "user", "content": "Привет!"}],
)
print(resp.choices[0].message.content)

# ── С веб-поиском ──
resp = client.responses.create(
    model="gpt-4.1",
    input="Что нового в AI сегодня?",
    tools=[{"type": "web_search"}],
)
print(resp.output_text)
Полная документация модели