Claude Opus 4.1
claude-opus-4-1
Claude Opus 4.1 — текстовая модель от Anthropic, доступная через единый Ranvik API. Контекстное окно — 200k токенов. Максимум выходных токенов за один запрос — 32k. Поддерживаемые возможности: document_understanding, function_calling, streaming, text_to_image, vision, web_search.
от 4 200 ₽ / 1M
Технические характеристики
claude-opus-4-1Возможности
Streaming (SSE)— Получение ответа по мере генерации — токен за токеном через Server-Sent Events.
Как работает
Передай stream: true в теле запроса — сервер вернёт SSE-поток с заголовком
content-type: text/event-stream. Каждый чанк — строка вида data: {...}\n\n.
Конец потока — data: [DONE]\n\n.
curl -N https://api.ranvik.ru/v1/chat/completions \
-H "Authorization: Bearer rk_live_..." \
-H "Content-Type: application/json" \
-d '{
"model": "gpt-5",
"messages": [{"role": "user", "content": "Привет"}],
"stream": true,
"stream_options": {"include_usage": true}
}'
Каждый чанк содержит choices[0].delta — частичные данные. Последний чанк перед
[DONE] (если включить stream_options.include_usage: true) содержит usage
с реальным числом токенов — используй для биллинг-учёта на клиенте.
Когда использовать
- Чат-интерфейсы, где важна перцептивная скорость отклика.
- Длинные ответы (> 1000 токенов) — пользователь видит прогресс.
- Streaming tool-calls —
delta.tool_calls[i].function.argumentsприходят инкрементально.
Когда НЕ использовать
- Backend-to-backend интеграции, где нужен только финальный JSON — добавляет парсинг SSE без выгод.
- Когда обязательно знать стоимость до отправки в БД — без
include_usageзатраты неизвестны.
Особенности у Anthropic
Anthropic SSE формат отличается — использует именованные эвенты
(event: content_block_delta, event: message_stop). Наш OpenAI-совместимый
shim делает перевод; если ходишь по /v1/messages (Anthropic-совместимый) —
получаешь нативный формат.
Vision (анализ изображений)— Картинки на вход вместе с текстом — OCR, распознавание объектов, описание сцен, анализ графиков.
Как передать изображение
Через массив content в сообщении вместо строки. Поддерживается URL и base64
(data URI).
{
"model": "gpt-5",
"messages": [{
"role": "user",
"content": [
{"type": "text", "text": "Что на этой схеме?"},
{"type": "image_url", "image_url": {"url": "https://.../diagram.png"}}
]
}]
}
Для base64: "url": "data:image/png;base64,iVBOR...". Размер ограничен ~20MB.
Биллинг изображений
Картинка считается как input-токены — точное число зависит от размера и
detail. Грубо: 512×512 ≈ 250 токенов, 2048×2048 ≈ 1500. Минимизируй размер
если нужно много кадров.
Что НЕ умеют vision-модели
- Точные измерения (расстояния, размеры в пикселях).
- Распознавание текста на сложных шрифтах при низком DPI — лучше OCR-модель.
- Деанонимизация лиц / людей — модели отказываются.
Особенности у Anthropic
Использует тип image (не image_url):
{"type": "image", "source": {"type": "url", "url": "..."}}
Через base64 — "source": {"type": "base64", "media_type": "image/jpeg", "data": "..."}.
PDF тоже передаётся через image-тип на Claude 4.x.
- Document Understanding
- Function Calling
- Streaming
- Text-to-image
- Vision
- Веб-поиск
Цены
| Единица | Цена |
|---|---|
| за 1М cache read | 420 ₽ |
| за 1М input | 4 200 ₽ |
| за 1М cache write | 5 250 ₽ |
| за 1М cache write | 5 250 ₽ |
| за 1М output | 21 000 ₽ |
| web_search | 2.8 ₽ |
Цены указаны в рублях. Списываются с баланса проекта при каждом успешном запросе.
Поддерживаемые параметры
Параметры передаются вендору как есть (pure proxy) — мы не валидируем их у себя на стороне. Если вендор не примет — вернётся его ошибка.
| Параметр | Тип | Диапазон / values | Default | Описание |
|---|---|---|---|---|
max_tokensrequired | integer | min: 1 · max: 64000 | 4096 | Максимум токенов в ответе. Обязателен. |
temperature | number | min: 0 · max: 1 | 1 | 0 — детерминированно, 1 — креативно. Используйте либо temperature, либо top_p, не оба. |
top_p | number | min: 0 · max: 1 | — | Nucleus sampling. Альтернатива temperature. |
top_k | integer | min: 0 | — | Sample только из top-K наиболее вероятных токенов. |
stop_sequences | array | — | — | Текстовые последовательности при которых генерация останавливается. stop_reason будет "stop_sequence". |
thinking | object | — | — | Extended thinking config: {type:"enabled",budget_tokens:N≥1024} | {type:"disabled"} | {type:"adaptive"}. Только Opus/Sonnet 4.x. |
tools | array | — | — | Tool definitions: custom + встроенные (code_execution, bash, text_editor, web_search). Каждый — {name, description?, input_schema}. |
tool_choice | object | — | — | Управление выбором tool: "auto" | "any" | {type:"tool",name:"X"} | "none". Поддерживает disable_parallel_tool_use:bool. |
service_tier | enum | auto, standard_only | — | Priority vs standard capacity. |
metadata | object | — | — | {user_id: external UUID/hash без PII}. |
stream | boolean | — | false | SSE streaming. |
messagesrequired | array | — | — | История сообщений. Массив объектов {role: "user"|"assistant", content: string|ContentBlock[]}. Content может содержать text, image, document, tool_use, tool_result блоки. примеры значенийПримеры [
{
"role": "user",
"content": "Привет, как дела?"
}
] |
system | string | — | — | System prompt — описание роли модели и контекста. Можно передать строку или массив TextBlockParam (для prompt caching через cache_control). примеры значенийПримеры You are a helpful assistant who speaks in Russian. |
mcp_servers | array | — | — | Список MCP (Model Context Protocol) серверов для подключения. Каждый элемент — объект {name, url, authorization_token, tool_configuration}. |
container | string | — | — | ID контейнера для code execution tool (REPL state persistence). Передаётся для продолжения работы в существующем контейнере. |
output_format | object | — | — | Структурированный output format. Например {type: "json", schema: {...}} для JSON-schema-validated output. |
Пример запроса
from anthropic import Anthropic
client = Anthropic(api_key="rk_live_...", base_url="https://api.ranvik.ru")
resp = client.messages.create(
model="claude-opus-4-1",
max_tokens=1024,
messages=[{"role": "user", "content": "Привет!"}],
)
print(resp.content[0].text)
# ── С веб-поиском ──
resp = client.messages.create(
model="claude-opus-4-1",
max_tokens=1024,
messages=[{"role": "user", "content": "Что нового в AI сегодня?"}],
tools=[{"type": "web_search_20250305", "name": "web_search"}],
)
print(resp.content[0].text) Замените rk_live_... на ваш ключ из кабинета.
О провайдере: Anthropic
Anthropic — компания основателей бывшей команды OpenAI, ориентированная на безопасный ИИ. Серия Claude известна большим контекстным окном, аккуратным следованием инструкциям и сильным тулюзом. Поддерживает prompt caching для экономии на повторяющемся системном промпте.
Официальный сайт: https://anthropic.com
Документация модели у вендора: https://docs.anthropic.com/en/docs/about-claude/models