Claude Opus 4.8

1M context
ПровайдерAnthropic

claude-opus-4-8 — текстовая модель-модель от Anthropic.

document_understandingfunction_callingprompt_cachingreasoningstreamingvisionweb_search

Попробуйте прямо здесь

Что умеет Claude Opus 4.8

  • Document Understanding
  • Function Calling
  • Prompt Caching
  • Reasoning
  • Streaming
  • Vision
  • Веб-поиск

Стоимость

за 1М cache read
166 ₽
за 1М input
1 663 ₽
за 1М cache write
2 078 ₽
cache_write_5m
cache_write_5m
0.0021 ₽
cache_write_1h
cache_write_1h
0.0033 ₽
за 1М output
8 313 ₽
web_search
3.33 ₽

Цены указаны в рублях и списываются с баланса проекта за успешные запросы. Надбавки (+) суммируются с базовой ставкой.

Технические характеристики

Контекст
1,000,000
токенов
Output
128,000
токенов
Vendor
anthropic
Modality
text

Параметры запроса

Параметры, которые принимает модель. Передаются в теле запроса.

ПараметрТипДиапазон / значенияПо умолчаниюОписание
max_tokensreq
integer
min: 1 · max: 128000
4096
Максимум токенов в ответе. Обязателен.
temperature
number
min: 0 · max: 1
1
0 — детерминированно, 1 — креативно. Используйте либо temperature, либо top_p, не оба.
top_p
number
min: 0 · max: 1
Nucleus sampling. Альтернатива temperature.
top_k
integer
min: 0
Sample только из top-K наиболее вероятных токенов.
stop_sequences
array
Текстовые последовательности при которых генерация останавливается. stop_reason будет "stop_sequence".
thinking
object
Extended thinking. На Opus 4.8 поддерживается ТОЛЬКО adaptive: {type:"adaptive"} (глубина reasoning контролируется через output_config.effort). Манульный {type:"enabled",budget_tokens:N} → HTTP 400.
tools
array
Tool definitions: custom + встроенные (code_execution, bash, text_editor, web_search). Каждый — {name, description?, input_schema}.
tool_choice
object
Управление выбором tool: "auto" | "any" | {type:"tool",name:"X"} | "none". Поддерживает disable_parallel_tool_use:bool.
service_tier
enum
auto, standard_only
Priority vs standard capacity.
metadata
object
{user_id: external UUID/hash без PII}.
stream
boolean
false
SSE streaming.
messagesreq
array
История сообщений. Массив объектов {role: "user"|"assistant", content: string|ContentBlock[]}. Content может содержать text, image, document, tool_use, tool_result блоки.
1 пример
Примеры
[
  {
    "role": "user",
    "content": "Привет, как дела?"
  }
]
system
string
System prompt — описание роли модели и контекста. Можно передать строку или массив TextBlockParam (для prompt caching через cache_control).
1 пример
Примеры
You are a helpful assistant who speaks in Russian.
mcp_servers
array
Список MCP (Model Context Protocol) серверов для подключения. Каждый элемент — объект {name, url, authorization_token, tool_configuration}.
container
string
ID контейнера для code execution tool (REPL state persistence). Передаётся для продолжения работы в существующем контейнере.
output_format
object
Структурированный output format. Например {type: "json", schema: {...}} для JSON-schema-validated output.
output_config
object
Конфиг вывода. Ключевое поле — effort: "low"|"medium"|"high"|"xhigh"|"max" (дефолт "high"). Контролирует token-spend на весь ответ (текст + tool calls + thinking). xhigh/max — для самых сложных coding/agentic задач. Передаётся вложенно: {effort:"medium"}.

Пример кода

claude-opus-4-8_example.py
from anthropic import Anthropic

client = Anthropic(api_key="rk_live_...", base_url="https://api.ranvik.ru")
resp = client.messages.create(
    model="claude-opus-4-8",
    max_tokens=1024,
    messages=[{"role": "user", "content": "Привет!"}],
)
print(resp.content[0].text)

# ── С веб-поиском ──
resp = client.messages.create(
    model="claude-opus-4-8",
    max_tokens=1024,
    messages=[{"role": "user", "content": "Что нового в AI сегодня?"}],
    tools=[{"type": "web_search_20250305", "name": "web_search"}],
)
print(resp.content[0].text)
Полная документация модели