Claude Opus 4.8

1M context

ПровайдерAnthropic

claude-opus-4-8 — текстовая модель-модель от Anthropic.

document_understandingfunction_callingprompt_cachingreasoningstreamingvisionweb_search

Попробуйте прямо здесь

Claude Opus 4.8 Открыть в Playground

Что умеет Claude Opus 4.8

Document Understanding
Function Calling
Prompt Caching
Reasoning
Streaming
Vision
Веб-поиск

Стоимость

за 1М cache read

166 ₽

за 1М input

1 663 ₽

за 1М cache write

2 078 ₽

cache_write_5m

0.0021 ₽

cache_write_1h

0.0033 ₽

за 1М output

8 313 ₽

web_search

3.33 ₽

Цены указаны в рублях и списываются с баланса проекта за успешные запросы. Надбавки (+) суммируются с базовой ставкой.

Технические характеристики

Контекст

1,000,000

токенов

Output

128,000

токенов

Vendor

anthropic

Modality

text

Параметры запроса

Параметры, которые принимает модель. Передаются в теле запроса.

ПараметрТипДиапазон / значенияПо умолчаниюОписание

max_tokensreq

integer

min: 1 · max: 128000

4096

Максимум токенов в ответе. Обязателен.

temperature

number

min: 0 · max: 1

1

0 — детерминированно, 1 — креативно. Используйте либо temperature, либо top_p, не оба.

top_p

number

min: 0 · max: 1

—

Nucleus sampling. Альтернатива temperature.

top_k

integer

min: 0

—

Sample только из top-K наиболее вероятных токенов.

stop_sequences

array

—

—

Текстовые последовательности при которых генерация останавливается. stop_reason будет "stop_sequence".

thinking

object

—

—

Extended thinking. На Opus 4.8 поддерживается ТОЛЬКО adaptive: {type:"adaptive"} (глубина reasoning контролируется через output_config.effort). Манульный {type:"enabled",budget_tokens:N} → HTTP 400.

tools

array

—

—

Tool definitions: custom + встроенные (code_execution, bash, text_editor, web_search). Каждый — {name, description?, input_schema}.

tool_choice

object

—

—

Управление выбором tool: "auto" | "any" | {type:"tool",name:"X"} | "none". Поддерживает disable_parallel_tool_use:bool.

service_tier

enum

auto, standard_only

—

Priority vs standard capacity.

metadata

object

—

—

{user_id: external UUID/hash без PII}.

stream

boolean

—

false

SSE streaming.

messagesreq

array

—

—

История сообщений. Массив объектов {role: "user"|"assistant", content: string|ContentBlock[]}. Content может содержать text, image, document, tool_use, tool_result блоки.

1 пример

Примеры

[
  {
    "role": "user",
    "content": "Привет, как дела?"
  }
]

system

string

—

—

System prompt — описание роли модели и контекста. Можно передать строку или массив TextBlockParam (для prompt caching через cache_control).

1 пример

Примеры

You are a helpful assistant who speaks in Russian.

mcp_servers

array

—

—

Список MCP (Model Context Protocol) серверов для подключения. Каждый элемент — объект {name, url, authorization_token, tool_configuration}.

container

string

—

—

ID контейнера для code execution tool (REPL state persistence). Передаётся для продолжения работы в существующем контейнере.

output_format

object

—

—

Структурированный output format. Например {type: "json", schema: {...}} для JSON-schema-validated output.

output_config

object

—

—

Конфиг вывода. Ключевое поле — effort: "low"|"medium"|"high"|"xhigh"|"max" (дефолт "high"). Контролирует token-spend на весь ответ (текст + tool calls + thinking). xhigh/max — для самых сложных coding/agentic задач. Передаётся вложенно: {effort:"medium"}.

Пример кода

claude-opus-4-8_example.py

from anthropic import Anthropic

client = Anthropic(api_key="rk_live_...", base_url="https://api.ranvik.ru")
resp = client.messages.create(
    model="claude-opus-4-8",
    max_tokens=1024,
    messages=[{"role": "user", "content": "Привет!"}],
)
print(resp.content[0].text)

# ── С веб-поиском ──
resp = client.messages.create(
    model="claude-opus-4-8",
    max_tokens=1024,
    messages=[{"role": "user", "content": "Что нового в AI сегодня?"}],
    tools=[{"type": "web_search_20250305", "name": "web_search"}],
)
print(resp.content[0].text)

Полная документация модели