Gemini 3.5 Flash
1M contextgemini-3-5-flash — текстовая модель-модель от Google.
document_understandingfunction_callingstreamingvisionweb_search
Попробуйте прямо здесь
Gemini 3.5 Flash Открыть в Playground
Что умеет Gemini 3.5 Flash
- Document Understanding
- Function Calling
- Streaming
- Vision
- Веб-поиск
Стоимость
за 1М cache read
49.88 ₽
за 1М input
499 ₽
за 1М output
2 993 ₽
web_search
4.66 ₽
Цены указаны в рублях и списываются с баланса проекта за успешные запросы. Надбавки (+) суммируются с базовой ставкой.
Технические характеристики
Контекст
1,048,576
токенов
Output
65,536
токенов
Vendor
google
Modality
text
Параметры запроса
Параметры, которые принимает модель. Передаются в теле запроса.
ПараметрТипДиапазон / значенияПо умолчаниюОписание
max_completion_tokensinteger
min: 1 · max: 65536
8192Максимум токенов в ответе. OpenAI-compat (/v1/chat/completions): max_completion_tokens (max_tokens тоже принимается). · Нативный generateContent: maxOutputTokens (в generationConfig).
temperaturenumber
min: 0 · max: 2
1Креативность 0–2. OpenAI-compat: temperature. · Нативный generateContent: temperature (в generationConfig).
top_pnumber
min: 0 · max: 1
0.95Nucleus sampling. OpenAI-compat: top_p. · Нативный generateContent: topP (в generationConfig).
stoparray of strings
—
—Стоп-последовательности (до 5). OpenAI-compat: stop. · Нативный generateContent: stopSequences (в generationConfig).
seedinteger
—
—Сид для воспроизводимости. OpenAI-compat: seed. · Нативный generateContent: seed (в generationConfig).
response_formatobject
—
—Структурированный вывод: {type: json_object} или {type: json_schema, json_schema: {...}}. OpenAI-compat: response_format. · Нативный generateContent: responseMimeType + responseSchema (в generationConfig).
reasoning_effortenum
none, low, medium, high
—Уровень reasoning/thinking (Gemini 2.5/3.x). OpenAI-compat: reasoning_effort. · Нативный generateContent: thinkingConfig (в generationConfig).
toolsarray
—
—Function calling в OpenAI-формате: массив {type: function, function: {...}}. OpenAI-compat: tools. · Нативный generateContent: tools (нативный Google-формат function declarations).
tool_choicestring
—
—auto | none | required | {type: function, function: {name: ...}}. OpenAI-compat: tool_choice. · Нативный generateContent: toolConfig.functionCallingConfig.
streamboolean
—
falseSSE-стриминг. OpenAI-compat: stream:true на /v1/chat/completions. · Нативно — отдельный endpoint :streamGenerateContent (в generateContent поля stream нет).
extra_bodyobject
—
—Только OpenAI-compat: Gemini-only фичи вне OpenAI-стандарта — {google: {thinking_config, safety_settings, cached_content, ...}}. В нативном generateContent эти поля пишутся прямо в тело запроса (generationConfig / safetySettings / cachedContent), без обёртки extra_body.
Пример кода
gemini-3-5-flash_example.py
from openai import OpenAI
client = OpenAI(api_key="rk_live_...", base_url="https://api.ranvik.ru/v1")
resp = client.chat.completions.create(
model="gemini-3-5-flash",
messages=[{"role": "user", "content": "Привет!"}],
)
print(resp.choices[0].message.content)
# ── С веб-поиском ──
resp = client.chat.completions.create(
model="gemini-3-5-flash",
messages=[{"role": "user", "content": "Что нового в AI сегодня?"}],
tools=[{"type": "web_search"}],
)
print(resp.choices[0].message.content)