MiniMax M2.7 Highspeed
minimax-m2-7
MiniMax M2.7 Highspeed — текстовая модель от MiniMax, доступная через единый Ranvik API. Контекстное окно — 200k токенов. Максимум выходных токенов за один запрос — 197k. Поддерживаемые возможности: function_calling, streaming.
от 168 ₽ / 1M
Технические характеристики
minimax-m2-7Возможности
Streaming (SSE)— Получение ответа по мере генерации — токен за токеном через Server-Sent Events.
Как работает
Передай stream: true в теле запроса — сервер вернёт SSE-поток с заголовком
content-type: text/event-stream. Каждый чанк — строка вида data: {...}\n\n.
Конец потока — data: [DONE]\n\n.
curl -N https://api.ranvik.ru/v1/chat/completions \
-H "Authorization: Bearer rk_live_..." \
-H "Content-Type: application/json" \
-d '{
"model": "gpt-5",
"messages": [{"role": "user", "content": "Привет"}],
"stream": true,
"stream_options": {"include_usage": true}
}'
Каждый чанк содержит choices[0].delta — частичные данные. Последний чанк перед
[DONE] (если включить stream_options.include_usage: true) содержит usage
с реальным числом токенов — используй для биллинг-учёта на клиенте.
Когда использовать
- Чат-интерфейсы, где важна перцептивная скорость отклика.
- Длинные ответы (> 1000 токенов) — пользователь видит прогресс.
- Streaming tool-calls —
delta.tool_calls[i].function.argumentsприходят инкрементально.
Когда НЕ использовать
- Backend-to-backend интеграции, где нужен только финальный JSON — добавляет парсинг SSE без выгод.
- Когда обязательно знать стоимость до отправки в БД — без
include_usageзатраты неизвестны.
- Function Calling
- Streaming
Цены
| Единица | Цена |
|---|---|
| за 1М input | 168 ₽ |
| за 1М output | 672 ₽ |
Цены указаны в рублях. Списываются с баланса проекта при каждом успешном запросе.
Поддерживаемые параметры
Параметры передаются вендору как есть (pure proxy) — мы не валидируем их у себя на стороне. Если вендор не примет — вернётся его ошибка.
| Параметр | Тип | Диапазон / values | Default | Описание |
|---|---|---|---|---|
messagesrequired | array | — | — | Массив сообщений в формате OpenAI: [{"role": "system"|"user"|"assistant", "content": "..."}]. примеры значенийПримеры [
{
"role": "system",
"content": "You are a helpful assistant."
},
{
"role": "user",
"content": "Привет!"
}
] |
temperature | number | min: 0 · max: 2 | 1 | Sampling temperature 0..2. Выше — креативнее, ниже — детерминированнее. |
top_p | number | min: 0 · max: 1 | 1 | Nucleus sampling. Альтернатива temperature — рекомендуется менять только одно. |
max_tokens | integer | min: 1 | — | Максимум токенов в ответе. |
stream | boolean | — | false | Streaming через SSE. |
stop | array of strings | — | — | До 4 stop-последовательностей. Генерация прекратится при их встрече. |
presence_penalty | number | min: -2 · max: 2 | 0 | Penalty за повторение тем (-2..2). |
frequency_penalty | number | min: -2 · max: 2 | 0 | Penalty за повторение токенов (-2..2). |
tools | array | — | — | Список tools (OpenAI function calling формат) для агентных режимов. |
tool_choice | string | — | — | auto / required / none / {type: "function", function: {name}}. |
response_format | object | — | — | Формат ответа: {"type": "json_object"} для гарантированного JSON. |
Пример запроса
from openai import OpenAI
client = OpenAI(api_key="rk_live_...", base_url="https://api.ranvik.ru/v1")
resp = client.chat.completions.create(
model="minimax-m2-7",
messages=[{"role": "user", "content": "Привет!"}],
)
print(resp.choices[0].message.content) Замените rk_live_... на ваш ключ из кабинета.
О провайдере: MiniMax
MiniMax — китайская AI-лаборатория. Известна моделями TTS высокого качества (Speech) с поддержкой многоязычной речи и клонирования голоса, а также видеогенератором Hailuo.
Официальный сайт: https://minimaxi.com
Документация модели у вендора: https://www.minimax.io/platform/document/api-reference