Текстовая модель · minimax

MiniMax M2.5

minimax-m2-5

MiniMax M2.5 — текстовая модель от MiniMax, доступная через единый Ranvik API. Контекстное окно — 200k токенов. Максимум выходных токенов за один запрос — 128k. Поддерживаемые возможности: function_calling, streaming.

от 75.6 ₽ / 1M

Технические характеристики

МодальностьТекстовая модель
Провайдерminimax
Контекст200k токенов
Max output128k токенов
СтатусАктивна
ID для запросовminimax-m2-5

Возможности

Streaming (SSE)— Получение ответа по мере генерации — токен за токеном через Server-Sent Events.

Как работает

Передай stream: true в теле запроса — сервер вернёт SSE-поток с заголовком content-type: text/event-stream. Каждый чанк — строка вида data: {...}\n\n. Конец потока — data: [DONE]\n\n.

curl -N https://api.ranvik.ru/v1/chat/completions \
  -H "Authorization: Bearer rk_live_..." \
  -H "Content-Type: application/json" \
  -d '{
    "model": "gpt-5",
    "messages": [{"role": "user", "content": "Привет"}],
    "stream": true,
    "stream_options": {"include_usage": true}
  }'

Каждый чанк содержит choices[0].delta — частичные данные. Последний чанк перед [DONE] (если включить stream_options.include_usage: true) содержит usage с реальным числом токенов — используй для биллинг-учёта на клиенте.

Когда использовать

  • Чат-интерфейсы, где важна перцептивная скорость отклика.
  • Длинные ответы (> 1000 токенов) — пользователь видит прогресс.
  • Streaming tool-calls — delta.tool_calls[i].function.arguments приходят инкрементально.

Когда НЕ использовать

  • Backend-to-backend интеграции, где нужен только финальный JSON — добавляет парсинг SSE без выгод.
  • Когда обязательно знать стоимость до отправки в БД — без include_usage затраты неизвестны.
  • Function Calling
  • Streaming

Цены

ЕдиницаЦена
за 1М input75.6 ₽
за 1М output266 ₽

Цены указаны в рублях. Списываются с баланса проекта при каждом успешном запросе.

Поддерживаемые параметры

Параметры передаются вендору как есть (pure proxy) — мы не валидируем их у себя на стороне. Если вендор не примет — вернётся его ошибка.

ПараметрТипДиапазон / valuesDefaultОписание
messagesrequiredarray Массив сообщений в формате OpenAI: [{"role": "system"|"user"|"assistant", "content": "..."}].
примеры значений
Примеры
[
  {
    "role": "system",
    "content": "You are a helpful assistant."
  },
  {
    "role": "user",
    "content": "Привет!"
  }
]
temperaturenumbermin: 0 · max: 21 Sampling temperature 0..2. Выше — креативнее, ниже — детерминированнее.
top_pnumbermin: 0 · max: 11 Nucleus sampling. Альтернатива temperature — рекомендуется менять только одно.
max_tokensintegermin: 1 Максимум токенов в ответе.
streambooleanfalse Streaming через SSE.
stoparray of strings До 4 stop-последовательностей. Генерация прекратится при их встрече.
presence_penaltynumbermin: -2 · max: 20 Penalty за повторение тем (-2..2).
frequency_penaltynumbermin: -2 · max: 20 Penalty за повторение токенов (-2..2).
toolsarray Список tools (OpenAI function calling формат) для агентных режимов.
tool_choicestring auto / required / none / {type: "function", function: {name}}.
response_formatobject Формат ответа: {"type": "json_object"} для гарантированного JSON.

Пример запроса

from openai import OpenAI

client = OpenAI(api_key="rk_live_...", base_url="https://api.ranvik.ru/v1")
resp = client.chat.completions.create(
    model="minimax-m2-5",
    messages=[{"role": "user", "content": "Привет!"}],
)
print(resp.choices[0].message.content)

Замените rk_live_... на ваш ключ из кабинета.

О провайдере: MiniMax

MiniMax — китайская AI-лаборатория. Известна моделями TTS высокого качества (Speech) с поддержкой многоязычной речи и клонирования голоса, а также видеогенератором Hailuo.

Официальный сайт: https://minimaxi.com

Документация модели у вендора: https://www.minimax.io/platform/document/api-reference