ГлавнаяДокументация
Меню документации — Vision и файлы в чате

Vision и файлы в чате

Текстовые модели принимают изображения и PDF как часть messages[*].content массивом. Формат — OpenAI или Anthropic, мы транслируем под выбранную модель автоматически.

Изображение по URL

{
  "model": "gpt-4o",
  "messages": [{
    "role": "user",
    "content": [
      { "type": "text", "text": "Что на картинке?" },
      { "type": "image_url", "image_url": { "url": "https://example.com/cat.jpg" } }
    ]
  }]
}

Изображение base64

{
  "type": "image_url",
  "image_url": { "url": "data:image/png;base64,iVBORw0KGgoAAA..." }
}

PDF / документ

{
  "type": "file",
  "file": {
    "filename":  "report.pdf",
    "file_data": "data:application/pdf;base64,JVBERi0xLjQK..."
  }
}

Anthropic-формат (через /v1/messages)

{
  "type": "image",
  "source": { "type": "base64", "media_type": "image/png", "data": "iVBOR..." }
}

// PDF:
{
  "type": "document",
  "source": { "type": "base64", "media_type": "application/pdf", "data": "JVBE..." }
}
Кросс-вендор: отправьте OpenAI-формат с image_url на Anthropic-модель (или наоборот) — Ranvik сам конвертирует в нужный shape.