Меню документации — Vision и файлы в чате
Vision и файлы в чате
Текстовые модели принимают изображения и PDF как часть messages[*].content массивом. Формат — OpenAI или Anthropic, мы транслируем под выбранную модель автоматически.
Изображение по URL
{
"model": "gpt-4o",
"messages": [{
"role": "user",
"content": [
{ "type": "text", "text": "Что на картинке?" },
{ "type": "image_url", "image_url": { "url": "https://example.com/cat.jpg" } }
]
}]
}
Изображение base64
{
"type": "image_url",
"image_url": { "url": "data:image/png;base64,iVBORw0KGgoAAA..." }
}
PDF / документ
{
"type": "file",
"file": {
"filename": "report.pdf",
"file_data": "data:application/pdf;base64,JVBERi0xLjQK..."
}
}
Anthropic-формат (через /v1/messages)
{
"type": "image",
"source": { "type": "base64", "media_type": "image/png", "data": "iVBOR..." }
}
// PDF:
{
"type": "document",
"source": { "type": "base64", "media_type": "application/pdf", "data": "JVBE..." }
}
Кросс-вендор: отправьте OpenAI-формат с image_url на Anthropic-модель (или наоборот) — Ranvik сам конвертирует в нужный shape.