Qdrant - Vector Database

Qdrant Cloud vs Self-Hosted

Ваш прототип работает на Free tier, пора в production. Вопрос: платить $35/месяц Qdrant Cloud или поднять свой сервер за $20? Ответ зависит не от цены - от размера команды, требований к данным и сколько стоит ваше время. Разберём когда что выбирать и как мигрировать без downtime.

  • **Стартап без DevOps:** Qdrant Cloud Starter за 35/месяц - запуск за 5 минут, автоматические обновления. Команда фокусируется на продукте, не на инфраструктуре
  • **Медицинская платформа:** Self-hosted в HIPAA-совместимом окружении - data sovereignty, полный контроль, compliance-требования
  • **Enterprise с 50M+ векторами:** Self-hosted Kubernetes - $1000+/месяц в Cloud vs $300/месяц своя инфра. Разница 700/месяц оправдывает DevOps-затраты

Предварительные знания

  • Recommendations API

Qdrant Cloud: что предлагает и сколько стоит

**Qdrant Cloud** - managed-сервис: Qdrant Inc. берёт на себя infrastructure, updates, monitoring. Вы получаете кластер за минуты, без DevOps-экспертизы. Биллинг - за ноды (RAM + CPU + disk), не за запросы.

ТарифRAMCPUDiskЦена/месяцПодходит для
Free1 GB0.5 vCPU4 GB0Прототипы, < 200k векторов 1536-dim
Starter4 GB2 vCPU16 GB~35Продакшн до 1M векторов
Standard8 GB4 vCPU32 GB~70До 2M векторов без квантизации
Pro16 GB+8+ vCPU64 GB+140+Крупные коллекции, HA-кластер

**Free tier ограничения:** 1 кластер, 1 нода, нет резервных копий по расписанию, нет SLA. После бездействия 7 дней - кластер ставится на паузу (можно разбудить вручную). Для Production нужен минимум Starter.

**Регионы Qdrant Cloud:** AWS (EU Frankfurt, US East, US West), GCP (US Central). Выбирайте регион ближайший к вашему приложению - latency имеет значение при векторном поиске.

Стартап запускает RAG-сервис. Ожидается ~300k векторов OpenAI (1536-dim), команда из 2 разработчиков без DevOps-опыта, бюджет 50/месяц. Что выбрать?

Self-Hosted: Docker, Kubernetes, Bare Metal

**Self-hosted** означает полный контроль: вы сами управляете обновлениями, бэкапами, масштабированием. Три основных варианта: одиночный Docker-контейнер, Docker Compose, Kubernetes (Helm chart). Плюс bare metal для максимальной производительности.

**Kubernetes через Helm chart** - для production-grade deployments. Поддерживает distributed mode (sharding + replication), rolling updates, Pod Disruption Budgets. Официальный chart: `qdrant/qdrant`.

**Обязательно устанавливайте API key** для self-hosted Qdrant в production! По умолчанию REST API открыт без аутентификации. Переменная: `QDRANT__SERVICE__API_KEY=your-secret`. Или через конфиг: `service.api_key`.

Вы деплоите Qdrant self-hosted через Docker Compose. Данные хранятся в named volume. После `docker compose down && docker compose up` - что произойдёт с данными?

Матрица выбора и миграция между режимами

**Нет универсального ответа** - Cloud vs Self-hosted зависит от ваших приоритетов. Вот практическая матрица для принятия решения:

КритерийQdrant CloudSelf-Hosted
Запуск с нуля5 минут30 мин - несколько часов
DevOps-экспертизаНе нужнаНужна для prod
Data sovereigntyДанные у Qdrant Inc.Данные только у вас
Стоимость (1M vec)~$35-70/мес~$20-40/мес (VPS)
Стоимость (100M vec)~$1000+/мес~$200-500/мес
Автоматические бэкапыДа (платных планах)Настраиваете сами
МасштабированиеКлик в dashboardРучная настройка
Кастомная конфигурацияОграниченаПолная
Compliance (GDPR, HIPAA)Зависит от планаПолный контроль

**Правило большого пальца:** до ~10M векторов разница в стоимости небольшая, выигрыш от Cloud - в скорости запуска и отсутствии overhead. При 10M+ - self-hosted начинает окупаться. При строгих требованиях к data residency - только self-hosted.

**Стратегия миграции с нулевым downtime:** создайте dual-write (пишите в оба кластера), восстановите исторические данные через snapshot, переключите чтение на новый кластер, отключите dual-write. Это сложнее но позволяет мигрировать без остановки сервиса.

«Self-hosted всегда дешевле Cloud»

При малых объёмах (< 5M векторов) разница в прямых расходах минимальна, а операционные затраты (DevOps-время, инциденты) делают Cloud выгоднее. Self-hosted экономически оправдан при больших объёмах или строгих compliance-требованиях.

VPS на 8 GB RAM стоит ~$40/месяц, Qdrant Cloud Starter - $35. Разница 5. Но один инцидент с потерей данных или downtime стоит дороже. При 10M+ векторов cloud-цена растёт линейно, а self-hosted - нет, вот тогда разница становится значимой.

Компания работает в сфере здравоохранения. Данные пациентов нельзя хранить вне собственной инфраструктуры (HIPAA). Нужен Qdrant для 500k медицинских документов. Что выбрать?

Ключевые идеи

  • **Qdrant Cloud** - managed-сервис, биллинг за ноды. Free tier: 1 GB RAM, засыпает после 7 дней бездействия
  • **Self-hosted варианты:** Docker (одиночная нода), Docker Compose (prod), Kubernetes Helm (distributed), bare metal
  • **Выбор:** Cloud для быстрого старта и маленьких команд; Self-hosted для data sovereignty, compliance, 10M+ векторов
  • **Миграция** через snapshots: create → download → restore. Возможен dual-write для zero-downtime migration
  • **Обязательно** устанавливайте `QDRANT__SERVICE__API_KEY` в self-hosted production

Что дальше

Выбрали инфраструктуру - теперь нужно понять как масштабировать Qdrant горизонтально при росте данных.

  • Distributed Mode и Sharding — Self-hosted distributed требует понимания шардирования
  • Репликация и отказоустойчивость — HA в production - replication factor и Raft consensus
  • Мониторинг и метрики — Self-hosted требует настройки мониторинга вручную

Вопросы для размышления

  • Ваш проект обрабатывает персональные данные пользователей из ЕС (GDPR). Какой сценарий развёртывания Qdrant вы выберете и почему? Какие дополнительные меры потребуются?
  • Вы используете Free tier для разработки. Когда пришло время перейти на платный план или self-hosted? Составьте checklist критериев.
  • Опишите процесс миграции Qdrant Cloud → self-hosted для коллекции 5M векторов с допустимым downtime не более 30 секунд.

Связанные уроки

  • qd-17-distributed — Self-hosted кластер строится на distributed Qdrant
  • sd-10-microservices — Build vs buy решение для каждого сервиса
  • sd-03-scalability — Выбор deployment зависит от требований к масштабированию
  • os-19-containers — Self-hosted Qdrant запускается в Docker/Kubernetes
  • dist-11-replication
Qdrant Cloud vs Self-Hosted

0

1

Войти