Qdrant - Vector Database
Qdrant Cloud vs Self-Hosted
Ваш прототип работает на Free tier, пора в production. Вопрос: платить $35/месяц Qdrant Cloud или поднять свой сервер за $20? Ответ зависит не от цены - от размера команды, требований к данным и сколько стоит ваше время. Разберём когда что выбирать и как мигрировать без downtime.
- **Стартап без DevOps:** Qdrant Cloud Starter за 35/месяц - запуск за 5 минут, автоматические обновления. Команда фокусируется на продукте, не на инфраструктуре
- **Медицинская платформа:** Self-hosted в HIPAA-совместимом окружении - data sovereignty, полный контроль, compliance-требования
- **Enterprise с 50M+ векторами:** Self-hosted Kubernetes - $1000+/месяц в Cloud vs $300/месяц своя инфра. Разница 700/месяц оправдывает DevOps-затраты
Предварительные знания
Qdrant Cloud: что предлагает и сколько стоит
**Qdrant Cloud** - managed-сервис: Qdrant Inc. берёт на себя infrastructure, updates, monitoring. Вы получаете кластер за минуты, без DevOps-экспертизы. Биллинг - за ноды (RAM + CPU + disk), не за запросы.
| Тариф | RAM | CPU | Disk | Цена/месяц | Подходит для |
|---|---|---|---|---|---|
| Free | 1 GB | 0.5 vCPU | 4 GB | 0 | Прототипы, < 200k векторов 1536-dim |
| Starter | 4 GB | 2 vCPU | 16 GB | ~35 | Продакшн до 1M векторов |
| Standard | 8 GB | 4 vCPU | 32 GB | ~70 | До 2M векторов без квантизации |
| Pro | 16 GB+ | 8+ vCPU | 64 GB+ | 140+ | Крупные коллекции, HA-кластер |
**Free tier ограничения:** 1 кластер, 1 нода, нет резервных копий по расписанию, нет SLA. После бездействия 7 дней - кластер ставится на паузу (можно разбудить вручную). Для Production нужен минимум Starter.
**Регионы Qdrant Cloud:** AWS (EU Frankfurt, US East, US West), GCP (US Central). Выбирайте регион ближайший к вашему приложению - latency имеет значение при векторном поиске.
Стартап запускает RAG-сервис. Ожидается ~300k векторов OpenAI (1536-dim), команда из 2 разработчиков без DevOps-опыта, бюджет 50/месяц. Что выбрать?
Self-Hosted: Docker, Kubernetes, Bare Metal
**Self-hosted** означает полный контроль: вы сами управляете обновлениями, бэкапами, масштабированием. Три основных варианта: одиночный Docker-контейнер, Docker Compose, Kubernetes (Helm chart). Плюс bare metal для максимальной производительности.
**Kubernetes через Helm chart** - для production-grade deployments. Поддерживает distributed mode (sharding + replication), rolling updates, Pod Disruption Budgets. Официальный chart: `qdrant/qdrant`.
**Обязательно устанавливайте API key** для self-hosted Qdrant в production! По умолчанию REST API открыт без аутентификации. Переменная: `QDRANT__SERVICE__API_KEY=your-secret`. Или через конфиг: `service.api_key`.
Вы деплоите Qdrant self-hosted через Docker Compose. Данные хранятся в named volume. После `docker compose down && docker compose up` - что произойдёт с данными?
Матрица выбора и миграция между режимами
**Нет универсального ответа** - Cloud vs Self-hosted зависит от ваших приоритетов. Вот практическая матрица для принятия решения:
| Критерий | Qdrant Cloud | Self-Hosted |
|---|---|---|
| Запуск с нуля | 5 минут | 30 мин - несколько часов |
| DevOps-экспертиза | Не нужна | Нужна для prod |
| Data sovereignty | Данные у Qdrant Inc. | Данные только у вас |
| Стоимость (1M vec) | ~$35-70/мес | ~$20-40/мес (VPS) |
| Стоимость (100M vec) | ~$1000+/мес | ~$200-500/мес |
| Автоматические бэкапы | Да (платных планах) | Настраиваете сами |
| Масштабирование | Клик в dashboard | Ручная настройка |
| Кастомная конфигурация | Ограничена | Полная |
| Compliance (GDPR, HIPAA) | Зависит от плана | Полный контроль |
**Правило большого пальца:** до ~10M векторов разница в стоимости небольшая, выигрыш от Cloud - в скорости запуска и отсутствии overhead. При 10M+ - self-hosted начинает окупаться. При строгих требованиях к data residency - только self-hosted.
**Стратегия миграции с нулевым downtime:** создайте dual-write (пишите в оба кластера), восстановите исторические данные через snapshot, переключите чтение на новый кластер, отключите dual-write. Это сложнее но позволяет мигрировать без остановки сервиса.
«Self-hosted всегда дешевле Cloud»
При малых объёмах (< 5M векторов) разница в прямых расходах минимальна, а операционные затраты (DevOps-время, инциденты) делают Cloud выгоднее. Self-hosted экономически оправдан при больших объёмах или строгих compliance-требованиях.
VPS на 8 GB RAM стоит ~$40/месяц, Qdrant Cloud Starter - $35. Разница 5. Но один инцидент с потерей данных или downtime стоит дороже. При 10M+ векторов cloud-цена растёт линейно, а self-hosted - нет, вот тогда разница становится значимой.
Компания работает в сфере здравоохранения. Данные пациентов нельзя хранить вне собственной инфраструктуры (HIPAA). Нужен Qdrant для 500k медицинских документов. Что выбрать?
Ключевые идеи
- **Qdrant Cloud** - managed-сервис, биллинг за ноды. Free tier: 1 GB RAM, засыпает после 7 дней бездействия
- **Self-hosted варианты:** Docker (одиночная нода), Docker Compose (prod), Kubernetes Helm (distributed), bare metal
- **Выбор:** Cloud для быстрого старта и маленьких команд; Self-hosted для data sovereignty, compliance, 10M+ векторов
- **Миграция** через snapshots: create → download → restore. Возможен dual-write для zero-downtime migration
- **Обязательно** устанавливайте `QDRANT__SERVICE__API_KEY` в self-hosted production
Что дальше
Выбрали инфраструктуру - теперь нужно понять как масштабировать Qdrant горизонтально при росте данных.
- Distributed Mode и Sharding — Self-hosted distributed требует понимания шардирования
- Репликация и отказоустойчивость — HA в production - replication factor и Raft consensus
- Мониторинг и метрики — Self-hosted требует настройки мониторинга вручную
Вопросы для размышления
- Ваш проект обрабатывает персональные данные пользователей из ЕС (GDPR). Какой сценарий развёртывания Qdrant вы выберете и почему? Какие дополнительные меры потребуются?
- Вы используете Free tier для разработки. Когда пришло время перейти на платный план или self-hosted? Составьте checklist критериев.
- Опишите процесс миграции Qdrant Cloud → self-hosted для коллекции 5M векторов с допустимым downtime не более 30 секунд.
Связанные уроки
- qd-17-distributed — Self-hosted кластер строится на distributed Qdrant
- sd-10-microservices — Build vs buy решение для каждого сервиса
- sd-03-scalability — Выбор deployment зависит от требований к масштабированию
- os-19-containers — Self-hosted Qdrant запускается в Docker/Kubernetes
- dist-11-replication