Мы используем файлы cookies для корректного функционирования нашего сайта и аналитики. Вам предоставлена возможность согласиться или отказаться от всех cookies. Подробнее в Политике в отношении обработки персональных данных.
Принять все
Отклонить все
Сожалеем, но без согласия на использование cookies работа с сайтом невозможна. Это необходимо для обеспечения базовой функциональности сервиса.
Send a request and our specialists will contact you within 1 hour.
By clicking the "Send" button, you give your unambiguous consent to the processing of your personal data to the extent and for the purposes defined in the Personal Data Processing Policy.
Снижение затрат на инфраструктуру на 30–50% против классического DWH
Поддержка SQL, Python, Spark, AI/ML на единой копии данных
Независимое масштабирование
Data lakehouse
Внедряем Lakehouse-платформу — единое решение для хранения и аналитики всех типов данных. Снижаем совокупную стоимость владения (TCO) на 30–50% по сравнению с классическим DWH.
Архитектура Lakehouse: как объединить озёра и хранилища данных
Традиционные системы заставляют выбирать: или дешёвое озер данных (data lake) без ACID и низкой производительность запросов, или дорогое хранилище (DWH) с жёсткими схемами и проблемами с неструктурированными данными. Data lakehouse устраняет этот компромисс.
Data lakehouse — это новая архитектура, которая объединяет гибкость озёр данных (data lake) и производительность хранилище данных (DWH). Мы строим lakehouse-платформу на открытых технологиях (Apache Iceberg, Delta Lake, Hudi) с разделением хранения и вычислений, поддержкой ACID-транзакций и обработки потоков в реальном времени. Результат: вы работаете с сырыми и структурированными данными в одном месте без дублирования и дорогих ETL.
Средний объемов обработки в наших проектах – от 10 ТБ до 3 ПБ данных. Запросов выполняются в 5–20 раз быстрее, чем на классическом data lake без оптимизации. Интеграция с bi-системами (Tableau, Power BI) и ml-библиотеками (Python, Spark MLlib) занимает 2–5 дней.
Сценарии внедрения Lakehouse: от аналитики до ИИ
Процессы
Единая платформа для аналитики и данных
Аналитики строят дашборды в Power BI по тем же данным, на которых ML-инженеры обучают модели в Spark. Исключим копирование данных между DWH и озером – экономия места на диске до 70%.
Обработка потоков в реальном времени
Lakehouse принимает миллионы событий в секунду через Kafka, сохраняет в таблицы с ACID и сразу делает доступными для аналитики. Задержка от поступления до запроса – менее 5 секунд.
Отрасли
Медицина и геномика
Хранение огромных BAM/FASTQ-файлов (десятки ГБ на пациента) рядом с таблицами результатов анализов. Врачи-исследователи запускают SQL-запросы по клиническим данным и AI-модели по изображениям – без перемещения терабайтов.
Ритейл и логистика
Объединение данных из POS-терминалов, складского учёта (1С), курьерских трекеров и погодных API. Lakehouse строит прогнозы спроса на неделю вперёд с точностью 94% на исторических данных за 5 лет.
Финансы и фрод-мониторинг
ACID-гарантии позволяют вести историю изменений клиентских лимитов и транзакций. Time travel – за 3 минуты восстановить состояние на любой момент для расследования инцидентов.
Стоимость внедрения Lakehouse: от пилота до промышленного контура
Цена проекта зависит от объёма данных, количества источников, требуемой нагрузки и выбранных технологии
Для пилотных проектов
до 30 часов в месяц
3 000 ₽/час
Для растущего бизнеса
от 30 до 100 часов в месяц
2 900 ₽/час
Корпоративное решение
от 100 до 150 часов в месяц
2 750 ₽/час
Комплексное решение
от 150 часов в месяц
2 500 ₽/час
Кейсы
Автоматизация обработки резюме с помощью DUC SmartSearch
Как преобразовать резюме сотрудников в единый корпоративный формат, независимо от исходного типа файла (.rtf, .doc/.docx, .pdf)
Разработали ИИ-ассистента для отдела кадров, который в Telegram автоматически заполняет документы при трудоустройстве, сокращает временные затраты на 80% и исключает ошибки в юридических документах.
Разработали ИИ-бота для Telegram, который автоматически находит потенциальных клиентов, анализирует их бизнес и генерирует персонализированные письма, сокращая время на поиск лидов на 95%.
поднимаем объектное хранилище (MinIO / S3) и вычислительный кластер в вашем облаке или on‑premise. Конфигурируем мониторинг (Prometheus + Grafana).
Миграция и инкрементальная загрузка
переносим исторические данные (batch) и настраиваем CDC (Debezium, Kafka). Проверяем ACID-гарантии при конкурентной записи.
Оптимизация запросов
настраиваем партиционирование, сортировку, индексацию (z-order, bloom filters). Добиваемся выполнения сложных аналитических запросов за < 1 секунды.
Обучение и передача в эксплуатацию
проводим 2‑дневный тренинг для ваших инженеров и аналитиков. Передаём документацию, скрипты бэкапов и план disaster recovery.
Какие бизнес-задачи решает Lakehouse
Традиционные методы не справляются с объёмом данных и разнообразием обучающихся. Внедрение ии в образовании решает ключевые проблемы:
Снижение совокупной стоимости владения (TCO)
Классический DWH требует дорогого проприетарного ПО и отдельной инфраструктуры для сырых данных. Lakehouse на open-source технологиях снижает затраты на лицензии и хранение на 30–50% при том же объёме.
Ускорение аналитики и принятия решений
Раньше аналитики ждали ETL для загрузки данных в DWH – от 2 часов до суток. В Lakehouse данные доступны в сыром виде сразу, а витрины строятся по требованию. Скорость получения инсайтов растёт в 5–10 раз.
Поддержка ИИ на промышленных данных
Работа с полными наборами данных прямо в Lakehouse через Spark или Python – модели обучаются на терабайтах без сэмплирования.
Единый источник правды без дублирования
Исчезают проблемы несогласованности между озёрами и хранилищами. Вы управляете одной копией данных – правила безопасности, маскирования и аудит применяются централизованно.
Гибкость под любые форматы и нагрузки
Приходит новый источник – интернет-магазин присылает JSON‑логи, а отдел маркетинга – CSV. Lakehouse принимает всё без предварительной схемы. Аналитики строят SQL‑запросы, а инженеры – потоковые пайплайны.
Почему DUC Technologies
Настраиваем Ranger или встроенный ACL для строк/столбцов, аудит доступа, шифрование при хранении и при передаче. Помогаем пройти требования 152-ФЗ, PCI DSS.
Безопасность
Промышленный опыт
Прозрачные сроки и бюджет
Реальные проекты в ритейле, телекоме, финансах. Мы умеем настраивать автоскейлинг, оптимизировать или оптимизировать работу с большим количеством маленьких файлов и строить каталоги с миллионами партиций.
Фиксируем стоимость и сроки в договоре после аудита. Доработки сверх ТЗ – по согласованию. Вы всегда видите, за что платите: никакой «магии» в инжиниринге.
Открытые технологии
Никаких проприетарных форматов и закрытых API. Вы можете перейти от нас к своему инженеру, забрать всю конфигурацию и метаданные. Мы не держим клиентов на «крючке».
Data Lake не поддерживает ACID-транзакции, конкурентную запись и не даёт гарантий целостности данных. Lakehouse добавляет слой метаданных (Iceberg/Delta), обеспечивающий транзакции, time travel, быстрые запросы без ETL и управление схемой.
Пилотный проект (до 1 ТБ) – 4 недели. Полноценная промышленная платформа – от 8 до 14 недель в зависимости от количества источников и требований к безопасности.
Любые: структурированные (таблицы, CSV, Parquet), полуструктурированные (JSON, XML, Avro), неструктурированные (изображения, аудио, видео, PDF, логи). Поддерживаются потоковые данные из Kafka и CDC из OLTP-баз.
Да. Мы интегрируем Lakehouse с любыми источниками (Oracle, PostgreSQL, 1С, MongoDB, S3-совместимые хранилища, Kafka). Подключаем ваш BI (Tableau, Power BI, Superset) и ML-фреймворки.
На уровне хранилища – шифрование AES-256. На уровне доступа – политики на строки/столбцы через Apache Ranger или маскирование. Аудит всех запросов. Поддерживаем изолированные облачные контуры и on‑premise.
Да. Мы настраиваем потоковую запись через Structured Streaming или Flink. Задержка от поступления данных до их видимости в запросах – менее 5 секунд. Поддерживается запись и чтение одновременно без блокировок.
Продукты
Готовые решения «ДЮК Технологии» на базе искусственного интеллекта
Оперативное внедрение современных технологий и повышение конкурентоспособности бизнеса
Готовые решения «ДЮК Технологии» на базе искусственного интеллекта
Видеоаналитика DUC NeuroSafety
Автоматизированный анализ видеоданных промышленных объектов
ИИ-ассистенты на базе больших языковых моделей: ИИ-эксперт Марк по охране труда, ИИ-ассистенты для лидогенерации, закупок, продаж, форматирования резюме и отдела кадров