Целевая архитектура основана на Open-Source технологиях.
В основе решения лежит подход Data Lakehouse с разделением слоя обработки данных (процессинга) и слоя хранения.
В архитектуре предложено использование следующих технологий: Apache Airflow, Iceberg, Trino, S3, Spark, Clickhouse, OpenMetadata, Apache Superset и другие.