Tengri Data Platform

Tengri Data — корпоративная аналитическая платформа.

Проблемы

Если для операционной деятельности крупных компаний существуют такие проверенные временем инструменты, как PostgreSQL, то выбор оптимального решения для аналитики данных по-прежнему представляет серьезный вызов.

Традиционные СУБД отлично справляются с объемом до 1 ТБ анализируемых данных и поддерживают работу 10—​20 аналитиков. Однако дальнейший рост потребностей аналитики, внедрение AI и ML, а также увеличение числа пользователей и доменов данных могут сильно увеличивать сроки и снижать надежность результатов.

Подробнее о проблемах больших данных 3V — Volume, Velocity, Variety

Традиционно при работе с большими данным выделяют список главных проблем, состоящий из 3 V:

1. Volume (Объем)

Данных для анализа становится все больше, речь идет о десятках и сотнях ТБ.

2. Velocity (Скорость)

Возрастают требования по скорости реагирования, растет число аналитиков и моделей, анализирующих данные. Увеличивается и скорость прироста данных.

3. Variety (Многообразие)

Увеличивается количество и разнообразие форматов источников данных.

Позже к этому списку базовых проблем добавлялись и другие V, среди которых:

  1. Veracity — достоверность данных

  2. Variability — изменчивость данных

  3. Visualization — визуализация данных

  4. Value — ценность данных

  5. Venue — место хранения и использования данных

  6. Vocabulary — потребность в создании общего глоссария для работы с данными

  7. Vagueness — неопределенность некоторых типов данных

Все эти ограничения и вызовы указывают на необходимость принципиально нового подхода при построении корпоративных систем анализа больших данных.

Что предлагает Tengri

Разделение

Принцип разделения Compute & Storage позволяет гибко и независимо масштабировать хранение данных и вычислительные ресурсы без кратного увеличения расходов на инфраструктуру и адаптивно встраиваться в современные гибридные инсталляции предприятий.

diagram 1
Каждому запросу доступен свой ресурс: аналитикам, отчетной системе или сервису машинного обучения не приходится конкурировать
— Николай Голов
директор по продукту Tengri Data

Удобство

Используя знакомый язык SQL и стандартные подключения ODBC/JDBC, аналитики могут получать ответы за считанные секунды — независимо от того, занимают ли данные 1 ГБ или 1 ПБ, и есть ли конкурирующие запросы или нет. При этом открытые форматы данных обеспечивают максимальную гибкость и масштабируемость.

Аналитики могут сосредоточиться на решении бизнес-задач, не отвлекаясь на технические нюансы платформы.
— Михаил Тюрин
директор департамента Tengri Data

Результат

Успех этого подхода на мировом рынке подтверждают коммерческие достижения Snowflake и Databricks, решения которых недоступны компаниям в РФ. Tengri предоставляет аналогичные, а порой и превосходящие возможности, используя еще более современный технологический стек.

Мы создаем платформу, открывающую путь к действительно неограниченной аналитике, снимая барьеры на пути к полноценному раскрытию потенциала данных.
— Николай Голов
директор по продукту Tengri Data