YTsaurus

YTsaurus — платформа распределенного хранения и обработки больших объемов данных с поддержкой MapReduce, распределенной файловой системой и NoSQL key-value базой данных.

Обзор

Общее описание системы: назначение YTsaurus и основные возможности платформы.

Хранение информации

Хранение данных в YTsaurus: дерево метаинформации Кипарис, основные объекты системы, ACL, статические таблицы, транзакции, форматы хранения.

Как попробовать

Примеры базовых действий c YTsaurus в CLI и веб-интерфейсе.

Динамические таблицы

NoSQL key-value база данных: транзакции, язык запросов, реплицированные динамические таблицы.

API и справочник

Команды и их параметры, описание SDK и примеры кода для взаимодействия с платформой.

Обработка данных

Обработка данных при помощи YTsaurus: планировщик, парадигма MapReduce, поддерживаемые операции.

  • YQL — декларативный SQL-подобный язык запросов.
  • CHYT — кластер ClickHouse внутри YTsaurus.
  • SPYT — кластер Apache Spark внутри YTsaurus.