Bigdata SQL: Tajo

Apache Tajo is a big data relational and distributed data warehouse for Hadoop. It is designed for low-latency, ad-hoc queries, to perform online aggregation and ETL on large data sets stored on HDFS. Tajo is a distributed SQL query processing engine with advanced query optimization, to provide interactive analysis on reasonable data sets. It is ANSI SQL compliant, allows access to the Hive metastore, and supports various file formats.

Apache Tajo – это реляционное и распределенное хранилище больших данных для Hadoop. Он разработан для специальных запросов с малой задержкой, чтобы выполнять онлайн-агрегирование и ETL для больших наборов данных, хранящихся в HDFS. Tajo – это распределенный механизм обработки запросов SQL с расширенной оптимизацией запросов, обеспечивающий интерактивный анализ разумных наборов данных. Он совместим с ANSI SQL, обеспечивает доступ к хранилищу метаданных Hive и поддерживает различные форматы файлов.