![]() ![]() | |
Tipus | model relacional de dades i programari lliure ![]() |
---|---|
Versió inicial | 9 novembre 2011 ![]() |
Versió estable | |
Llicència | Llicència Apache, versió 2.0 ![]() |
Característiques tècniques | |
Sistema operatiu | multiplataforma ![]() |
Plataforma | Màquina Virtual Java ![]() |
Escrit en | Java ![]() |
Equip | |
Desenvolupador(s) | Apache Software Foundation ![]() |
Més informació | |
Lloc web | hive.apache.org ![]() |
Seguiment d'errors | Seguiment d'errors ![]() |
| |
Apache Hive és un projecte de programari d'emmagatzematge, agrupament, gestió i anàlisi de dades construït sobre Apache Hadoop.[1] Apache Hive ofereix una interfície semblant a SQL per a consultar i fer anàlisi de dades emmagatzemades en diversos sistemes de fitxers i bases de dades. Inicialment desenvolupat per Meta Platforms (Facebook Inc. en aquell moment), l'eina és ara utilitzada per altres empreses com Netflix.[2][3] Amazon manté una derivació del programari Apache Hive inclosa en Amazon Elastic MapReduce, eina dels seus serveis AWS.[4]
Apache Hive dona suport a l'anàlisi de grans conjunts de dades emmagatzemats amb Apache Hadoop i amb altres sistemes compatibles com el sistema d'emmagatzematge d'arxius Amazon S3. Ofereix un llenguatge de consultes basat en SQL anomenat HiveQL,[5] que permet llegir i convertir consultes de forma transparent a MapReduce, Apache Tez[6] i tasques Spark. Els tres motors d'execució tot just mencionats poden funcionar sota YARN. Per a accelerar les consultes, Apache Hive proveeix l'usuari d'índexs, que inclouen índexs de bitmaps. Altres característiques significatives de Hive són les següents:
Per defecte, Hive emmagatzema les seves metadades en una base de dades Apache Derby, però pot ser configurat per a utilitzar MySQL.[7]