Sqoop | |||
---|---|---|---|
Utvikler(e) | Apache Software Foundation | ||
Utgitt | 21. september 2014[1] | ||
Nyeste versjon | 1.4.6 (11. mai 2015) | ||
Kodelager | https://git-wip-us.apache.org/repos/asf/sqoop.git | ||
Plattform | Java Virtual Machine | ||
Skrevet i | Java[2][1] | ||
Type | Dataforvaltning, stordata[1] | ||
Lisens | Apache License 2.0[3] | ||
Nettsted | sqoop.apache.org (en) sqoop.apache.org[4] | ||
Last ned | http://sqoop.apache.org/ | ||
Sqoop er en kommandolinje-grensesnitt-programvare for å overføre data mellom relasjonsdatabaser og Hadoop.[5] Det støtter inkrementell lasting av en enkelt tabell eller friforms SQL-spørring såvel som lagrede jobber som kan kjøres mange ganger for å importere oppdateringer gjort i databasen siden sist import. Importer kan også brukes til å populere tabeller i Hive eller HBase.[6] Eksporter kan brukes for å legge inn data fra Hadoop inn i relasjonsdatabaser. Sqoop ble et topp-nivå Apache-prosjekt i mars 2012.[7]
Microsoft bruker en Sqoop-basert forbindelse for å hjelpe til med å overføre data fra Microsoft SQL Server-databaser til Hadoop.[8] Couchbase, Inc. tilbyr også en Couchbase Server-Hadoop forbindelse ved hjelp av Sqoop.[9]
I 2015 beskrev Ralph Kimball Sqoop som følger under overskriften Fremtiden for ETL:[10]
Several big changes must take place in the ETL environment. First, the data feeds from original sources must support huge bandwidths, at least gigabytes per second. Learn about Sqoop loading data into Hadoop. If these words mean nothing to you, you have some reading to do! Start with Wikipedia.