Sqoop

Sqoop
Utvikler(e)Apache Software Foundation
Utgitt 21. september 2014[1]
Nyeste versjon1.4.6 (11. mai 2015)
Kodelagerhttps://git-wip-us.apache.org/repos/asf/sqoop.git
PlattformJava Virtual Machine
Skrevet iJava[2][1]
TypeDataforvaltning, stordata[1]
LisensApache License 2.0[3]
Nettstedsqoop.apache.org (en)
sqoop.apache.org[4]
Last nedhttp://sqoop.apache.org/

Sqoop er en kommandolinje-grensesnitt-programvare for å overføre data mellom relasjonsdatabaser og Hadoop.[5] Det støtter inkrementell lasting av en enkelt tabell eller friforms SQL-spørring såvel som lagrede jobber som kan kjøres mange ganger for å importere oppdateringer gjort i databasen siden sist import. Importer kan også brukes til å populere tabeller i Hive eller HBase.[6] Eksporter kan brukes for å legge inn data fra Hadoop inn i relasjonsdatabaser. Sqoop ble et topp-nivå Apache-prosjekt i mars 2012.[7]

Microsoft bruker en Sqoop-basert forbindelse for å hjelpe til med å overføre data fra Microsoft SQL Server-databaser til Hadoop.[8] Couchbase, Inc. tilbyr også en Couchbase Server-Hadoop forbindelse ved hjelp av Sqoop.[9]

I 2015 beskrev Ralph Kimball Sqoop som følger under overskriften Fremtiden for ETL:[10]

Several big changes must take place in the ETL environment. First, the data feeds from original sources must support huge bandwidths, at least gigabytes per second. Learn about Sqoop loading data into Hadoop. If these words mean nothing to you, you have some reading to do! Start with Wikipedia.

Referanser

[rediger | rediger kilde]
  1. ^ a b c https://projects.apache.org/json/projects/sqoop.json; besøksdato: 8. april 2020.
  2. ^ «The sqoop Open Source Project on Open Hub: Languages Page». Open Hub. Besøkt 18. juli 2018. 
  3. ^ «The sqoop Open Source Project on Open Hub: Licenses Page». Open Hub. Besøkt 18. juli 2018. 
  4. ^ projects.apache.org, besøkt 8. april 2020[Hentet fra Wikidata]
  5. ^ «Hadoop: Apache Sqoop». Besøkt 8. august 2012. 
  6. ^ «Apache Sqoop - Overview». Besøkt 8. august 2012. 
  7. ^ «Apache Sqoop Graduates from Incubator». Besøkt 8. august 2012. 
  8. ^ «Microsoft SQL Server Connector for Apache Hadoop». Besøkt 8. august 2012. 
  9. ^ «Couchbase Hadoop Connector». Arkivert fra originalen 25. august 2012. Besøkt 8. august 2012. 
  10. ^ Kimball, Ralph (1. desember 2015). «Design Tip #180 The Future Is Bright». Kimball Group. Arkivert fra originalen 3. desember 2015. Besøkt 3. desember 2015. «Several big changes must take place in the ETL environment. First, the data feeds from original sources must support huge bandwidths, at least gigabytes per second. Learn about Sqoop loading data into Hadoop. If these words mean nothing to you, you have some reading to do! Start with Wikipedia.» 

Bibliografi

[rediger | rediger kilde]

Eksterne lenker

[rediger | rediger kilde]