As referências deste artigo necessitam de formatação. (Outubro de 2022) |
Fundação |
---|
Tipo | |
---|---|
Estado legal | |
Domínio de atividade | |
Sede social | |
País |
Empregados |
4 000 () |
---|---|
Fundadores | |
Presidente |
Ion Stoica (en) (a partir de ) |
Direção |
Ali Ghodsi (en) (a partir de ) |
Afiliação | |
Receita líquida |
1 000 000 000 $ () |
Website |
(en) databricks.com |
CIK |
---|
A Databricks é uma empresa americana de software fundada pelos criadores do Apache Spark.[1] A Databricks desenvolve uma plataforma baseada na web para trabalhar com o Spark, que fornece gerenciamento automatizado de cluster e notebooks no estilo IPython
A databricks surgiu do projeto AMPLab na Universidade da Califórnia, Berkeley, envolvido na criação do Apache Spark, uma estrutura de computação distribuída de código aberto construída sobre Scala. A empresa foi fundada por Ali Ghodsi, Andy Konwinski, Arsalan Tavakoli-Shiraji, Ion Stoica, Matei Zaharia,[2] Patrick Wendell e Reynold Xin.
Em novembro de 2017, a empresa foi anunciada como um serviço primário no Microsoft Azure por meio da integração Azure Databricks.[3]
A empresa desenvolve o Delta Lake, um projeto de código aberto destinado a trazer confiabilidade aos data lakes para aprendizado de máquina e outros usos em ciência de dados.[4]
Em junho de 2020, a Databricks adquiriu o Redash, uma ferramenta de código aberto projetada para ajudar cientistas e analistas de dados a visualizar e criar painéis interativos de seus dados.[5]
Em fevereiro de 2021, juntamente com o Google Cloud, a Databricks começou uma integração com o Google Kubernetes Engine e a plataforma BigQuery do Google.[6] A Fortune classificou o Databricks como um dos melhores grandes "Locais de Trabalho para Millennials" em 2021.[7] Na época, a empresa disse que mais de 5.000 organizações usavam seus produtos.[8]
Em agosto de 2021, a Databricks terminou sua oitava rodada de financiamento levantando US$ 1,6 bilhão, com uma avaliação da empresa em US$ 38 bilhões.[9]
Em outubro de 2021, a Databricks fez sua segunda aquisição da empresa alemã sem código 8080 Labs. 8080 Labs é a desenvolvedora de bamboolib, uma ferramenta de exploração de dados que não requer codificação para usar.[10]
Em setembro de 2013, a Databricks anunciou que levantou US$ 13,9 milhões da Andreessen Horowitz e disse que pretendia oferecer uma alternativa ao sistema MapReduce do Google.[11][12] A Microsoft foi um investidor notável da Databricks em 2019, participando da Série E da empresa por um valor não especificado.[13][14] A empresa levantou US$ 1,9 bilhão em financiamento, incluindo uma série G de US$ 1 bilhão liderada por Franklin Templeton em uma avaliação pós-money de US$ 28 bilhões em fevereiro de 2021. Outros investidores incluem Amazon Web Services, CapitalG (uma empresa de capital de crescimento sob Alphabet, Inc.) e Salesforce Ventures.[8]
Series | Encontro | Valor (milhões de dólares) | Investidores Líderes |
---|---|---|---|
UMA | 2013 | 13,9[11] | Andreessen Horowitz |
B | 2014 | 33[15] | Novos Associados Empresariais |
C | 2016 | 60[16] | Novos Associados Empresariais |
D | 2017 | 140[17] | Andreessen Horowitz |
E | fevereiro de 2019 | 250[18] | Andreessen Horowitz |
F | Outubro de 2019 | 400[19] | Andreessen Horowitz |
G | Janeiro de 2021 | 1.000[20] | Investimentos Franklin Templeton |
H | Agosto de 2021 | 1.600[21] | Morgan Stanley |
A Databricks desenvolve e vende uma plataforma de dados em nuvem usando o termo de marketing "lakehouse", um portmanteau baseado nos termos "data warehouse" e "data lake".[22] O lakehouse do Databricks é baseado na estrutura Apache Spark de código aberto que permite consultas analíticas em dados semiestruturados sem um esquema de banco de dados tradicional.[23]
O Delta Engine da Databricks foi lançado em junho de 2020 como um novo mecanismo de consulta que se sobrepõe ao Delta Lake para aumentar o desempenho da consulta.[24] É compatível com Apache Spark e MLflow, que também são projetos de código aberto da Databricks.[25]
Em novembro de 2020, a Databricks introduziu o Databricks SQL (anteriormente conhecido como SQL Analytics) para executar relatórios de análise e inteligência de negócios em data lakes. Os analistas podem consultar conjuntos de dados diretamente com SQL padrão ou usar conectores de produto para integrar diretamente com ferramentas de inteligência de negócios como Tableau, Qlik, Looker e ThoughtSpot.[26]
A Databricks também oferece uma plataforma para outras cargas de trabalho, incluindo aprendizado de máquina, armazenamento e processamento de dados, análise de streaming e inteligência de negócios.[27]
A empresa também criou Delta Lake, MLflow e Koalas, projetos de código aberto que abrangem engenharia de dados, ciência de dados e aprendizado de máquina.[28] Além de construir a plataforma Databricks, a empresa co-organizou grandes cursos online abertos sobre o Spark[29] e uma conferência para a comunidade Spark chamada Data + AI Summit,[30] anteriormente conhecida como Spark Summit.
A Databricks está sediada em São Francisco.[31]