A Databricks fechou acordo para adquirir a Tabular, companhia de gerenciamento de dados fundada por Ryan Blue, Daniel Weeks e Jason Reid. O objetivo da companhia é se tornar referência na área de compatibilidade de dados.
Com a aquisição, as empresas pretendem trabalhar em cooperação com as plataformas Delta Lake e Iceberg para integrar maior compatibilidade de formatos para o Lakehouse, tanto a curto prazo, dentro do Delta Lake UniForm, quanto a longo prazo, evoluindo para um padrão único, aberto e comum de operacionalidade. Com a aquisição, Databricks e Tabular trabalharão juntas em prol de uma visão única sobre lakehouses abertos.
A base dos lakehouses é feita de formatos de dados de open source que permitem transações ACID com informações armazenadas em unidades. Esses formatos melhoram drasticamente a confiabilidade e o desempenho das operações de dados no Data Lake e foram projetados especificamente para mecanismos de open source, como Apache Spark, Trino e Presto.
Para abordar esses desafios, a Databricks trabalhou com a Linux Foundation para criar o projeto Delta Lake. Desde a sua criação, o Delta Lake contou com mais de 500 colaboradores de código de diversas organizações e mais de 10 mil empresas em todo o mundo usam a solução para processar mais de quatro exabytes de dados em média por dia.
A Databricks e a Tabular compartilham um histórico de defender formatos de open source. Ambas empresas foram criadas para comercializar tecnologias de open source desenvolvidas pelos seus fundadores e, atualmente, a Databricks é a maior e mais bem-sucedida companhia independente de open source por receita, tendo doado 12 milhões de linhas de código para projetos de open source.