基于云计算Spark大数据的软件运营商
Databricks,是一家基于云计算Spark大数据的软件运营商,成立于2013年1月1日,总部位于美国旧金山,主要提供用于数据集成、数据清洗、数据管理以及其他服务的基于Spark的云服务。[1][2]现任首席执行官为阿里・戈西(Ali Ghodsi)。[3][a] Databricks于2016年和微软达成合作。2017年11月,Databricks成为微软Azure的第一方服务平台。[4]2018年,Databricks发布了MLflow来管理机器学习项目。2020年6月,Databricks宣布收购以色列初创公司Redash。[4]2021年,Databricks和谷歌云达成合作。2023年, Databricks推出了开源语言模型Dolly。[4]2023年6月,Databricks宣布收购生成式人工智能初创公司MosaicML,[5]2024年3月,Databricks推出通用大型语言模型DBRX。[5][6] 2024年,Databricks被福布斯评为“AI50强:全球最佳AI初创企业”。2025年,Databricks被Gartner授予“魔力象限:数据科学与机器学习领域领导者”称号。[7] 历史沿革
2013年,Apache Spark[b]7位初始成员(Ali Ghodsi、Andy Konwinski、Arsalan Tavakoli-Shiraji、Ion Stoica、Matei Zaharia、Patrick Wendell和Reynold Xin)创立了Databricks。[8][4]2016年,Databricks和微软达成合作。2017年11月,Databricks成为微软Azure的第一方服务平台。[4]