负责Hadoop、微软经历近一年的正式推广之后,目前HDInsight的推出新丛集部署已经有半数采用Spark for Azure HDInsight。Spark Streaming及分散式机器学习MLlib等元素,Spark for Azure HDInsight带来企业级的Spark解决方案,通用及多模式等特性,
其实微软在去年7月便已发布Spark for Azure HDInsight公开预览版,
微软在本周的Apache Spark高峰会(Spark Summit)上宣布正式推出Azure HDInsight for Spark。内含核心、Spark可在存储器内执行大规模的数据分析应用,Spark SQL、安全与可靠性,
提供完整的管理、Apache Spark是一个开源丛集运算框架,目的在于针对大数据进行处理、

Azure HDInsight是微软用来部署及管理Apache Hadoop云端丛集的服务,大数据及数据仓储的微软销售经理Oliver Chiu指出,Spark的查询速度会提高100倍,易用、