Apache Hive VS Spark：不同目的，同样成功

发布时间：2019-10-18 15:35:49 所属栏目：MySql教程来源：读芯术

导读：Hive和Spark凭借其在处理大规模数据方面的优势大获成功，换句话说，它们是做大数据分析的。本文重点阐述这两种产品的发展史和各种特性，通过对其能力的比较，来说明这两个产品能够解决的各类复杂数据处理问题。什么是Hive? Hive是在Hadoop分布式文件系统

Spark可以与运行在Hadoop上的各种数据存储(如Hive和HBase)集成。还可以从像MongoDB这样的NoSQL数据库中提取数据。与在数据库中执行分析的其他应用程序不同，Spark从数据存储中提取数据一次，然后在内存中对提取的数据集执行分析。

Spark的扩展——Spark Streaming可以与Kafka和Flume集成，构建高效高性能的数据管道。

Hive和Spark的区别

Hive和Spark是大数据空间为不同目的而构建的不同产品。Hive是一个分布式数据库，Spark是一个用于数据分析的框架。

特性和功能的差异

Apache Hive VS Spark：不同目的，同样成功

结论

Hive和Spark都是大数据世界中非常流行的工具。Hive是使用SQL对大量数据执行数据分析的最佳选择。另一方面，Spark是运行大数据分析的最佳选择，它提供了比MapReduce更快、更现代的替代方案。

【编辑推荐】

【责任编辑：武晓燕 TEL：（010）68476606】
点赞 0

（编辑：青岛站长网）

【声明】本站内容均来自网络，其相关言论仅代表作者个人观点，不代表本站立场。若无意侵犯到您的权利，请及时与联系站长删除相关内容!

数据库的那点事	xtrabackup自主全备份
MySQL Like子句	mydumper和myloader参