大数据市场调查-Hadoop解决方案

2017-06-02
标签: 大数据   

  大数据生态系统有可能是混乱不堪的。流行的“大数据”作为产业的热门话题而创造了很广泛的类别。随着Hadoop 在业界不可阻档的前进之势, 商业智能(BI)和数据仓库领域的解决方案也吸引着大数据的标签。使事情更混淆的是,像Hive这样基于Hadoop的解决方案同时也在朝着充满竞争的数据仓库解决方案进化。

大数据市场调查-Hadoop解决方案

  了解大数据问题的性质是评估可能的解决方案的有益的第一步。让我们先理清一下大数据的定义:

  “大数据是一种超过传统数据库系统处理能力的数据。数据太大, 移动太快, 或不适合数据库架构的狭窄。要从这样的数据中获取价值, 您必须选择另一种方式来处理它。”

  大数据问题在数量、速度和种类上的权重不同而各有不同。例如,以结构为主的大数据,可能是最适于分析数据库的方法。

  该调查认为数据仓库解决方案本身并不是答案,并集中在商业Hadoop生态系统的分析上。我们关注的是结合了存储和数据处理的解决方案,不包括那些只在上面那些层次的产品,如可视化或分析工作台软件。

  从Hadoop开始不需要大量投资,因为软件是开源代码,而且 可以立即通过亚马逊网络服务云获得。但通常需要生产环境, 支持, 专业服务和培训。

  仅仅是Hadoop?

  ApacheHadoop毫无疑问是最新的大数据解决方案的中心。在核心上,Hadoop是分布于通用服务器之间的计算系统。它经常与Hadoop Hive项目一起使用,该项目的数据仓库技术在Hadoop层之上,可以进行即时分析查询。

  大数据平台根据他们的Hadoop方法进行区分。由熟悉的企业供应商提供的大数据结合了Hadoop分布,而其他的平台提供Hadoop连接器与他们现有的分析数据库系统连接。后一种倾向于组成大规模并行处理(MPP)数据库,在Hadoop成熟前把他们的名字放在大数据中: 像Vertica和Aster Data。Hadoop这些案例中的长处在于联同现有数据库对结构化数据的分析能力处理非结构化数据。

  实用的大数据实施一般不会划入纯粹的结构或非结构化数据类型中。你总是会发现Hadoop作为关系型或大规模并行处理(MPP)数据库工作的一个组成部分。

  与之前的Linux一样, 没有Hadoop解决方案结合了原始的Apache Hadoop代码。相反, 它被包装在分布中。最低程度上, 这些分布要通过测试流过程, 通常包含额外的组件,如管理和监控工具。现在最常善加使用的分步来自Cloudera,Hortonworks和MapR。 并不是每一种分步都是商业的,然而,BigTop项目旨在Apache的保护下创建一种Hadoop的分布。


【了解更多BI商业智能大数据分析平台行业资讯,商业智能解决方案以及商业智能软件下载请访问速鸿官网http://www.suhongkeji.com/】

速鸿科技是一家专注于为企业提供 BI商业智能大数据分析智能分析智能软件以及 数据挖掘 等服务的大平台

咨询热线:020-37267822

粤ICP备15039093号