大数据建立有Hadoop能力的最佳实践
基于Hadoop和MapReduce的大数据平台技术越来越受欢迎。但是企业怎样才能有效地利用他们呢?
Forrester 研究公司资深分析师James G. Kobielus 在“企业Hadoop最佳实践:来自在线服务的早期采用者的具体指南”报告中推荐了以下策略,用于企业中建立一种Hadoop框架的最佳实践时:
使Hadoop定位于你的大数据业务重点上。为大数据定位你的企业策略。优先考虑那些项目并看看如何能让它们得益于Hadoop。Kobielus说“企业应该将他们的大数据优先位置设定,然后再决定是用Hadoop,一个企业数据仓库(EDW),或一些两者的混合,或其它方法解决大数据… 在你核心势在必行的大数据上有一种明确的效果和近期回报的情况下开始一种大范围的 Hadoop项目。”
将Hadoop与像企业数据仓库(EDW)这样的企业软件整合。Kobielus说“Hadoop在云企业数据仓库(EDW)中有相当的前景以支持非常扩展的分析,这是大数据的核心应用程序。”
在企业级的平台上建立Hadoop的安装。现在有许多可用的Hadoop产品 ― 在决定哪一种才适合于你的企业之前仔细评估它们。但Kobielus警慎地反对标准化于任何一个供应商或产品, 因为 目前一切都改变得太快了。现在把自己锁定在任何一种产品或供应商上都可能是一个错误。
不要超出你的需要建立太大的Hadoop集群。Kobielus建议说企业“只有在数据量可能会扩展到高TB字节或甚至PB字节的时候才应该探索一种像Hadoop这样的大数据方法,”如果你在数据存储、计算和网络性能上过度投资,你会在没有任何相应的经营效益下增加你的成本。”
以一种将来能被结合的方式架构Hadoop项目。Kobielus说“Hadoop群集实施Hadoop子项目的一种共同堆栈,从存储层到更上的层。这种架构方法有助于后续分工的聚合以及易于MapReduce和其它分工之间的工作的推广…一定要与你的战术Hadoop看齐,这样你才能在需要进入共享服务公用设施的时候整合它们。”
在成员之间建立Hadoop专业知识。和社区接触。在MapReduce技术上建立专业的知识。从咨询公司和像亚马逊和Appistry这样的云/软件即服务(SaaS)供应商那里寻求指导。
【了解更多BI商业智能、大数据分析平台行业资讯,商业智能解决方案以及商业智能软件下载请访问速鸿官网http://www.suhongkeji.com/】