客户简介
清华大学交叉信息研究院由2000年计算机科学最高奖图灵奖得主、美国科学院院士、中国科学院外籍院士姚期智先生领导,目标为建设世界一流的交叉信息研究中心和人才培养基地,推动理论计算机科学和量子信息科学的发展,培养具有国际竞争力的拔尖创新人才。学院在成立之初就打算跟踪国际前沿技术,建立hadoop大数据的研究平台。
业务挑战
大数据是指资料量规模巨大到无法通过目前主流软件工具,在合理时间内达到撷取、管理、处理、并整理成为帮助企业经营决策更积极目的的资讯。大数据技术的战略意义不在于掌握庞大的数据信息,而在于对这些含有意义的数据进行专业化处理。换言之,如果把大数据比作一种产业,那么这种产业实现盈利的关键,在于提高对数据的"加工能力",通过"加工"实现数据的"增值"。
从技术上看,大数据无法用单台的计算机进行处理,必须采用分布式架构。它的特色在于对海量数据进行分布式数据挖掘,它依托分布式处理、分布式数据库和虚拟化技术。
清华大学的大数据研究平台基于开源的hadoop项目,准备打造一个国内最大、最先进的大数据研究平台。构建大数据研究平台需要大量的服务器、存储、网络设备协同工作。作为大数据平台的计算核心,服务器需要满足高计算性能、大存储容量、高IO性能、低能耗等系列需求。
除此之外,由于交叉学院成立时间不长,教学与科研仍然在清华的旧楼中,缺乏现代化的数据中心机房环境。如何把现代化的大数据研究平台和清华古老的历史建筑融合在一起成为大数据研究平台建设过程中的一个新的挑战。
解决方案
华为在深入分析了清华大学交叉信息学院的需求后,提供了基于华为RH2288 V2服务器为核心的大数据研究平台方案进行测试。清华大学交叉信息学院的测试结果表明,华为解决方案完全满足大数据研究平台的计算性能、存储容量和IO处理能力的要求。
华为RH2288 V2服务器基于采用最新Intel E5-2600系列CPU,支持24条RDIMM内存,内存容量最大768GB,最大支持26块硬盘,配置双端口万兆网卡,作为计算节点具备业界最大的存储容量和吞吐带宽,超高的性能和大容量存储能力完全满足大数据研究平台应用的需求。
除了服务器本身的高性能和大容量带来的高效的数据处理能力,更令清华大学交叉信息学院满意的是,华为不仅提供了大数据研究平台的硬件设施,而且根据交叉信息学院所在的机房,针对性地设计了分布式机房的解决方案,结合原有建筑的空间与供电条件, 统一规划设备部署方案和空调系统的设置、实现设备的集中管理和分布式部署,降低初次实施成本,同时利用华为服务器支持高温环境运行的特点,调高机房环境温度,减少空调的制冷量,节省综合运营成本40%以上。
客户收益
华为RH2288 V2与定制化机房设计方案,帮助清华大学交叉学院快速建设hadoop大数据研发平台,作为计算节点的RH2288 V2具有业界最大的存储容量与吞吐带宽,同比性能提升30%。
通过分布式的机房改造,统一管理,简化运营和维护,降低建设成本与运维成本40%。