随着互联网与云计算的快速发展,中国掀起了数据中心的建设高潮,大型甚至超大型数据中心正在陆续投入使用。如贵州、内蒙、河北等地纷纷新建超大型云数据中心。
目前的数据中心资产管理方法,主要依靠人工采集和录入设备变更信息、人工巡检、人工盘点、工作强度大、工作效率低,随着数据中心规模越来越大,需要管理的设备数量急剧增加,传统的资产管理方式已经跟不上数据中心业务发展的脚步,成为数据中心运维的短板。
传统的数据中心IT资产管理方式存在以下问题:
1)海量的资产信息依靠人工采集与录入资产信息,依靠Access、Excel等工具或小型资产管理软件来管理,人力成本高、工作效率低下、差错率高,往往导致资产数据不可用;例如:某ISP运营商下辖数十个数据中心,依靠半手工的方式来管理资产,花费大量人力在资产盘点、报表合并等工作上,费时又费力,还无法保证数据准确。
2)快速变化的IT业务需求导致资产变更成为常态,每个月都有数百甚至数千服务器上下架;而传统的资产变更过程没有实现标准化、流程化,难以保证网管中的资产信息能够及时、准确地变更;随着时间的推移,资产信息逐渐失真,最终导致如有新设备上架,还需要派人到现场去寻找可用的位置。
3)资产管理粗放,人员职责不清晰,资产数据没有经过高效地分析与利用,易形成不明资产或闲置资产。
因此,在数据中心智能化、无人化的大趋势下,业界主流厂家纷纷推出智能的数据中心资产管理解决方案,提供完整的流程控制、资产识别、数据分析等功能,实现对数据中心资产进行有效管控。
目前数据中心资产管理的主要技术手段
智能的资产识别技术可大幅提高资产管理的效率与准确度。数据中心资产管理系统的核心是一个实时刷新、准确无误的资产信息库;而资产信息的采集、录入的准确性往往决定了一个资产管理系统的数据是否可用。随着数据中心的设备数据增加,资产变更信息的准确性显得更加重要。但是,传统的资产信息采集方式是通过定期的人工资产盘点来获取,人工差错不可避免,费时费力。针对这种情况,业界内的众多厂家也在尝试各种新的自动化信息采集技术,减少人工参与环节,减少差错率。目前,数据中心IT资产识别管理技术的应用情况:
1)人工扫码技术。
条码管理系统主要由设备上的条码标签、扫描终端、网管等部分组成。资产盘点时,运维人员手持条码扫描终端,扫描设备上的标签,由于需要人工操作、机柜上IT设备放置位置高低差异高达2米以上,不太适合人工操作、设备数量大、机房环境噪音大等特点,导致扫描盘点的方式效率较低,错误率高、机房内巨大的噪音对运维人员造成职业伤害,工作枯燥,人员流失率高、基础运维人员越来越难找等问题。
2)U位级资产自动识别技术。
资产管理的一大难点就在于确定IT设备所在的机柜U位;针对这一难题,业内的部分厂家利用物联网技术,推出了智能化的资产识别条。资产识别条可以安装在机柜的侧面,通过内置的RFID芯片进行近场通讯,可以自动识别IT机柜中的每个U位是否被占用,以及占用此空间的设备信息。这些资产位置信息通过资产识别条的通信接口集中上报给资产管理系统,从而完成信息的采集、录入等工作。通过资产U位的识别,可以精确发现连续可用的U位空间,用于指导刀片等服务器的上下架工作。
这种方案的优点在于数据准确性高,及时性好,如最新的MC-RFID技术可以做到数据100%准确,并在第一时间内发现资产变更信息,适合对资产精度要求较高的场合。
3)设备自动识别技术。
与服务器、存储等IT设备不同,大多数的UPS、空调等设备做不到被网管自动发现,还需要用户手工添加到网管中并纳入监控。如果这些设备增加电子标签等信息,主动向网管推送设备信息,则设备就可以在网管上实现自识别、自注册,自动刷新信息到资产管理系统,极大的简化了相关工作。目前,业界一些设备厂家已经开始提供并推广这一方案。
闭环的ITIL流程控制保证资产变更过程的可控、可管
在整个数据中心的生命周期内,不停地有新设备的添加、搬迁、上下电等资产变更事件。据不完全统计,腾讯数据中心的服务器每月启停4000多台,业务每月迁移2000多次,硬件每月变更500多次。频繁的资产信息变更,如果没有一个可闭环、可跟踪的资产变更控制机制,则资产信息将逐浙失真,最终变成不可用。先进的资产管理系统应该提供符合ITIL流程要求的资产变更功能,保证资产信息的可控、可管。
1)变更流程管理:
ITIL是国际通用的针对IT服务管理的一个客观、严谨、可量化的标准和规范,其中与资产管理相关性最大的是变更管理模块。变更管理通过明确地定义资产变更的范围、优先级、职责与角色、流程与审核点、衡量标准等,在最短的中断时间内完成变更过程,减少对业务的影响,并保证变更结果及时、准确地刷新到资产信息库中,过程可回溯可审计。大量的成功实践表明,符合ITIL标准要求的变更管理可以提高运维效率约25——30%。
2)数据智能核对:
在实际运维中,难免因为各种人为原因而引入有差错的资产信息数据;如果只依靠人工审核来发现这些潜在的问题,效率低下并且常常达不到预期效果。智能的资产管理系统可以借助大数据分析技术,通过与设备监控系统对接或借助资产识别技术,及时发现与生成设备的上下线记录;然后,通过与变更管理中的历史工单数据互相对比,智能识别两者之间的数据差异,生成问题单。通过资产信息的智能核对技术,可以大幅减少数据的差错率,提高数据中心的运维效率。而结合U位级的资产识别与管理技术,管理系统甚至可以做到数据100%准确。
利用资产信息,可以支撑数据中心高效运营
准确的资产数据是数据中心日常运维的基础之一,而有效利用资产信息,结合数据挖掘技术生成各种资产报表,可进一步满足实际业务需求。例如,资产数据可以应用到数据中心的机柜容量管理、租户管理上,实现数据中心资源的最大化利用,支撑数据中心的运维。
1)容量管理:
容量管理是DCIM系统的核心功能之一,目的是通过当前容量统计、分析与规划,实现数据中心的关键资源的高效利用,提高资源利用率;借助容量管理,数据中心运营方可以充分利用现有数据中心的容量资源,尽量延长数据中心的使用寿命,推迟下一个数据中心的建设计划,保护企业投资。而容量分析所需的基础数据,必然包括了准确、实时的资产信息。只有通过资产自发现、自识别技术,掌握各个IT设备的准确位置、运行状态等信息,建立IT设备与机柜等的对应关系表,才能实时计算出某一个机架的当前可用容量(空间、供电、制冷等);而基于各个机架的容量数据,管理系统通过数据分析与预测技术,生成容量规划与优化的建议策略。因此,U位级的精确的资产数据是支撑容量管理的必备功能之一。
2)租户管理:
针对数据中心的机架出租业务,智能数据中心管理系统可以为业主提供租户管理功能,为企业运营决策提供必备的数据报表。例如:管理系统可以通过统计不同租户的已有资产,形成租户的资产月度报表(包含用电量、空间占用、设备运维状态等);业主可以根据这些基础数据,分析维护每个租户的成本支出,计算ROI识别高价值客户,为企业营销提供决策支撑。而实现租户管理的一个关键环节就是整合资产管理的资产数据库与CRM系统的客户信息,形成统一、完整的IT资产与租户之间的对应关系表。
因此,高效利用资产信息,尤其是U位级的精准资产位置信息,通过大数据分析技术,可以有效地发现或解决数据中心的运营问题,提升整体的运营效率。
智能化资产管理技术的应用与发展
近年来,随着数据中心规模的膨胀、人力成本的快速上升,用户对智能化资产管理的重视度正在日益提升。智能化资产管理可实现高效、准确的资产采集、录入、跟踪、盘点、统计,大幅减少运维人力成本,提高了资产利用效率。如腾讯、阿里等互联网企业,纷纷将智能化资产管理作为下一代数据中心的技术标准之一。
腾讯IDC技术发展中心总监朱华在DCD上的演讲
业界的一些主流厂商,如施耐德、艾默生、华为等也纷纷推出了完善的资产管理解决方案。更多DCIM提供商则是将U位级的智能化资产管理功能做为标准功能之一,为用户提供完整的ITIL流程控制、精确的资产自识别技术,解决大型数据中心的资产管理难题。
我们相信,在数据中心无人化值守的大趋势下,随着更多的智能化技术的推出,精准可靠的U位级资产管理技术将在数据中心的运维中得到越来越多的应用。