如今,数据已经成为我们新生态圈的中心。云计算与大数据技术的集成与融合,海量数据的汇集让人们可以发现新的规律,重新认识事物与事物间的关系,并预见未来,辅助人们进行决策。”
从大数据基础架构看,可以分成数据采集、数据分析、数据应用三个层面。作为国内数据采集市场上的领头羊,毋容置疑,恒扬数据切入大数据和互联网+产业有着得天独厚的优势。
在恒扬数据CTO王立伟看来,数据采集只是整个恒扬未来发展的起点,立足于大数据采集及分析,与产业链合作伙伴一起,共同构筑面向大数据和互联网+的完整产品和服务解决方案才是恒扬大数据战略的最终落脚点。 在采访中他表示:人工智能、机器学习、万物互联等技术的迅猛发展,将产生海量的数据,对这些数据的采集、分析、应用,将会产生巨大的价值。恒扬在大数据采集分流设备以及大数据加速、大数据安全审计等领域有多年的技术积淀和广泛的客户资源,将战略方向延伸至大数据分析及应用领域是非常自然的。
十倍能力提升:塑造独特竞争力
多年的技术投入所带来的自主研发能力,使得恒扬数据具备了从芯片处理设计、硬件系统、软件大数据分析平台、算法处理、数据应用的整体系统架构设计能力,也具备了芯片级、设备级、算法级、系统级、数据分析应用等分层整合能力,而这已成为恒扬数据的核心竞争力。
据王立伟介绍,恒扬数据的大数据解决方案可分三个层面,分别为基础架构服务层、平台服务层、软件/数据服务层。基础架构服务层可支持多种接入方式,支持移动、固网、专网等各类接口进行数据采集、分析和筛选;平台服务层支持高效的算法分析,包括机器学习、图像处理、加解密等高效算法,以及用户位置、行为、画像等基础特征分析;软件/数据服务层则提供丰富的位置业务、精准营销、定位追踪等众多应用。
在他看来,依托在数据采集产品上的技术积累,恒扬数据在基础架构服务层的竞争优势很容易被市场理解并认可。其实,恒扬数据在平台服务层和数据服务层同样具备很强的竞争实力。
“对于大部分用户而言,其所拥有的数据既是海量的也是异构的,要想充分挖掘出数据的价值,就必须通过异构计算来提升处理能力。”王立伟说,“前段时间,英特尔以167亿美元收购Altera,目的是整合CPU技术与FPGA技术,来满足异构计算时代的用户需求。”
恒扬数据正是看到了这个趋势和机会,发挥自身长处,把异构加速应用到大数据处理中,针对数据处理领域最消耗CPU资源的算法进行芯片化处理,并且封装为平台,与大数据分析应用平台有效整合,极大提升了大数据分析的性能。比如Hadoop新发布的3.0版本增加对纠删码(Erasure coding)技术的支持,结合异构计算可以提升近10倍的性能,而且存储容量减半。
据王立伟介绍,恒扬数据目前采用CPU+FPGA的方案架构。在他看来,这是目前业界最合理的技术选择,可以实现性能、功耗、可扩展性等特性之间的平衡。“我们在FPGA上拥有很强的技术实力,是IBM、Intel和XILINX亚太区的首选或唯一FPGA异构计算、应用加速平台的合作伙伴。”
不过,王立伟也指出,除了在CPU+FPGA的这种技术组合外,恒扬数据对于x86/GPU等技术也在积极关注,“应用场景是千变万化的,对于性能、功耗、成本的要求也不尽相同,但恒扬数据在系统架构方面的能力是毋庸置疑的,我们在深度学习、机器学习、神经网络等方面,都拥有深厚的技术积累。”
聚焦业务应用:加强产业链协作
王立伟说,借助恒扬10倍速大数据解决方案平台,恒扬进一步向上游数据分析应用领域拓展,并将目光聚焦于用户画像、精准营销以及大数据安全审计等方向。与此同时,恒扬还将对底层能力平台化、抽象化,构建可重构的硬件能力平台,方便第三方进行大数据能力调用。“我们可以将采集、计算、分析能力平台化,做成一体机或者是板卡,提供给第三方,这种方式也得到了政府、运营商、互联网等诸多用户的认可。”
以恒扬政府公共安全大数据解决方案为例,该方案以十倍速大数据平台为基础,可处理国家级别的各种网络的全量信息,为来自各种网络的信息提供统一的存储,统一的关联和分析,彻底解决了信息孤岛的挑战。同时,通过基于大数据的用户识别和用户画像技术,将系统分析和处理的对象从一个个的账号变成了现实生活中一个个活生生的人。系统可针对各个特定的目标人群实现区域告警,实时监听,也能够在各种通话中进行说话人识别,还能通过人的活动轨迹分析其他关系人,通过人的行为来进行预警管理,并精确定位每一个目标人群的具体位置。
众所周知,大数据的产业链非常长,很难有一个厂家可以通吃,产业链协作是必须的。在这个产业链中,恒扬数据的定位非常明确,那就是“完整能力+开放平台”:既能为用户提供高性能端到端的大数据整体解决方案,又能为合作伙伴进行不同层次平台的赋能,助力合作伙伴的成功。
独行快,众行远。“我们就是要在数据分析这个千亿市场中有所作为,我们对未来充满信心。”王立伟说。