独家揭秘华数传媒云平台:广电行业样板间工程
扫描二维码
随时随地手机看文章
11月5日消息(桑菊) 她拥有全国最大的数字化节目内容媒体资源库,是全国最大的互动电视和3G手机电视内容提供商;她拥有IPTV运营牌照和3G手机电视全国集成运营牌照,并在杭州拥有超过200万数字电视用户;她同时还是国家发改委媒体云重大项目的全国唯一承建单位。
不错,她就是位于杭州的华数数字电视传媒集团,这家跨网络、跨媒体、跨应用的数字电视与新传媒运营企业在上个月刚刚登陆国内资本市场,掀起了广电行业省网整合的新一轮序幕。
但在这篇文章中,我们并不会讨论华数传媒在资本市场上的表现,也不会讨论广电行业的整合,而是从华数企业内部IT基础架构的细节入手,看看华数是如何应云而动随云而起。为此,在上个月,C114中国通信网编辑对华数传媒网络技术副总裁朱素平和运维总监姚军进行了专访。华数传媒网络是华数集团旗下专业从事数字电视网络运营与新传媒发展的运营企业,是华数系主力上市平台之一。
应云而动
在朱素平看来,华数传媒在云计算方面的探索和成绩,之前更多的是被业务推着走。“我们的业务分布非常广泛,而且不同的业务板块对于IT支撑能力的需求特性差别也很大。除了传统的广电行业业务外,华数还运营着有线和无线宽带接入服务,政府电子政务信息化平台支撑等。”
业务跨度大、伸缩性强的特征对华数传媒的IT基础架构能力提出了很大的挑战。“所以我们在2010年就开始进行云计算方面的尝试,希望能够通过对底层IT基础架构云化以及云管理系统搭建,提升IT使用效率,实现对业务的灵活快速响应,降低整体成本。”朱素平说。
据他介绍,华数传媒在云计算方面的拓展已经取得了不错进展,在基础设施、云平台和云应用三个层面都有着明确布局。“在基础设施上,我们成立了独立的数据中心公司,对所有平台进行运营支撑,并引入了外部资本,作为未来独立发展的一条脉络;在云平台上,初步形成了媒体云、转码云、游戏云和服务云四个平台;在应用层面,则包括视频、音乐、游戏、购物、支付、信息和阅读等九大应用。”
其中,转码云主要承载视频转码服务,“因为华数本身是非常大的内容生产和制作公司,每天大概会有15T-20T左右的节目量,会涉及到非常多的格式和码率,因为这些内容会面向非常多的平台和终端,不同的广电运营商互相之间都会有差异,所以对节目生产的要求会非常高。”
应用云则主要是华数的业务系统和WEB类应用等,“这是我们现在跟英特尔项目合作的重点,我们所有应用系统,包括Web类应用和业务系统全部都承载在应用云上。”而服务云则是基于云服务加瘦客户端的探索。“现在大家比较知道的概念是云游戏,比如美国的Onlive、Gaikai,通过把游戏本身的控制从客户端化变成一个视频流分发下去,客户端只做解码,这是我们在云游戏上的积极探索。”
服务云的应用前景可远不止云游戏本身。“广电行业大概有2000多万存量机顶盒上,我们希望把它变成一个瘦客户端,通过瘦客户端可以加载一些复杂的应用。比如以前可能由于终端能力所限能加载的服务非常有限。我们通过服务云的模式,我们能让它加载互联网上可以加载的所有应用,拓展增值业。”
据朱素平预计,国内至少有50%的现网机顶盒终端可以被改造成瘦客户端。“当然,运营企业肯定要对这种方案进行技术和成本评估,是进行云化改造合适还是直接更新机顶盒合适。”
但需要指出的是,华数并不是所有的业务应用都部署在IA架构上。“目前,包括计费系统等在内的核心BOSS系统还是部署在小型机上,现在的英特尔架构在计算能力和RAS特性上已经可以和传统小型机媲美,并在成本上有很大优势,但是由于原有的体系相对封闭,应用软件等都是部署在小型机上。”朱素平说。据他透露,华数在将来会逐步完成架构迁移。
随云而起
在云计算平台的搭建和后期运维上,华数传媒运维总监姚军的感受还是非常深刻。“这两年业务发展非常快,但我们的技术平台建设还是按照原来运营商的模式搭建的,IT平台能力很难跟上业务的需求。另外,在传统的建设模式下,IT平台普遍存在资源利用率低,资源调配困难。”
“我们最早还是用商用软件解决方案,就遇到了两个问题,一是商用软件在公司设备数量大量增加以后,整体成本比较高;二是对一些定制化的需求,商用软件实现起来比较慢,这并不符合用户的期望。”姚军说。“商用软件要么是根据物理CPU计费,要么是签署战略框架。我们评估了一下,像华数这样的设备数量,费用还是蛮高的。而如果采用开源策略,不存在License费用,投入的只是开发的费用。”
但完全开源的系统还是面临着未知的技术风险。“云现在很热,拿开源的东西随便搞两下也可以叫做云。当时我们也是想找一个商业公司合作,后来经过比较长时间的评估。一是觉得很多商业化的东西大同小异,没有太多的特点。另外,我们自己的行业和应用环境有一些特殊的地方,我们可能更需要英特尔更深层次的支持。因为从虚拟化往云计算方向演进,最终更需要的是跟硬件更紧密的结合,反而是那些纯云服务的软件供应商和平台供应商是做不了的。”
“我们今年跟英特尔一起合作做云平台项目,主要想达成这三方面的目标,一是着眼于开源化的管理软件,开源化就要达到云基础架构平台,在上面叠加个性化的需求,包括流程、资源的申请和审批过程,最后要跟华数上端的APP做一些结合,更好的服务于应用。”姚军说。
据姚军介绍,根据原定的时间表,双方在3月份完成整体设计,8月份完成基础平台的代码开发和设计,随后做一些华数的流程开发,审批流程和资源申请流程,定制化开发要到12月份。“我们跟英特尔那个平台现在已经上线,业务环境已经开始试用,规模已经到了50台的物理设备。今后的两个月还会根据现在的运营情况做优化,大规模部署到数据中心中去。”
从姚军对整体架构的介绍来看,最底层是基于英特尔的虚拟化硬件,中间是用KVM、Xen或者VMware ESXi技术做资源池,同时引入英特尔智能节点管理器(Node Manager),在监控软件上则主要是集成,Nagios、Ganglia等开源软件。最上层是一些整体的管理功能和云平台的高级功能,比如负载均衡、高可用、HA等。“我们也考虑这个平台能支持其它的云管理平台,现在目前主要支持Openstack的平台,下一步要做支持对VMware新出来的云管理平台的一些第三方支持。”[!--empirenews.page--]
流程变革
云计算平台的部署以及业务应用加载,给姚军所领导的运维部门带来了更大的挑战,也催生了一系列的变革。“传统运维下的设备基本上是按业务划分的,就拿流量来说,运维人员对流量要非常敏感,以前某个业务的流量基本上是可控的。但引入虚拟化技术以后,流量模型、系统资源占用模型都会被全部打散,运维中心会变得完全不可控。”
现在大部分虚拟化平台都具备自动迁移功能,更是降低了运维可控性。云平台部署以后,最大的挑战是重新抓住可控性。这是通过多方面的,一是加强监控手段,二是加强标准规范;对部分于应用迁移进行规划,使其在控制范围内。“以前设备分离,在保证总能力情况下,基本上不会有很大的问题,现在就不太一样了,运维人员对业务要更加敏感,这其实是今后整个运维当中最大的挑战。”姚军说。
但在朱素平看来,云计算的引入不但改变了运维部门,也彻底改变了企业的业务生产和IT基础架构的构建流程。“在传统的运营商或企业用户中,运维和建设原来是分离的,界定是比较清晰的。项目建设部门立项,把硬件买回来之后,完成之后上线,上线完之后交给运维部门做。这个流程在华数碰到的主要挑战在于,它不适应整体业务应用发展的快速变化。”
“你做了云平台之后,对于各个部门的角色变化是非常大的,意味着项目建设没有购买硬件的权利,系统运维部门需要第一时间关注建设项目的业务需求和能力,包括软件本身的调试对硬件基础设施的依赖。以前可能依赖项目组的外部团队,现在可能要依赖整体云平台运维。”
现在相当于软件平台建设部门只管软件,对于所有的基础网络、存储、操作系统等,我们会统一做好环境,软件平台只是在上面进行部署,接下来继续要做的工作,就是加强硬件对软件的“管控”能力。“我可能要求软件必须运行在我们的云平台环境里,简化本身平台的管理架构。”