小米公司正式成立于2010年4月,是一家专注于高端智能手机、互联网电视以及智能家居生态链建设的创新型科技企业。“让每个人都能享受科技的乐趣”是小米公司的愿景。小米公司应用了互联网开发模式开发产品的模式,用极客精神做产品,用互联网模式干掉中间环节,致力于让全球每个人,都能享用来自中国的优质科技产品。小米公司自创办以来,保持了令世界惊讶的增长速度,小米公司在2012年全年售出手机719万台,2013年售出手机1870万台,2014年售出手机6112万台。小米公司在互联网电视机顶盒、互联网智能电视,以及家用智能路由器和智能家居产品等领域也颠覆了传统市场。截至2014年年底,小米公司旗下生态链企业已达22家,其中紫米科技的小米移动电源、华米科技的小米手环、智米科技的小米空气净化器、加一联创的小米活塞耳机等产品均在短时间内迅速成为影响整个中国消费电子市场的明星产品。小米生态链建设将秉承开放、不排他、非独家的合作策略,和业界合作伙伴一起推动智能生态链建设。
瓶颈生于存储
随着小米生态圈的不断扩大,小米的业务种类和数量急剧增加,IT系统对前端业务的支持随着公司业务的增长而呈现出指数级型增长,给小米传统的采用VMware ESi 5.5虚拟机和SAN存储构成的三层IT架构带了巨大的挑战。尤其是在其IT系统基础架构中,由于人员和系统数量猛增,原有的后端存储系统已经不堪重负,从而使得整个IT系统的性能受到严重影响,尤其是其主要的企业级应用如Microsoft Exchange、MS SQL Server、SAP Business Suite的性能非常不理想,后端存储系统已经成为整个IT系统主要的性能瓶颈,同时随着设备数量增多,运维管理的复杂性也越来越大。
为了满足小米内部对于IT系统性能的需求,小米也不断地对自己的IT系统架构进行升级和调优,针对后端存储给整个IT系统带来的性能瓶颈,小米采用大量闪存替代原有的存储阵列,提高了后端存储系统的整体性能。然而,随着业务的快速增长,对后端存储系统性能的要求越来越高,SSD仍然很难跟得上业务的发展。同时IT系统的不断庞大,也对数据中心的空间、耗电产生了巨大的压力。
应对来自新架构
痛定思痛,小米决定采用全新的IT基础架构,彻底消除后端存储给整个IT系统带来的瓶颈,并为自己提供更多的技术选择,为此,小米对首先自己原有的IT系统进行了重新的整体审视。作为一家崇尚科技力量的公司,小米公司自然懂得科技对于小米的重要性,因此,小米公司对于新技术的应用是非常积极的,为了应对业务增长带来的挑战,小米很早就采用了虚拟化技术,但由于是采用的传统三层架构,虚拟化平台使用的是依然是共享存储,但共享存储在横向扩展能力方面的不足,使得整个虚拟化平台成为了单点,缺乏足够的灵活性和可扩展性,同时,共享存储在性能方面的短板严重制约了虚拟化平台的发展,为此,小米决定采用新的架构来解决整个IT系统的问题。这个时候,小米想到了当今炙手可热的超融合技术,经过对超融合技术的详细了解以及与传统三层架构的深入对比分析,小米认为超融合技术应该可以解决小米IT系统面临的问题,因此,小米决定采用超融合架构作为虚拟化平台的基础架构。
但由于运维人员数量有限,小米对供应商的服务能力提出了很高的要求,对产品的稳定性要求非常苛刻,对产品的冗余性配置、HA切换能力、数据安全性均提出了很高要求。因此小米选择了在超融合领域市场处于领先地位的Nutanix,经过对Nutanix超融合产品进行详细的比较、筛选,并通过近两个月的性能、功能、稳定性的测试,小米最终选择了Nutanix超融合架构来作为其虚拟化平台的新的基础架构。
收益源于超融合
在小米的这次的项目中,小米采用了Nutanix的企业云平台作为其虚拟化平台的新的基础架构,该系统主要用于部署小米的Microsoft Exchange、MS SQL Server数据库、SAP Business Suite以及基于IPV6的小米盒子和网络电视应用示范系统,小米盒子和网络电视应用都是基于互联网的系统,用户数和流量等均会有爆发性的增长,而Nutanix企业云平台的出色性能则能够从容应对这样的情况,同时Nutanix 企业云平台由于是集计算和存储为一体的超融合架构,从而也有效解决了后端存储系统的瓶颈问题,大大提升了数据库和关键业务应用等工作负载的性能。部署后的系统架构示意图如下图所示。
实际上,在传统的存储系统中,随着存储的增加,控制器通常会成为瓶颈。造成这个问题的主要原因之一在于:存储元数据存储在控制器上。传统系统可扩展至少量的控制器,因此当虚拟机数量增加时,每个控制器的I/O负载也会随之增加。Nutanix的分布式元数据服务,即Medusa,可将集群元数据在整个集群上进行分布,从而实现可扩展性;同时还可将数据复制到多个节点,以实现容错功能。该服务高度可用,并能够容忍多个模块故障。相对而言,传统解决方案依赖于少数存储控制器,无法容忍多个控制器故障。
而通过Nutanix 的Medusa,小米完美的解决了以前后端存储给整个IT系统带来的瓶颈,并为整个系统带来了灵活的横向扩展能力,得益于Nutanix的简易部署特性,IT支撑团队可以更加快速的部署系统,小米的IT系统可以快速投入生产,从而大大提高了系统上线的效率和可用性。与以前的后端存储相比,存储方面的性能提升超过了300%,吞吐量提升了200%以上。
同时,通过部署Nutanix系统,小米还显著地减少了数据中心空间场地和电力的投入。相对于以前,相对于以前,数据中心空间节省了70%,电力节省了30%以上。更为重要的是,Nutanix系统在管理上的简单和方便性,大大减轻IT管理人员的负担,IT管理人员的工作量比之前降低了50%,使得IT管理人员可以将更多的精力放在业务创新方面。
此外,在系统部署方面,部署传统三层架构时,需要同时兼顾网络、计算、存储三方面的配置问题和兼容性问题,而部署Nutanix超融合架构,则完全不需考虑这些问题,从而大大提升了系统的部署的效率,部署时间从传统三层架构时代的两星期缩短为现在的两个小时。
而实际上,小米一直是虚拟化平台的使用者,在虚拟化平台构建和运维中有丰富的经验和感受。Nutanix系统强大的性能,提高了小米对虚拟化平台的认识,增强了小米对Nutanix超融合系统的信心。
小米基础架构部门系统组组长吴家庆表示,在企业计划进入虚拟化或者私有云建设的过程中,Nutanix作为超融合系统的领导者,无论从技术角度,还是其他角度,都是企业用户最好的选择。而Nutanix出色的性能、简单的管理和快速的部署给他留下了深刻的印象,同时,奇点浩翰公司(S-Data)作为Nutanix专业服务提供商为小米Nutanix超融合系统后期运维服务提供的强有力的保障,专业的服务能力与及时的客户响应也受到了小米各部门的一致好评。