Skip to content

Instantly share code, notes, and snippets.

@xishuixixia
Created April 14, 2015 11:50
Show Gist options
  • Save xishuixixia/299aefb64359bd7849cb to your computer and use it in GitHub Desktop.
Save xishuixixia/299aefb64359bd7849cb to your computer and use it in GitHub Desktop.

周明采访

标签(空格分隔): 未分类


InfoQ:阿里技术保障部是一个怎么样的部分?具体负责哪些方面的工作?

**周明:**阿里技术保障部的英文名是Alibaba Infrastructure Service,从英文单词的角度来诠释我们部门的工作可能更容易理解一些。实际上,阿里技术保障部负责从IDC到服务器、网络、操作系统以及基于业务的一些应用系统的运营保障,比如双十一,同时,阿里技术保障部还负责某些基础技术的研发。从服务对象来讲,我们之前服务整个阿里巴巴的几十个部门,根据需要对它们的基础架构提供支持。现在阿里巴巴有了阿里云的业务,我们就开始对阿里云提供底层的技术支撑。

我们团队的愿景是做技术驱动的商业基础设施服务商。【这块周总再补充下愿景的解释吧】。

关于和阿里云的关系,很多人都有问过,其实我们和阿里云是一起的,都属于云版块。但阿里云更像是一个对外的云业务单元,而我们在后面为阿里云提供基础架构支撑。

InfoQ:这是一个云计算的时代,据我所知,阿里很多的系统都已经放到了云上,云平台的稳定性直接决定着天猫、淘宝等多个重要系统的稳定性。您认为在云时代,云平台底层架构面临着哪些挑战?

**周明:**整个互联网的底层架构都面临着三方面的挑战:性能、扩展性和弹性扩容。云平台可以天然的解决这些问题。但就整个云平台来讲,它面临的底层架构挑战可能还不太一样,因为云平台需要把底层架构作为一种产品提供给用户,而产品就需要有较高的稳定性。从本质上来说,云产品都是架构在物理设备上的,而物理设备并不能百分之百的可靠。由于云平台依赖的物理设备是不可靠的,所以团队就需要通过技术方案来让呈现到客户面前的基础架构产品是可信赖的,我认为这是云平台中最大的挑战。

而在未来,能够提供云基础设施的厂商一定只有几家,多少家不确定,但肯定不会很多。那个时候,对于供应商来讲,可能只有几个大的买家;而对于用户来说,就只有几家云服务提供商。这几个云服务提供商的规模一定会非常大,所以他们首先会面临规模上的挑战。同样,规模大了之后,你就需要考虑如何提高效率,降低成本。要降低成本,你可能就需要接触一些专业领域,比供应链,思考如何和整个产业圈共同发展,共同受益。

InfoQ:阿里的很多系统已经放到云上了,那么云的稳定性也决定了业务的稳定性,您在这块有什么好的经验吗?

**周明:**对于云来说,稳定性只是一个方面。当应用系统非常庞大的时候,所使用的资源也会非常庞大,这个时候又会有新的问题,这么多的资源如何管理?应用系统之间如何共享资源,并弹性的使用这些资源?所以云平台除了高稳定性之外,还应该解决资源管理和弹性使用的问题,就像吃饭的桌子一样,可以重复使用。这对于阿里巴巴的业务来说,非常有效,比如我们要做一个活动,活动会使用一些资源,但是当活动结束之后,我们可以迅速回收资源,这可以提高资源利用率,并降低成本。【这块能补充尽量补充】

InfoQ:那我看到您是运维出身,现在大家都说在云计算时代里头最难的是运维,对云厂商来说,那么您认为云计算的运维有哪些挑战呢?

**周明:**云计算可以分为两个部分,一个是云,一个是计算。我们通常的云计算其实都是在讲云,重点是资源的弹性调度和使用。而计算是指平台背后的数据处理能力。现在大家谈云计算的时候,侧重点都是在云上。从某个维度上来看,云就是把运维能力产品化,然后通过服务的方式提供给用户。从用户角度来看,就是之前的那些运维工作通过云的方式完成了,比如数据库到RDS的转变。而云平台的工程师需要运维整个提供运维能力的产品,这其中包括各个不同的方面,比如性能优化、扩展等等。【后面的是我根据原话修改的,请您再补充下】

InfoQ:那你们内部的团队应该都是DevOps?

**周明:**怎么样的都有,我们有DevOps,也有专门的运维工程师,也有开发工程师,我们鼓励DevOps,但更看重团队协作。

InfoQ:那云时代,运维工程师面临哪些挑战了?应该如何转型?

**周明:**传统企业的运维工程师可能要面临一个转型的问题,因为原来做的那些工作可能以后就没了,全部交给了云平台处理。对于云平台的运维工程师,他也会面临一些挑战,之前可能仅仅是提供一些技术保障的,但是现在需要把这种保障能力作为一个产品来提供给用户。之前可能只是面对几十个同事,而现在你要面对的是百万级别的用户,运维工程师需要考虑如何把这个产品做好。

对于传统企业的开发工程师来讲,他也面临转型,因为公司可能就没有之前那么多运维工程师做支持了,开发工程师应该向具备DevOps的能力。

InfoQ:问您一个PaaS的问题,我看到国内的PaaS发展并不好,您怎么看这件事?

周明: PaaS的发展目前还处于初级阶段,我看到很多人还是习惯于在IaaS这一层,因为在一定程度上来说IaaS不会改变用户的使用习惯,这也是国内云服务商为什么卖云主机卖得这么好的一个原因。而PaaS要有发展,必须得用户能接受这种使用习惯。我很看好PaaS未来的发展,因为现在我看到IaaS上其实用户使用的资源并不多,资源 利用率也不高。我相信随着客户业务的发展,当他们的资源规模越来越大的时候,PaaS的需求就凸显出来了,那个时候用户一定更喜欢PaaS而非云服务器。

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment