加入收藏 | 设为首页 | 会员中心 | 我要投稿 温州站长网 (https://www.0577zz.com/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 云计算 > 正文

阿里云发布云数据中心专用处理器CIPU,构建新一代云计算架构体系

发布时间:2022-10-22 16:32:21 所属栏目:云计算 来源:互联网
导读: 钱江晚报·小时新闻记者 张云山
6月13日,阿里云智能总裁张建锋在峰会上正式发布CIPU(Cloud infrastructure Processing Units),这是为新型云数据中心设计的专用处理器,未来将替代CPU成

钱江晚报·小时新闻记者 张云山

6月13日,阿里云智能总裁张建锋在峰会上正式发布CIPU(Cloud infrastructure Processing Units),这是为新型云数据中心设计的专用处理器,未来将替代CPU成为云计算的管控和加速中心。

阿里云智能总裁张建锋发布CIPU

例如,CIPU与计算结合,快速接入不同类型资源的服务器,带来算力的“0”损耗,以及硬件级安全的加固隔离;CIPU与存储结合,对存算分离架构的块存储接入进行硬件加速,云盘存储IOPS最高可达300万,长尾时延降低50%;CIPU与网络结合,可对高带宽物理网络进行硬件加速,构建大规模弹性RDMA高性能网络,时延最低可达5us。

CIPU架构示意图

基于CIPU和飞天的新一代云计算架构体系,在通用计算、大数据、人工智能等核心场景的计算测试中展现了优越的性能。在通用分布式计算领域,Redis性能提升了68%、MySQL提升了60%,Nginx提升了30%;高吞吐类的互联网业务上云之后,比自建物理机的集群吞吐量提升了30%,业务高峰期延迟下降了90%;在大数据和AI等计算与数据双密集场景下,相比传统的TCP网络,弹性RDMA高性能网络的吞吐能力提升30%以上;云原生方面,容器启动速度快了350%,在Serverless 场景下6秒可拉起3000个弹性容器实例。

CIPU特性简介

为什么要有CIPU?张建锋认为,过去十多年,云计算技术经历了两个发展阶段:第一阶段是分布式和虚拟化技术替代了大型机,满足了当时企业所需的算力规模;第二阶段出现了资源池化技术,以阿里巴巴为例,通过计算存储分离架构,将计算、存储、网络资源分别池化,突破了规模和稳定性的瓶颈,提供了超大规模的云计算服务。

但随着数据密集型计算场景的普及,用户对低时延、高带宽的需求也越来越高,传统以CPU为中心的计算体系架构无法适应这一趋势。为了解决这一问题,阿里云相关研发团队早在2015年就开始技术攻关,并于2017年推出业内首款虚拟化损耗为零的神龙云服务器。经过多年自研迭代,神龙、弹性RDMA等核心技术不断深入垂直整合,演进出以CIPU为中心的全新架构形态,云计算开始进入第三阶段。

阿里云还不断夯实技术底座,建立了自研的芯片、服务器、飞天操作系统等软硬一体的基础设施。这些基础设施有力支撑了阿里云产品的四大核心:神龙计算、盘古存储、洛神网络和安全内核。在国际权威机构Gartner发布的年度报告里,阿里云获得计算、存储、网络、安全4项单项最高分以及IaaS整体基础设施能力的全球最高分。

云基础设施处理器CIPU(Cloud infrastructure Processing Units ),是阿里云为新型云数据中心设计的专用处理器,用于加速和管控计算资源,将替代CPU成为云时代IDC的处理核心。在这个全新体系架构下,CIPU向下对数据中心的计算、存储、网络资源快速云化并进行硬件加速,向上接入飞天云操作系统,管控阿里云全球上百万台服务器。

1、CIPU的三大特性:

● 网络:对高带宽物理网络进行硬件加速云计算 操作系统,通过建设大规模的eRDMA分布式高性能网络,实现RDMA技术的普惠化;

● 存储:对存算分离架构的块存储接入进行硬件加速,提供超高性能的云盘;

● 计算:快速接入不同类型资源的神龙计算平台,带来算力的“0”损耗,以及硬件级安全的加固隔离。

2、为什么要有CIPU?

过去十多年,云计算技术发展经历了两个阶段:

● 第一阶段是分布式技术,推动互联网企业从大机向分布式系统整个迁移;

● 第二阶段诞生了资源池化技术,通过计算存储分离的架构,对资源统一的调度编排,提高云计算的可靠性和可用性。

这两个阶段都是以CPU为中心的计算体系架构,解决了部分计算的需求。但云上客户的需求发生了巨大的变化,就像内燃机发明之后,人类对载具速度的想象力从马车时代进入了汽车时代。

随着数据密集型计算越来越多,传统以CPU为中心的计算体系架构无法适应这一趋势:

第一,以CPU为中心的架构导致了计算和网络传输的时延大;

第二,大数据应用增多,导致数据中心内部数据迁移量增多,以CPU为中心的架构无法提供高带宽;

第三,管理的基础设施规模越来越大,阿里云在全球27个国家和地区、84个可用区管理着超过上百万台服务器,基于CPU为中心的架构无法解决超大规模的复杂管理问题。

为了解决以上问题,需要对数据中心内部的云计算体系架构进行改革创新,从以CPU为中心的体系架构进入以飞天操作系统+CIPU为中心的体系架构。

3、CIPU带来哪些改变?

基于CIPU和飞天操作系统的新一代云计算架构体系,无论是在分布式应用还是人工智能的场景测试中,都展现了优越的性能。

存储方面,通过全硬件虚拟化和转发加速,存储时延最低可至30us(PLX),IOPS高达300万,存储带宽可达200 Gbps,全面超越市面上所有云产品,云端能提供比本地更安全可靠且高性能的存储能力。

网络方面,基础带宽从100G升级至200G,VPC的PPS转发性能从2000万提升至4000万,网络时延从22us降低至16us,RDMA协议下更可低至5.5us。应用上云之后,比自建物理机的集群吞吐量提升了30%,业务高峰期延迟下降了90%。

计算方面,单容器虚拟化消耗减少50%,虚拟化容器启动速度快350%。主流通用计算场景下,Nginx性能提升了89%,Redis性能提升了68%、MySQL提升了60%。大数据和AI 场景下,AI深度学习场景训练性能提升30%,Spark计算性能提升30%。同时,神龙计算平台可以提前预测80%的硬件故障,并进行无感热迁移规避,从而实现了业界领先的高可用SLA。

4、一图看懂阿里云CIPU

阿里云的软硬一体新型计算体系

过去13年,阿里云自主研发了飞天云操作系统,并构建出自研芯片、服务器、计算、存储、网络等软硬一体的新型计算体系架构。

飞天是中国唯一自研云操作系统,将遍布全球的上百万台服务器连接成一台超级计算机,单集群可达10万台规模,千亿级文件数,EB级别存储空间。2018年,飞天获得中国电子学会15年来第一个科技进步特等奖。

在2021年11月发布的Gartner IaaS + PaaS 综合解决方案记分卡中,阿里云被认为是所有被评估的全球供应商中得分第三高的解决方案,在计算、存储、网络、安全等核心能力中,阿里云也均获得最高分。

阿里云智能云架构总监 黄瑞瑞

本文为钱江晚报原创作品,未经许可,禁止转载、复制、摘编、改写及进行网络传播等一切作品版权使用行为,否则本报将循司法途径追究侵权人的法律责任。

(编辑:温州站长网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!