加入收藏 | 设为首页 | 会员中心 | 我要投稿 温州站长网 (https://www.0577zz.com/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 站长资讯 > 动态 > 正文

东数西算下算力发展的 数学题 及 算术题

发布时间:2022-10-18 10:00:13 所属栏目:动态 来源:未知
导读:   目前我国正在实施东数西算战略。在算力发展这个话题下,我谈一些对数据中心“数学”与“算术”的思考。这里的“数学”是指数据的科学,“算术&rdq
  目前我国正在实施东数西算战略。在算力发展这个话题下,我谈一些对数据中心“数学”与“算术”的思考。这里的“数学”是指数据的科学,“算术”指的是算力的技术。

  目前算力可以分为基础算力(基于CPU芯片)、智能算力(基于GPU和NPU芯片)和超算算力(基于高性能计算机)。基于GPU/NPU/FPGA等构建的AI智算中心,更适于训练数据、导出模型。训练出数学模型后,后续利用模型对输入数据来计算AI决策结果,这时并不需要太高计算算力。所以通常是用基于CPU的通用计算来做在已知数学模型下的计算任务,可以理解为智算中心的功能主要是算,数据中心的的主要任务是存。
 
  从数据角度,大部分数据可以分为热数据和冷数据。热数据主要是一些需要实时计算的数据,相比之下冷数据不需要实时性。国家的八大算力枢纽,实际上西部主要是定位在处理冷数据和本地的一些热数据;而东部主要是处理热数据。
 
  国际数据公司IDC提出,人类历史上90%的数据都是过去几年产生的,其中50%是短短过去两年产生的。最近产生的数据是热数据,但热数据经过一段时间之后,也会“降温”继而变成冷数据。一项统计认为,冷、温、热三类数据分别占累计数据量的80%、15%和5%,这意味着,冷数据是最多的、主要的。
 
  热数据要求实时计算,但冷数据的需求主要是存储,或者说,对冷数据来讲计算并不是常态,存储是常态。东西部的算力中心,就分别更适合于热数据和冷数据,从这个意义上来讲,东数西算可以说是“东数西存”——主要是存,当然也有计算。
 
  在计算架构上,主要有两种:存算分离、存内计算。
 
  存算分离架构在控制单元指令下从存储器读数据并交到CPU计算,得到的结果再送回存储器。如此往复的I/O通讯,对于热数据的计算来说效率不高。
 
  但存算分离有个优点,存储单元可以不仅服务于单个计算单元,可以同时服务多个服务器的计算,形成一个池化的存储,这样能够支持多云计算,实现较高利用率和低成本、低能耗。而这恰好适用于冷数据,例如可以用云平台建模,用边缘计算训练与仿真。
 
  不过,热数据需快速计算,受限于存算分离I/O瓶颈,且CPU能力受累于存储器访问速度难以发挥,更需要存内计算。存内技术以随机存取存储器(RAM)替代硬盘,在RAM内完成所有运算。现在还有一些阻变存储器和相变存储器等新型非易失性存储器,已经在实验室中取得了突破,但大规模推广目前成本还较高。还有介乎于存内计算和存算分离之间的模式,如近存计算。
 
  总体而言,存算分离适用于冷数据处理,存内计算适用于热数据。举个例子,自动驾驶的数据要在路边甚至在车内同时完成存与算。
 
  西部以处理冷数据为主,但也需要处理当地的热数据,冷热数据是否需要分别采用不同的存算架构?这也是值得研究的问题。

(编辑:温州站长网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!