一个月开工三个超大云计算中心 百度欲将AI进行到底

时间: 2024-04-13 00:23:42 |   作者: jrs直播低调看直播

  如果用“百度地图”导航,目的地设为“百度阳泉云计算中心”,从北京出发,最短行程约390公里,驾车大约5个小时,就能到达百度位于(山西省)阳泉市的智能云数据中心,这是百度自建的第一个超大规模数据中心。

  此前几年,微软芝加哥数据中心以可容纳14万台服务器(实际应该不到)而被认为是全球装机容量最大的数据中心,但百度阳泉智能云数据中心仅一期就可承载16万台服务器,如果加上正在建设的二期数据中心,整个百度阳泉云计算中心可承载24万台服务器。

  11月21日,百度阳泉云计算中心项目二期工程开工,百度副总裁崔珊珊与阳泉市领导共同铲土奠基

  自百度几年前宣布其“ABC”(即AI、BigData和Cloud)战略以来,AI(人工智能)几乎成为百度的代名词。为了进一步延伸其在AI领域的优势地位,百度正在全国范围内“大兴土木”,阳泉数据中心是百度“ABC”战略基础设施的重要布局点,加上北京、保定、苏州、南京、广州、西安等地的数据中心陆续建成,这在某种程度上预示着百度将实现中国华北、华东、华南、西北等区域用户全面覆盖。

  与阳泉二期几乎同时开工的还有百度位于保定市徐水区大王店(10月27日开工)和保定市定兴县(10月29日开工)的两个云计算中心,分别占地150亩和135亩,直接基本的建设投资共计约40亿人民币,再加上阳泉二期的14亿人民币,百度在基础设施方面就一次性投入了50多亿人民币,让三个云计算中心并行施工建设,魄力之大,颇有破釜沉舟的气概。

  位于保定市徐水区大王店镇的百度徐水云计算中心(效果图),占地150亩,投资20亿人民币,总建筑面积11万平方米,承载12万台高性能AI服务器,将拥有超大型神经网络、超大规模高性能计算集群,支持万亿级搜索数据、百亿级定位数据、百亿级图像和视频数据

  位于保定市定兴县的百度定兴云计算中心(效果图),11万平方米的总建筑面积,承载12万台高性能AI服务器。但占地面积135亩,相比阳泉和徐水,建筑规划设计更加紧凑。建成后通过部署大带宽、低时延、无损网络,12 万台服务器将变身成为一个一键运行、智能控制、远程操控的超级计算机

  尽管百度在北京有数据中心布局,但考虑到北京的条件,几乎很难新建超大规模数据中心。但北京的业务是所有网络公司及云服务提供商都不能放弃的,在北京周边区域新建数据中心以支撑北京业务就成为必然选择,譬如同属河北的张家口市、保定市、廊坊市以及天津直辖市就成为可选之地。

  而保定市位于京津冀三角地带,与三地距离都不超过150公里(距离北京140公里、河北石家庄120公里,天津150公里),网络上的延迟几乎能忽略不计,又毗邻雄安新区,可谓地理条件优越。据了解,百度徐水云计算中心大多数都用在支撑自有业务,并对外提供AI服务。而定兴云计算中心则“承担百度在智能经济时代的算法、算力、大数据等很多方面重要的负载……通过大带宽、低时延、无损网络,12 万台服务器将变身成为一个一键运行、智能控制、远程操控的超级计算机。”

  并且对于百度而言,选择保定新建数据中心还有另外一个好处。保定与阳泉距离较近,两地的天气特征情况相似,差距并不明显。百度阳泉云计算中心的建设与运营经验可以复制到保定的两个云计算中心。

  百度位于阳泉的云计算中心总共占地356亩,其中一期总投资47亿元,总建筑面积12万平方米,8个高标准模组,满载可提供约6000个40A机柜,可承载超16万台服务器。二期总投资14亿元(其中不少于4亿为IT设备投资),总建筑面积8.6万平方米,预计可部署8万台高性能AI服务器。

  相比一期工程,二期工程的投资仅为一期的三分之一,服务器数量却只减少了一半,阳泉二期在一期经验的基础之上进行了优化设计。

  除了投资大幅度减少之外,数据中心的建设周期也大幅度缩短。阳泉一期从2011年9月选址到2018年9月整体交付,用时7年,虽然从开工到第一批交付用了多少时间,百度并没有透露。但据百度官方资料显示,阳泉二期采用模组标准化设计,特别是首个供电、制冷全分布式预制化的数据中心,通过优化建筑布局,提升IT装机能力40%以上,大幅度降低项目造价的同时,极大提升工程效率,预计将于明年(2020年)11月第一批交付使用,也就是说阳泉二期的建设周期差不多刚好一年,这符合互联网对速度的追求。

  除了建设周期极大缩短之外,在数据中心节能方面也有很大提升。百度阳泉云计算中心一期的设计年均PUE为1.2,但在去年的“数字中国万里行”活动中,我们参观百度阳泉云计算中心一期时,其年均PUE值就已经做到了1.1,在同年底,百度就宣布其阳泉云计算中心的PUE突破了1.1,年均PUE降到了1.09。这一方面是因阳泉一期中的服务器数量趋于饱和,IT设备所占用的能耗比例提高,其他支撑系统的能耗不变或者有小幅度提升,使得PUE这个比值减小。另一方面,节能等新技术在百度阳泉数据中心的落地并持续运营优化,让百度开始收获成功的“果实”。

  从设计年均PUE 1.2,降到实际运营后的年均PUE 1.09,百度阳泉云计算中心一期的运营经验促成了又一个百度产品的诞生——百度飞桨AI控制管理系统。正是因为这一套系统,以及一期的经验,使得百度有底气将二期的设计年均PUE为1.15。基于这套系统,能够使基础设施能耗降低70%,每个可用区每年节电超过1亿度,相当于5万户居民一年的用电量。并且,在阳泉二期中,百度首次采用新型冷板液冷技术,单机柜功率密度可提升200%,可实现全年100%自然冷却,节能率46%,提升数据中心热回收率至100%,建设速度提升20%。

  得益于可传承的运营经验,以及更新锐的节能技术,尽管阳泉二期设计的年均PUE为1.15,但我们始终相信随着二期交付并陆续上架服务器之后,其实际运营中的PUE将低于一期的PUE。而百度飞桨AI控制管理系统也是一个典型的投资AI、利用AI反哺数据中心的成功案例。

  除了阳泉二期之外,百度在保定的云计算中心在新技术应用方面也有独到之处,除了采用百度第四代领先的数据中心基础设施架构,还将大规模使用百度自研的DPC相变冷却系统,使得单机柜冷却能力提升至20KW,这次相变冷却系统首次在数据中心行业落地,同时其单机柜20KW的冷却能力在全世界内,也保持领先水平。

  AI俨然慢慢的变成了百度的代名词,在上述三个新建云计算中心都不约而同提到了“高性能AI服务器”。比如阳泉二期可承载8万台高性能AI服务器,位于保定的徐水数据中心和定兴数据中心建成后都能各自承载12万台高性能AI服务器。鉴于保定的地理位置,这两大云计算中心大多数都用在承载百度自有业务,比如搜索、百度大脑、百度智能云、Apollo、地图、小程序等业务,同时对外提供AI服务,即百度智能云业务。那么阳泉呢?

  除了宣布阳泉二期正式开工以外,百度还与阳泉政府、山西交控集团、中国移动通信集团山西有限公司多方签订车路协同示范区项目合作,进一步推进了新一代信息技术和城市现代化发展的深层次地融合。根据协议,通过山西阳泉无人驾驶与车路协同创新示范区建设项目,阳泉将协同百度等多方开展“无人驾驶+车路协同”示范应用,融合人工智能、V2X、5G、边缘计算等前沿技术,为无人驾驶技术验证、测试评价、运营服务提供有力支撑。

  百度公司、阳泉市人民政府、山西交控集团、中国移动通信集团山西有限公司就山西(阳泉)无人驾驶车路协同示范区项目合作签约

  自动驾驶汽车一直以来都是百度的标杆项目,也是外界着重关注的项目之一。但真正的无人驾驶如何落地,这又是众说纷纭的一大难题,尤其是中国城市交通普遍拥挤的情况下,无人驾驶有望改善交通,但这也代表着落地难度较大。这次百度与阳泉政府的合作,有望让无人驾驶汽车真正上路。

  在此之前,百度与阳泉已建立了扎实的合作基础。2017年7月,百度与阳泉煤业集团达成战略合作,百度领先的人工智能、大数据、云计算技术与阳煤集团的煤炭开采、煤化工生产、大宗物流管理能力全方位融合,共同推进煤炭行业的智能化生产、管理及技术、商业生态的完善;2018年12月,百度与阳泉市签署战略合作协议,百度大脑、无人驾驶、智能交通等前瞻技术能力更深入地融入阳泉,提升城市精细化管理上的水准。此次山西(阳泉)车路协同示范区项目的开展,是双方对智能交通合作的进一步落地。

  山西交控集团将提供多种路段供百度无人驾驶汽车试验,比如城市路段、高速路段等。同时中移动山西公司将在这些路段上与百度合作,部署5G基站、边缘计算等前沿技术。5G与边缘计算的应用,加上百度在AI及无人驾驶方面的深厚技术积淀,将大幅推动无人驾驶汽车走向成熟,那商用也就不远矣。