正昱 GA4241 GPU服务器
  正昱 GA4241 GPU服务器是人工智能推理而设计的全新一代旗舰型双路10 GPU的高性能AI训练/推理计算服务器。使用了新一代AMD Vega20 架构的Redeon Instinct MI60 GPU加速卡,并采用业界较快的Nvme系统盘,支持最高336TB存储容量。适合人工智能、大数据分析、视频分析、医学影像分析、高性能计算各个行业,其全新的、革命性的Skylake-SP架构的Xeon Scalable至强可扩展处理器,拥有全新引入的Mesh网格式架构和最快的Ultra Path Interconnect (UPI)高速点到点互连总线,能支持到28核心56线程、六通道2TB DDR4内存、和AMD Vega20架构专业GPU卡为AI复杂的模型训练、推理提供强大的动力,借助他无论深度学习训练还是高性能计算都能流畅运行。非常适合高校、科研院所、互联网、制造等行业应用。
 
     
 
    正昱 GA4241 GPU服务器采用专业级高速nvme SSD闪存做为系统盘,连续读写速度分别高达3500/2700MB/s,4KB 随机读取(QD32):高达500,000 IOPS ,4KB 随机写入(QD32):高达500,000 IOPS;几秒钟就可以启动系统,大大提高了系统和应用程序运行速度。由于系统缓存的速度提升,深度学习的模型训练、推理、视频分析的速度都将获得巨大提升,从而提高了工作效率。
 
  正昱 GA4241 GPU服务器是业界首批支持海量存储和海量GPU计算能力的服务器之一,拥有较高的性价比和较强的扩展能力,支持10个双插槽GPU卡如:NVIDIA Tesla T4 和Tesla P4,支持10块双槽的GPU加速卡如: AMD Instinct MI60/50/25,能提供惊人的深度学习计算能力,同时兼容MI高性能计算卡和Vega游戏卡为用户灵活选择提供了广阔的空间,支持24块SAS/SATA 3.5寸硬盘,在一台深度学习服务器上能提供最大336TB存储容量,对于图像识别和医学影像分析来说,这意味你在正昱 GA4241 GPU服务器中直接保存海量的高清晰的图片或者视频而不用单独采购高昂的存储设备,从而降低了采购成本。另外正昱 GA4241 GPU服务器拥有16个内存插槽,能支持2TB内存容量,如此强悍的配置无论模型训练、推理都能流畅运行,以前需要多台GPU服务器和专业高昂的存储能完成的工作,现在正昱 GA4241 GPU服务器一台就能实现。正昱 GA4241 GPU服务器支持Zen、vmware、KVM及Docker GPU虚拟化应用。强悍的配置为虚拟化应用提供了坚强基础,用户可以在正昱 GA4241 GPU服务器上创建多个虚机及容器,适合教育、科研、互联网等行业研发部门使用。也适合部署在公有云的环境中供用户使用。集中化部署即简化了管理也大大节省了费用。    
    如今人工智能已经渗入到生活的方方面面,如身份认证、视频分析、公共安全(人脸识别和步态识别)、语音识别、智能翻译、拍照购物、无人驾驶等。而人工智能依靠强劲的GPU提供强大的训练、推理能力。正昱 GA4241 GPU服务器提供了强劲的深度学习能力,除了支持NVIDIA GPU之外还支持AMD Radeon Instinct MI 系列GPU,AMD在2016年推出的Radeon开放计算平台(ROCm),其中包括对全新Radeon GPU硬件的软件支持,全新数学库和基础雄厚的现代编程语言,旨在加速高性能,高能效异构计算,深度学习系统开发。ROCm支持caffe、TensorFlow等主流的深度学习框架,让用户在深度学习GPU上了拥有多个选择。  
  Radeon Instinct MI60 计算卡为深度学习、高性能计算 (HPC)、云计算和渲染系统提供高水平的性能。 这款新型加速器采用优化的深度学习运算、出类拔萃的双精度性能1 和超高速度的 HBM2 显存,可提供 1 TB/s 的显存带宽速度。使用 AMD 的 Infinity Fabric Link 技术扩展您的数据中心服务器设计,能够在单个服务器中直接连接最多 2 组由 4 个 MI60 GPU 构成的 GPU 集群,速度是 PCIe® 3.02 的 6 倍。使用配备全芯片 ECC3 和 RAS 功能4的新型 Radeon Instinct MI60,可在大规模系统部署中快速获得可靠和准确的结果。将这种精细平衡和支持超级扩展的解决方案与ROCm 开放式生态系统(包括支持 TensorFlow、PyTorch 和 Caffe 2 等框架的、为 Radeon Instinct 优化的 MIOpen 库)相结合,您可以拥有一个胜任新一代计算和机器智能时代的解决方案。    
   

主要特性


 
  基于“Vega 7nm”技术,配备 64 个增强的计算单元(4096 流处理器) 高达 59 TOPS INT8 的处理推理工作负载的性能 高达 29.5 TFLOPS FP16 和 14.7 TFLOPS FP32 的处理训练工作负载的性能
高达 7.4 TFLOPS 双精度来实现高性能计算  
  32 GB 超快速 HBM2 ECC 内存,显存带宽高达 1 TB/s 全球率先支持 PCIe® Gen 4 x16 的 GPU5 AMD Infinity Fabric Link 技术 — 高达 200 GB/s 的 GPU 间通信速度
ROCm 开放式生态系统
 
   

针对深度学习进行优化

Radeon Instinct MI60 计算 GPU 配备了优化的深度学习运算,可以驱动人工智能 (AI) 和深度学习的最新工作流。 MI60 有 64 个计算单元(4,096 个流处理器)可进行出色的 29.5 TFLOPS 原生半精度 (FP16) 和 14.7 TFLOPS 单精度 (FP32) 峰值浮点性能,结合先进的高带宽缓存控制器 (HBCC) 和 32GB 的 HBM2 ECC3 显存,为客户带来增强的计算能力,以满足深度学习系统对高效处理大数据的苛刻要求,从而训练出复杂的神经网络。

 
 

 

     
 

全球领先的双精度 PCIe® 加速器1

面向高性能计算

Radeon Instinct MI60 加速器适用于高性能计算 (HPC) 工作负载,可提供全球领先的双精度性能1,使全球的科学家和研究人员能够更高效地进行生命科学、能源、金融、汽车和航空航天、学术、政府、国防等多个行业的 HPC 并行代码运算。 AMD 的新一代 HPC 解决方案旨在为每个节点提供更高的计算密度和性能,以及运行当今大规模并行数据密集型代码所需的效率,并为通用 HPC 的部署提供强大、灵活的解决方案。 ROCm 软件平台是一款可扩展的 HPC 级解决方案。该解决方案提供完全开源的 Linux 驱动程序、HCC 编译器、工具和库,使科学家和研究人员获得系统级控制。

   
 

 

     
   
 

ROCm:开源 GPU 计算平台新纪元

面向基于 GPU 的 HPC 和深度学习平台。

 

“Vega 7nm” 显卡技术

提高每瓦特的性能,优化的深度学习计算以及更多!