PCIe 5. 0 时代的存储革新
随着大模型训练、边缘计算与超大规模数据中心的快速发展,存储系统面临性能、效率以及可靠性的多重挑战。忆联PCIe 5. 0 企业级固态硬盘(ESSD)UH812a/UH832a比较新公布的卓越性能数据备受关注,其顺序写对比国际友商高69%,随机写对比国际友商高52%,而顺序读和随机读数据则位列友商1、。H3C UniServer G7 是新华三集团的全新系列计算服务器,广泛应用于虚拟化、AI计算、科学计算和数仓分析等计算场景。二者强强联合将会对存储系统的性能带来怎样的飞跃?
本文将基于SPECstorage Solution2020 比较新测试结果,深入剖析忆联PCIe 5.0 ESSD基于H3C UniServer G7 服务器的卓越性能,展示其在企业核心业务、数据中心混合负载及AI场景下的领先地位。
测试背景与环境
测试标准
由国际标准性能评估组织(Standard Performance Evaluation Corporation)推出的SPECstorage Solution 2020 是业界保障的面向存储系统性能的测试标准,模拟多种真实的企业级存储工作负载,用于全面、客观地评估存储系统在不同场景下的性能表现。通过该测试,企业用户得以准确衡量不同存储解决方案可提供的比较大可持续吞吐量,用于准确匹配存储系统与实际业务需求,避免性能瓶颈。
测试产品
本次测试采用了搭载忆联UH832a的H3C UniServer R3900 G7 以及H3C UniServer R3950 G7 服务器。
H3C UniServer R3900 G7 是基于英特尔新一代Birch Stream平台的2U单路服务器,应用于通用计算场景。H3C UniServer R3950 G7 是基于AMD EPYC 9005 系列处理器的企业级2U单路服务器,有效与经济性兼顾。忆联UH832a则凭借其先进的技术和卓越的品质,为服务器提供有效的数据存储支持。
测试关键结果
1. AI图像处理测试 并列榜首
该测试模拟AI TensorFlow图像处理工作载荷,涉及大量非结构化数据(例如图像、视频)的高并发读写。典型应用场景有人工智能训练/推理、计算机视觉任务等,需要高吞吐和高IOPS。
在本次测试中,搭载了UH832a的两款H3C服务器,处理AI作业的总体响应时间(ORT)分别为0. 35 毫秒与0. 24 毫秒,突破了搭载上一代PCIe 4.0 ESSD以及国内友商Gen5 SSD的H3C UniServer R4900G6 Ultra服务器的数据(同为0. 47 毫秒),指标分别提升34.29%和48.94%。
图1 AI图像处理测试结果比对(1)
其中,H3C UniServer R3950 G7 配置6.4TB UH832a,其对AI作业的总体响应时间与榜单上Super Micro Computer AS-1115CS-TNR服务器性能并列首先。该款服务器与H3C UniServer R3950 G7 采用同款AMD EPYC 5th 9355P 处理器,搭载三星 PM1743 3.84TB SSD。测试中,二款产品均实现了对 75 个AI作业的处理,吞吐量均达到7337 MB/s,总体响应时间均为0. 24 毫秒。
图2 AI图像处理测试结果比对(2)
该项测试结果表明,忆联PCIe 5.0 ESSD与H3C UniServer G7 服务器配合,可为AI工作载荷提供高性能算力与存力,响应速度快,整体性能位列行业领先梯队水平。
2. 电子设计自动化测试 标杆性能
该测试模拟EDA(Electronic Design Automation)应用程序的典型行为,程序包括用于设计半导体芯片的软件工具和工作流程。其工作载荷特点是高并发和计算密集型进程,极为考验存储性能。该测试中包含大量的小文件元数据操作和部分大文件顺序读写,典型应用为半导体设计、电子工程等需要低延迟元数据处理和高带宽存储的场景。
在本次测试中,搭载了UH832a的两款H3C服务器,处理EDA混合工作负载的总体响应时间分别为0. 04 毫秒与0. 03 毫秒,双双突破了搭载上一代PCIe 4.0 ESSD以及国内友商Gen5 SSD的H3C UniServer R4900G6 Ultra服务器的数据(0. 07 毫秒和0. 05 毫秒)。即,忆联UH832a对比上一代数据,总体响应时间指标比较大提升57.14%,该成绩同样追平Super Micro Computer AS-1115CS-TNR服务器性能。
图3 电子设计自动化测试结果比对
该项测试结果表明,忆联PCIe 5.0 ESSD UH832a与上代产品相比,在处理海量小文件为特征的混合工作负载时,有着极为出色的性能表现,并发处理能力强,能够同时处理多种类型的I/O操作,满足复杂的企业级应用需求,树立行业标杆。
3. 基因组管道测试 夺得桂冠
该测试对基因组工作流的整个处理管道进行建模,重视大规模数据集的快速分析和检索能力。该类工作常见于生物信息学、准确医疗等需要有效处理海量基因数据的场景。
在本次测试中,搭载UH832a的H3C UniServer R3900 G7 服务器,共完成 250 个基因组作业的处理,吞吐量高达21236 MB/s,总体响应时间为0. 07 毫秒。这一成绩突破了之前H3C UniServer R4900G6 Ultra服务器的数据(0. 10 毫秒),更进一步刷新了该榜单的记录。
图4 基因组管道测试结果比对
该项测试结果展示了忆联PCIe 5.0 ESSD在海量数据分析与处理场景下,可以表现出很高的性能以及超低时延,为实时数据处理提供强有力的支持。
4. 软件构建测试 再次突破
该测试模拟软件开发环境中的构建(build)操作,包含多种场景,例如Git代码仓库、CI/CD流水线(Jenkins)、编译构建(GCC、LLVM)等。此类工作负载具备元数据密集型的特点,通常涉及大量、频繁的文件读写操作。
在本次测试中,UH832a与H3C UniServer R3900 G7 服务器的组合,稳定输出2440 MB/s的吞吐量以及0. 02 毫秒的总体响应时间。搭载上一代产品的R4900G6 Ultra总体响应时间为0. 03 毫秒。可见,无论是PCIe 4. 0 还是PCIe 5.0 ESSD,在处理此类对随机小文件IOPS要求很高的工作载荷时,均展现出卓越的吞吐量和低延迟性能,PCIe 5.0 ESSD的低延迟性能表现更优。尤其在高并发访问场景下,忆联ESSD的稳定性和有效性得到了充分验证。
图5 软件构建测试结果比对
5. 视频数据采集测试 首发登顶
该测试模拟视频数据采集(Video Data Acquisition,VDA)和处理的存储负载,例如安防摄像头、科学实验数据采集、广电影视制作拍摄或实时流媒体处理等。这类场景要求存储系统能够处理高吞吐量、低延迟顺序写入,以及长时间稳定性能。
本次忆联与H3C服务器为初次提交该测试的成绩,搭载UH832a的两款H3C服务器,各处理 1000 条视频流,吞吐量数据接近(4605 MB/s及4608 MB/s),总体响应时间分别为1. 02 毫秒与0. 92 毫秒。其中,搭载UH832a的H3C UniServer R3950 G7 服务器成绩,再次追平Super Micro Computer AS-1115CS-TNR服务器性能,同列榜首。
图6 视频数据采集测试结果比对
该项测试结果展示了忆联UH832a对视频处理、实时数据采集等业务的强有力支持。基于千条数据流的处理表明存储系统在应对多路视频流时具备高吞吐能力,而较低的总体响应时间则确保数据写入的实时性,避免视频丢帧或延迟。
性能亮点:PCIe 5. 0 技术释放超凡效能
忆联UH812a/UH832a采用忆联高性能企业级控制器与比较新PCIe 5. 0 高速接口,具备超高带宽与超低时延。较上一代PCIe 4. 0 产品性能提升 2 倍以上,QD1 时延改善43%。其关键优势包括:
• 超高速带宽:对比PCIe 4. 0 带宽翻倍,支持单双端口、NVMe2. 0 协议,强劲IO能力满足AI训练和推理、实时分析等高吞吐场景需求,加速数据处理效率;
• 超低延迟:面向复杂模拟程序、海量数据集处理,产品平均读写时延均低至微秒级,4K随机读QD1 时延<55μs,为OLTP数据库、虚拟化等时延敏感类数据密集型业务提供牢固支撑;
• 全场景高适配:多样化容量、形态组合,支持1.6TB至15.36TB多种容量、兼容U. 2 与E3.S形态,灵活适配中心云/边缘云到超大规模数据中心混合业务的存储需求。
凭借PCIe 5. 0 性能优势,UH812a/UH832a可广泛应用各类主流智算场景,如:
• AI与大数据:构建大规模存储系统支撑千亿参数大模型训练,有效处理PB级数据;
• 云与边缘计算:为混合云提供低时延存储资源池,加速边缘节点的实时决策进程;
• 金融核心系统:保障高频交易与风险分析场景下的亚毫秒级响应,通过PCIe 5. 0 生态兼容性,进一步降低架构升级成本。
结语:以存储创新驱动智算进化
忆联PCIe 5.0 ESSD基于技术突破,在H3C通用计算服务器上展示了优异的性能,充分验证了在企业级存储领域的领先地位。通过SPEC的保障测试验证,忆联ESSD进一步展示了在高性能和高适配方面的卓越能力,重新定义了企业级存储的性能标杆。未来,忆联将继续致力于闪存技术创新,携手生态伙伴,为客户提供更优质的存储解决方案,助力企业轻松化解日益增长的数据存储挑战,充分释放智算时代的数据价值!