基本信息
所属科技项目名称:怀柔科学城成果落地
项目主管部门:北京市科学技术委员会、中关村科技园区管理委员会
科技成果信息
科技成果名称:基于自主X86处理器和DCU芯片面向人工智能服务器研制和应用
关键词:服务器,处理器,深度学习控制器,人工智能服务器,基础输入输出系统,基板管理控制
科技成果类型:原始创新
科技成果所处阶段:工业化生产
科技成果应用领域:信息传输、软件和信息技术服务业
科技成果简介:1、科技成果来源:研发基于国产处理器、加速计算芯片的人工智能服务器整机系统,针对功能模块集成、硬件软件融合、系统运行优化、智能化处理等方面的实际需求,性能达到或接近当前国际主流水平。本项目面向科学研究、医疗、交通、城市治理等行业拓展产品形态和应用服务,促进处理器研发企业掌握现代先进处理器的核心技术,实现芯片在人工智能领域的技术突破,促进国内信息产业的发展并为其提供保障,具备重要意义。
2、技术原理及关键性技术指标:研制人工智能服务器的硬件系统计算单元、深度学习加速单元、存储单元、网络单元、散热单元和电源单元,着力突破基于芯片的高密度模块化硬件设计、BIOS、BMC、低压大电流处理器电源调节、高功率密度系统散热等关键技术。新研发系统组件与相关技术之外,系统还使用工业标准组件如内存、硬盘、网卡、SSD、电源等器件。这些器件与处理器、加速计算芯片以及研发的主板、BIOS、BMC进行整合,完成系统信号、电源、散热的稳定性保障以及性能调优。
系统研发采用结构化模块式组合技术、高速信号链路拓扑重构技术、散热传感器信息融合技术、风扇模糊PID调速技术、处理器串行低压大电流电源动态调节技术、固件(BIOS,BMC)开发技术。主体系统为GPU仓3U+计算子模块2U;GPU计算子系统可更换GPU仓;首次采用高速信号全线缆连接方法,灵活调整PCIe信号的连接拓扑;存储子系统通过搭载标准SAS HBA、RAID卡对SATA/SAS硬盘和SSD设备进行控制。充分利用CPU具备较多连接的特性,由控制器IO输出多个SATA3.0端口;同时支持PCIe 3.0的U.2 SSD以及M.2 SSD。温度传感器信息融合实现所有的高功耗元器件和组件的温度监控与温度变化趋势预测,对所有风扇进行独立的模糊PID控制;通过空气流体力学仿真,优化设计风扇、导风罩、进风孔以及CPU与GPU的风流、风道,有效降低系统噪音与功耗。
3、应用前景:完成一款机型、三个配置的服务器系统及对应组件的研发工作,并形成可跨平台、跨机型复用的通用系统组件产品。在市场准入方面,该机型作为CPU搭配加速计算芯片的首批服务器,成功应用在互联网、教育、科研、政府等诸多行业,有效促进了CPU和GPU芯片的生态产业链建设,并为新冠疫情防控(主要为基因测序加速领域)提供了强有力的算力支持,取得了良好的经济效益和社会效益。
相关人物