基本信息
所属科技项目名称:基于国产智能芯片的大数据云平台及智能终端研究
项目主管部门:北京市科学技术委员会、中关村科技园区管理委员会
科技成果信息
科技成果名称:基于国产智能芯片的大数据云平台及智能终端
关键词:人工智能;大数据;云平台;智能终端
科技成果类型:集成创新
科技成果所处阶段:实验室研究
科技成果应用领域:信息传输、软件和信息技术服务业
科技成果简介:本课题完成了基于国产智能芯片的大数据智能云平台建设,突破了深度学习神经网络底层优化、面向智能终端的高能效深度学习加速等关键技术,提升了深度学习模型的预测效能,研发出基于高能效深度学习加速技术的智能物体分析系统,有效的降低了深度学习计算的计算复杂度和资源消耗,填补国内在这一方面的技术空白。
1、已完成人工智能编程工具链的研究,主要功能和性能指标如下:
(1)能够支持 TensorFlow、Caffe 等主流编程框架;
(2)可支持 AlexNet/VGG/ResNet/Faster-RCNN/YOLO/SSD 多种智能算法。
2、研发基于国产智能芯片的智能云平台构建技术:
(1)采用国产芯片构建公共云平台,该平台可实现 AI 模型从开发到应用数据接入、标注、模型开发、训练、部署、模型服务、监控、优化等步骤;
(2)提供最大 2PFLOPS 的半精度浮点计算(非稀疏)吞吐率,按单个中小型企业预估算力 20TFlops,可提供为 100 家人工智能应用公司服务的能力。
(3)完成多维大数据云服务平台的开发,支持图片、语音、视频数据的识别。
3、在太极计算机股份有限公司开展应用,应用于北京市经信局大数据平台数据支撑及治理库建设之关系图谱构建项目中,服务北京市经信局电子政务领域—北京市大数据平台数据支撑及治理库建设中。
4、适配智能终端的高效能深度学习模型研发:
(1)应用于 P40 显卡执行识别任务,经过高效能有效地模型(MIL V2.0)显存占用为709MB,平均识别时间为13.35ms,识别精度77.594%,ResNet101显存占用为1051MB,平均识别时间 19.94ms,识别精度 77.438%,MIL V2.0 相对 ResNet101,计算资源降低32.54%,在此情况下,识别精度无损失,平均识别时间缩短 33%;
(2)应用于 360 智能摄像头和 360 智能门铃等 IoT 终端设备上,实现了物体检测功能、物体分析功能、人体检测与姿态关键点定位功能,支持物体识别模型;
5、基于高效能深度学习网络的国产 AI 芯片软件开发:应用 MIL 网络在国产智能芯片中;MIL 网络相对于 ResNet50,理论加速比达到 20%以上(实际理论加速比为 52.18%),应用在国产智能芯片的识别精度误差不高于 10%(识别精度误差分别为 0.52%、0.66%)。
相关人物