近日,浪潮宣布为可重构AI计算发展计划参与者提供最新FPGA加速卡支持。参与该计划的高校将FPGA开源AI框架TF2应用于AI科研或应用并取得创新成果,并承诺将优化后代码反馈回TF2开源社区,即可获赠最新FPGA加速卡。同时,参与该计划的商业用户也可获得较大程度的FPGA加速卡购买优惠。该计划可在TF2开源社区进行申请。目前南开大学等知名高校已加入该计划。
FPGA技术具有可定制性、低延迟和高性能功耗比等优势,已成为诸多AI用户部署推理应用的选择。但FPGA技术进入到大规模AI业务部署仍旧存在软件编写门槛高、性能优化受限、功耗难以控制等诸多挑战。为了应对这些挑战,浪潮推出了开源的TF2框架。
TF2是全球首个完整方案的FPGA高效AI计算开源框架,可对模型进行压缩、裁剪、量化等优化转换以减少模型计算量,将模型文件自动转化为FPGA目标运行文件,降低FPGA的AI软件实现门槛,通过创新的DNN移位计算技术大幅提升FPGA做推理计算的性能,并有效降低其实际运行功耗,帮助用户快速实现FPGA线上推理。在浪潮F10A FPGA卡上采用FaceNet模型对TF2进行的测试(BatchSize=1)表明,运行TF2后单张图片的计算耗时为0.612ms,提速12.8倍。目前,TF2开源社区已吸引第四范式、快手、上海大学、华大智造、远鉴科技、睿视智觉、华展汇元等多家领先公司或机构加入。
为了推动TF2社区建设,浪潮推出了可重构AI计算发展计划,为参与者提供F10A、F37X等最新FPGA加速卡支持,鼓励参与者将创新性成果反馈至社区,共同促进FPGA技术的开源开放合作发展,降低高性能AI计算技术门槛,加速AI应用落地。浪潮F10A是目前业界支持OpenCL的最高性能密度的FPGA加速卡,每瓦特性能达到42GFlops,已实现大规模应用部署,适用于数据中心AI推理、边缘高密计算及桌面端应用加速等多种计算环境;浪潮F37X是全球首款集成HBM2的FPGA加速卡,可在75W典型功耗条件下,提供28.1TOPS INT8计算性能。此外,浪潮还将提供针对性的技术培训和服务支持,并定期举行开发者会议和线上公开课,分享最新技术进展和经验成果。
浪潮AI&HPC总经理刘军表示:“视觉、语音识别以及文本、语义理解等人工智能技术正在与各行业融合,以FPGA为代表的可重构计算将在各类线上推理场景中得到更广泛的应用。浪潮希望通过可重构AI计算发展计划促进TF2开源社区发展,同时增进开发者对最新FPGA计算加速技术的熟悉和了解,最大化释放FPGA的计算潜力,加速产业AI化进程。”
浪潮是人工智能计算的领导品牌,AI服务器中国市场份额保持50%以上。并与人工智能领先科技公司保持在系统与应用方面的深入紧密合作,帮助AI客户在语音、语义、图像、视频、搜索、网络等方面取得数量级的应用性能提升。(永文)
关键词: 浪潮