2021年9月29日 星期三

FujitsuA64FX处理器架构研究

时间:2023-06-20 08:23:04来源 : 面包芯语

FujitsuA64FX 处理器采 用 64 位 ARMv8.2A 指令集,同时支持以富士通为主导、与 ARM联合开发的可伸缩向量扩展SVE(Scalable Vector Extension)指令集,SVE支持3种128/256/512单指令多数据流 SIMD执 行 宽 度 的 自 动 向 量 化 处 理。FujitsuA64FX运算核心架构如图5所示,包含2 条 512位宽的向量 SIMD 流水线,共享 64KB 指令 L1I Cache和64KB数据 L1DCache,每条向量流水线集成8/16/32个双/单/半精度浮点乘加部件,并支持8/16/32/64 个 64/32/16/8 位 整 数 乘 加 操 作。为加速AI运算,FujitsuA64FX 处理器还支持16位和8位整数的点积运算。

FujitsuA64FX每拍可以发射 2 条向量浮点乘加指令,并行在2条 SIMD 流水线上执行,因此单个核心每拍执行双精度浮点运算数32个,最高工作频 率 为 2.2 GHz,单 核 心 峰 值 性 能 为 70.4GFlops,全片集成48个计算核心,单处理器双精度浮点峰值性能为3.3792TFlops。

综上所述,FujitsuA64FX 采用超标量多发射和SIMD 并行方式提升性能,同时 SVE(Scalable Vector Extension)指 令 支 持 128/256/512 位SIMD自动向量化处理,扩展应用适用性;支持半精度和16/8位整数运算,并支持低精度点积运算,以加速 AI处理。


(资料图)

算力铸就大模型:超算、智算及数据中心行业报告(2023)

《2023年高性能计算研讨合集(上)》

《2023年高性能计算研讨合集(下)》

《AI基础知识深度专题详解合集》

《AIGC行业深度报告系列合集》

AIGC行业深度报告(9):华为算力编年史

8、AIGC行业报告(8):谁是国产英伟达

7、AIGC行业报告(7):ChatGPT三大主线,AI算力需求井喷

6、AIGC行业报告(6):ChatGPT存算一体,算力的下一极5、AIGC行业报告(5):ChatGPT加速计算服务器时代到来

1、AIGC行业报告(1):ChatGPT开启AI新纪元(华西证券)2、AIGC行业报告(2):ChatGPT重新定义搜索入口3、AIGC行业报告(3):ChatGPT打响AI算力“军备战”4、AIGC行业报告(4):ChatGPT百度文心一言畅想

本号资料全部上传至知识星球,更多内容请登录智能计算芯知识(知识星球)星球下载全部资料。

免责申明:本号聚焦相关技术分享,内容观点不代表本号立场,可追溯内容均注明来源,发布文章若存在版权等问题,请留言联系删除,谢谢。

温馨提示:

请搜索“AI_Architect”或“扫码”关注公众号实时掌握深度技术分享,点击“阅读原文”获取更多原创技术干货。

关键词:

(责任编辑:黄俊飞)

推荐内容

Back to Top