功耗|既快又准并且低开销!一作亲解MICRO 2021最佳论文:一种自动化功耗模拟架构( 二 )

文章插图
运行管理中最常见问题在于peak power mitigation。最大功耗有一个阈值,如果超过了阈值,就需要进行管理,使功耗压降低,否则会出现一系列的问题。管理power的峰值通常要准确实时计算power。在CPU运行时,根据power的计算减少给定CPU的指令,随之功耗就会降低。
但现在在设计CPU时,很多情况下都是人工在芯片上找能够模拟功耗的信号,这种方式不仅困难而且非常不准确。
此外,更重要的一个问题是快速电流的变化(或者power的变化)会导致一个很快的电压降叫做voltage-droop。
文章插图
文章插图
文章插图
- 首先,它在设计和运行时,都能够对power进行既快又准地预测。在商业化的CPU上能够做到90%~95%的正确率,我们把它在Neoverse N1 CPU上进行实现,我们发现它面积的overhead只有0.2%。
- 其次,对于任何一个设计该模型都可以自动生成。
- 不仅如此,每个cycle都能得到一个准确的power,时间分辨率非常好。
- 而且我们认为APOLLO模型可以延展到更高层次的模拟。

文章插图
我们在Neoverse N1商业化的CPU上面,运行了一个workload。这个workload非常大,一共有1700万个时钟周期。我们对这1700万个时钟周期的每一个cycle都进行预测,上图展示的是4万个。在工业界用传统的方法可能需要两个星期的时间,而用我们的方法的,几分钟就可以做完。
准确率高、速度快的同时,对存储的要求减少了100倍以上,只需要存我们感兴趣的信号,这也是一个非常大的提升。保持这样的速度、准确度,得到每个周期的power这在之前的工作中几乎是做不到的。
- 高通骁龙|全球首款高通骁龙8+游戏手机曝光,功耗下降3成,ROG这回抢了首发
- CPU|感觉老黄在新40系显卡上挤牙膏了,功耗300-450W,这次能畅玩4K?
- sim卡|A770M跑分出炉,性能比RTX 3060高,功耗也更高
- Intel|16核仅35W功耗 Intel 12代酷睿T系列处理器上市
- 苹果|RTX 40系显卡曝光:性能怪兽功耗更魔幻
- 三星|功耗降低50% 性能提升35% 三星3nm工艺下周量产
- 高通骁龙|骁龙8+工程机实测,功耗显著下降,稳了!
- 小米科技|小米12超大杯稳了?雷军下军令状:不把骁龙8+性能功耗调好不发布
- 物联网|ESP32-C5超低功耗技术工艺,提升物联网设备性能,支持2.4&5GHz双频Wi-Fi 6
- Python|低功耗笔记本的超薄小搭档:CukTech超薄65W氮化镓充电器
