娇小w搡bbbb搡bbb,《第一次の人妻》,中国成熟妇女毛茸茸,边啃奶头边躁狠狠躁视频免费观看

歷史上的今天

今天是:2025年03月05日(星期三)

正在發生

2021年03月05日 | 最小化ARM Cortex-M CPU功耗的方法

發布者:cyzcee 來源: eefocus關鍵字:Cortex-M  CPU功耗 手機看文章 掃描二維碼
隨時隨地手機看文章

1理解Thumb-2

首先,讓我們從一個看起來并不明顯的起點開始討論節能技術—指令集。所有Cortex-MCPU都使用Thumb-2指令集,它融合了32位ARM指令集和16位Thumb指令集,并且為原始性能和整體代碼大小提供了靈活的解決方案。在Cortex-M內核上一個典型的Thumb-2應用程序與完全采用ARM指令完成的相同功能應用程序相比,代碼大小減小到25%之內,而執行效率達到90%(當針對運行時間進行優化后)。


Thumb-2中包含了許多功能強大的指令,能夠有效減少基礎運算所需的時鐘周期數。減少時鐘周期數意味著現在你能夠以更少的CPU功耗完成手頭的工作。例如,假設要完成一個16位乘法運算(如圖1所示)。在一個8位8051內核的MCU上執行這個運算將需要48個時鐘周期,并占用48字節的Flash存儲空間。使用一個16位內核的MCU(例如C166)執行相同的運算需要8個時鐘周期,并占用8字節的Flash存儲空間。相比之下,在使用Thumb-2指令集的Cortex-M3內核中完成相同運算僅僅需要1個時鐘周期,并占用2字節的Flash存儲空間。Cortex-M3內核能夠通過使用更少時鐘周期完成相同任務,節省了能耗;同時也能夠通過占用極少的Flash存儲空間,減少Flash存儲器訪問次數,實現最終能耗節省的目標(除此之外,更小的應用代碼也使得系統可以選擇更小的Flash存儲器,進一步降低整體系統功耗)。


圖1 時鐘周期數對比


圖2ARM7和Cortex-M3的中斷響應


2中斷控制器節能技術

Cortex-M架構中的中斷控制器(Nested Vectored Interrupt Controller or NVIC)在降低CPU功耗方面也起著關鍵作用。以前的ARM7-TDMI需要“多達”42個時鐘周期,Cortex-M3 NVIC從中斷請求發生到執行中斷處理代碼僅需要12個時鐘周期的轉換時間,這顯然提高了CPU執行效率,降低了CPU時間浪費。除了更快進入中斷處理程序之外,NVIC也使得中斷之間切換更加高效。


在ARM7-TDMI內核實現中,需要先花費數個時鐘周期從中斷處理程序返回主程序,然后再進入到下一個中斷處理程序中,中斷服務程序之間的“入棧和出棧(push-and-pop)”操作就要消耗多達42個時鐘周期。而Cortex-M NVIC采用更有效的方法實現相同任務,被稱為“末尾連鎖(tail-chaining)”。這種方法使用僅需6個時鐘周期處理就能得到允許,進入下一個中斷服務程序的所需信息。采用末尾連鎖,不需要進行完整的入棧和出棧循環,這使得管理中斷過程所需的時鐘周期數減少65%(如圖2所示)。


3存儲器節能注意事項

存儲器接口和存儲器加速器能夠明顯影響CPU功耗。代碼中的分支和跳轉可能會對為CPU提供指令的流水線產生刷新影響,在這種情況下CPU需要延遲幾個時鐘周期以等待流水線重新完成填充。在Cortex-M3或Cortex-M4內核中,CPU配備了一條3級流水線。刷新整條流水線將導致CPU延遲3個時鐘周期,如果有Flash存儲器等待狀態發生,時間會更長,以便完成重新填充過程。這些延遲完全浪費功耗,沒有任何功用。為了幫助減少延遲,Cortex-M3和M4內核包括一個被稱為推測取指(Speculative Fetch)的功能,即它在流水線中對分支進行取指的同時也取指可能的分支目標。如果可能的分支目標命中,那么推測取指能夠把延遲降低到1個時鐘周期。雖然這個特性是有用的,但顯然不夠,許多Cortex-M產品供應商都增加了自己的IP以增強這個能力。


舉個例子,即使在廣受歡迎的ARMCortex-M類的MCU中指令緩沖的運行方法也有不同。采用簡單指令緩沖的MCU,例如來自Silicon Labs的EFM32產品,可以存儲128x32(512 bytes)的目前大多數當前執行指令(通過邏輯判斷請求的指令地址是否在緩沖中)。EFM32參考手冊指出典型應用在這個緩沖中將有超過70%的命中率,這意味著極少的Flash存取、更快的代碼執行速度和更低的整體功耗。相比之下,采用64x128位分支緩沖器的ARMMCU能夠存儲最初的幾條指令(取決于16位或32位指令混合,每個分支最多為8條指令,最少為4條指令)。因此,分支緩沖實現能夠在1個時鐘周期內為命中緩沖的任何分支或跳轉填充流水線,從而消除了任何CPU時鐘周期延遲或浪費。兩種緩沖技術與同類型沒有緩沖特性的CPU相比,都提供了相當大的性能改善和功耗減少。


4 M0+內核探究

對功耗敏感型應用來說每個nano-watt都很重要,Cortex-M0+內核是一個極好的選擇。M0+基于Von-Neumann架構(而Cortex-M3和Cortex-M4內核是Harvard結構),這意味著它具有更少的門電路數量實現更低的整體功耗,并且僅僅損失極小的性能(Cortex-M0+的0.93DMIPS/MHz對比Cortex-M3/M4的1.25DMIPS/MHz)。它也使用Thumb-2指令集的更小子集(如圖3所示)。幾乎所有的指令都有16位的操作碼(52x16位操作碼和7x32位操作碼;數據操作都是32位的),這使得它可以實現一些令人感興趣的功能選項以降低CPU功耗。


圖3 Cortex-M0+指令表


節能性功能選項首要措施就是減少Flash存儲訪問次數。一個主要的16位指令集意味著你可以交替時鐘周期訪問Flash存儲器(如圖4所示),并且可以在每一次Flash存儲訪問中為流水線獲取兩條指令。假設你在存儲器中有兩條指令并對齊成一個32位字;在指令沒有對齊的情況下,Cortex-M0+將禁止剩余的一半總線以節省每一點能耗。


圖4 基于Cortex-M0+的交替時鐘周期flash存儲訪問


此外,Cortex-M0+內核也可以通過減少到兩級流水線而降低功耗。在通常的流水線處理器中,下一條指令在CPU執行當前指令時被取出。如果程序產生分支,并且不能使用下一條取出的指令,那么被用于取指(分支影子緩沖器)的功耗就被浪費了。在兩級流水線中,這個分支影子緩沖器縮小了,因此能耗得以節省(雖然僅有少量),這也意味著在發生流水線刷新時,僅需要不到一個時鐘周期就能重新填充流水線(如圖5所示)。

圖5 流水線和分支影子緩沖


圖6 Cortex-M既有的低功耗模式


5利用GPIO端口節能

Cortex-M0+內核提供節能特性的另一個地方是它的高速GPIO端口。在Cortex-M3和Cortex-M4內核中,反轉一位或GPIO端口的過程是“讀-修改-寫”一個32位寄存器。雖然Cortex-M0+也可以使用這個方法,但是它有一個專用的32位寬I/O端口,可以采用單時鐘周期訪問GPIO,使得它能夠高效的反位/引腳反轉。注意:在Cortex-M0+上,這是一個可選的特性,并不是所有供應商都具備了這個有用的GPIO特性。


6 CPU的休眠模式

減少CPU功耗的最有效方法之一是關閉CPU自身。在Cortex-M架構中有多種不同的休眠模式,每一種都在功耗和再次執行代碼的啟動時間之間進行了折中考慮(如圖6所示)。它也能夠讓CPU在完成中斷服務后自動進入某個休眠模式,而不需要執行任何代碼去完成這個工作。這種方法可以為那些常見于超低功耗應用中的任務節省CPU時鐘周期。


在深度睡眠模式下,也可以使用喚醒中斷控制器(WIC)來減輕NVIC負擔。在使用WIC時,為實現低功耗模式下外部中斷喚醒CPU,無需為NVIC提供時鐘。


7自主型外設可減輕CPU負荷

自主型片上外設具有降低功耗的優點。大多數MCU供應商已經在本身產品架構中實現了外設之間的自主型交互,例如Silicon Labs的EFM32 MCU使用的外設反射系統(PRS)。自主型外設能夠實現十分復雜的外設動作鏈(觸發而不是資料傳輸),同時保持CPU處于休眠狀態。例如使用EFM32 MCU上的PRS功能,應用能夠被配置為在CPU休眠的低功耗模式下,當片上比較器檢測電壓值超過了其預設的門限值,則觸發一個定時器去開始減數。當定時器到達0時,觸發DAC去開始輸出—所有事件發生過程中CPU可以一直保持休眠狀態。


自動進行如此復雜的交互,這使得外設之間能夠完成大量工作而無需CPU參與。此外,帶有內建智能的外設(例如傳感器接口或脈沖計數器)能夠通過預設的條件用于中斷喚醒CPU,例如在累積10個脈沖時中斷喚醒CPU.在這個例子中,當CPU被特定中斷喚醒時,它明確知道需要做什么,而不需要檢查計數器或寄存器以判別發生了什么,因此可以節省相當多的時鐘周期,更好的完成其他重要任務。


我們已經介紹了多種易于實現的減輕Cortex-M設備上CPU功耗的方法。當然,還有其他因素影響功耗,例如用于加工設備的處理工藝或者用于存儲應用代碼的存儲器技術。工藝和存儲技術能夠顯著影響運行時功耗和低功耗模式下的漏電,因此也應當納入嵌入式開發人員的整體功耗設計考慮之中。


關鍵字:Cortex-M  CPU功耗 引用地址:最小化ARM Cortex-M CPU功耗的方法

上一篇:基于MC9328MXl的Socket通信設計與實現
下一篇:ST推出低功耗高安全的STM32U5

推薦閱讀

  一、LCD顯示漢字的經典做法    現在越來越多的智能產品具有漢字顯示功能。    如何高效、快速地完成漢字顯示的編程呢?經典的做法是將16x16完整的漢字點陣庫,(270k),全部裝入閃存或EPROM中,單片機根據要顯示的漢字的內碼,計算出漢字點陣的地址,再讀取32個點陣字節,按照LCD顯示的特性,重新排列點陣的次序后送顯示。這種方法成本高、使用...
據外媒報道,2018年假日購物季是電子商務史上最大的購物季,在線銷售額接近1260億美元。但隨著電子商務的不斷擴大,對倉庫工人的需求正以高于勞動力供應的速度增長,并對自動化產生了更大的需求。考慮到亞馬遜在電子商務中的主導地位和龐大的業務規模,該公司成為最早以機器人技術補充人力資源的公司之一,這一點兒也不足為奇。自2012年收購Kiva以來,日益...
(文章來源:舊叔舊聞) 對于目前已經動輒售價達到幾千元的早教機器人產品來說,要理解其商業邏輯其實很簡單。首先,作為早教行業的下游落地產品,我們需要關注一下早教領域的實際發展情況。遺憾的是,多年來國內早教市場亂象叢生的情況仍然未見改善。線下早教機構魚龍混雜、線上早教市場剛開始爆發、早教內容體系構建水平與標準不一、早教課程價格體系...
一、Cortex-M3支持最大4GB的存儲空間,其地址映射關系如下圖二、存儲器映射實例:256KB Flash 48KB SRAMIROM1為片上程序存儲器,即片上集成的Flash存儲器,對該處理器Flash大小為256KB,即0x40000IRAM1為片上數據存儲器,即片上集成的SRAM存儲器,對該處理器Flash大小為48KB,即0xC000片上SRAM的起始地址是0x20000000,這是由Cortex-M3內核決定的,從0x...

史海拾趣

問答坊 | AI 解惑

關于凌陽公司贊助問題

本帖最后由 paulhyde 于 2014-9-15 09:30 編輯 請問各路大俠們,今年國賽凌陽還贊助嗎?  …

查看全部問答∨

Win CE6.0定制出現錯誤1033,1041

最近我在eBox4300上定制了幾次WIN CE6.0 操作系統,總是出現錯誤,錯誤如下: 錯誤        1        Catalog Id "StringTable:MS:Cepc:1041" duplicated in files "D:\\WINCE600\\platform\\CEPC\\ ...…

查看全部問答∨

wince下string、vector、pair等的使用方法

在wince下如何使用string、vector、pair 現在我使用string的時候已經沒有什么問題了,添加了編譯選項/GX之后,警告也沒有了 但是現在使用vector會出現很多警告 使用pair還會出現錯誤 大家幫忙解決一下,謝謝…

查看全部問答∨

另類烤雞蛋方法!標題要有吸引力,其實是altera CIII starter板的問題

首先要說的是這塊板非常漂亮,由于外部接口比較少,而之前對FPGA(ALTERA和XILINX)這塊用得比較熟悉,沒有拿到板之后沒有做什么實驗!最近用來調試示波器V2.0,發現板子上主FPGA芯片非常燙(沒有上擴展板,關于這個問題之前發過帖子),但是JTAG能 ...…

查看全部問答∨

dBm等的概念辨析

1、dBmdBm是一個考征功率絕對值的值,計算公式為:10lgP(功率值/1mw)。[例1] 如果發射功率P為1mw,折算為dBm后為0dBm。[例2] 對于40W的功率,按dBm單位進行折算后的值應為:10lg(40W/1mw)=10lg(40000)=10lg4+10lg10+10lg1000=46dBm。2、dBi 和 ...…

查看全部問答∨

出現 Segment CSTART must be defined ,怎么處理?

出錯信息如下: Fatal Error[e72]: Segment CSTART must be defined in a segment definition option (-Z, -b or -P) 該怎么處理呢?是新版的帶WorkSpace的IAR編譯環境。…

查看全部問答∨

高頻RFID射頻電路原理

高頻RFID頻率是13.56MHz的,以最常用的RC500為例,射頻輸出兩個腳TX1,TX2,接收一個腳RX,另外一個是RX的偏置電壓VMID,讓RX信號偏置到1/2電源電壓位置,保證接收性能最好。 電路如下:   TX1和TX2輸出13.56MHz的方波,分別通過L200、C2 ...…

查看全部問答∨

基于DDS芯片和FPGA實現的任意波形發生卡

基于DDS芯片和FPGA實現的任意波形發生卡…

查看全部問答∨

M4如何通過3601在Kell4.22下仿真

最近拿到TI M4開發板,發現只能在CCS下使用,不知道用Keil的話 還是否需要裝什么東西?…

查看全部問答∨

收到EZ430-RF2500套件,show一下

今天收到了拍的EZ430-RF2500套件,這次快遞給力,很快。謝謝EEWORLD,套件比我想象的要小,包裝很好,這里來幾張開箱照和官方資料。這個跳線要插上…

查看全部問答∨
小廣播
設計資源 培訓 開發板 精華推薦

最新單片機文章
何立民專欄 單片機及嵌入式寶典

北京航空航天大學教授,20余年來致力于單片機與嵌入式系統推廣工作。

 
EEWorld訂閱號

 
EEWorld服務號

 
汽車開發圈

 
機器人開發圈

電子工程世界版權所有 京ICP證060456號 京ICP備10001474號-1 電信業務審批[2006]字第258號函 京公網安備 11010802033920號 Copyright ? 2005-2025 EEWORLD.com.cn, Inc. All rights reserved
主站蜘蛛池模板: 巫山县| 香港 | 宾阳县| 石渠县| 陇西县| 上虞市| 长岛县| 河南省| 阿鲁科尔沁旗| 平度市| 石阡县| 肇源县| 泾阳县| 邓州市| 台东市| 临江市| 鲁山县| 桂阳县| 中西区| 铁岭市| 乳山市| 海丰县| 高陵县| 内丘县| 伊金霍洛旗| 丰顺县| 伊通| 丹阳市| 南康市| 淅川县| 嘉定区| 连云港市| 从化市| 罗定市| 旅游| 连南| 景泰县| 密云县| 玛纳斯县| 开远市| 桓仁|