基于DWC_ether_qos的以太網驅動開發-LWIP的堆(內存池)未對齊導致問題的案例分享

發布時間:2023-09-09 08:38:33  |  來源:面包芯語  

一.前言

內存未對齊訪問問題這個已經是老生常談的問題了, 由于LWIP的堆管理中也用到了地址(指針)強制轉換所以也會遇到這個問題。對于老手比較容易發現,對于新手可能會比較疑惑。所以也單獨分享一個案例吧,權當一個小的check list的case。

二.問題

Lwipopts.h中MEM_ALIGNMENT可以配置堆對齊大小,有問題時是配置為1

#define MEM_ALIGNMENT 1U


(資料圖)

異常時打印寄存器如下,當然不同平臺異常時如何獲取上下文信息方式不一樣,不在本文討論范圍內,我這里是RISC-V環境。

看到打印的mepc是0x20006C88,異常原因是地址未對齊。

所以是在運行0x20006C88時進入了異常,當然這個地方不一定是原始問題所在點,異??赡苁桥芰撕芫貌懦霈F的。

所以先在這里打個斷點試試

可以看到是pbuf.c的代碼中,所以可以懷疑是內存池或者堆的問題。

我們運行發現斷點并不能觸發,之前就已經異常了,所以只能跟代碼逐漸縮小范圍確認問題的。一般采用的方式是,逐步斷點或者打印或者刪除代碼,逐步縮小范圍的方法。

可以借鑒一些二分的思想,加快定位。

這里還是從pbuf開始,先找到相關代碼上層函數處,斷點

b pbuf_init_alloced_pbuf

看到異常前是可以停下來的

看到此時p的值是0x28201406

查看如下匯編代碼可知

sw zero,0(a0)即對應代碼p->next = NULL;

sw是word操作指令,但是地址a0不是word對齊,所以會產生異常

再si單步確實進入異常

所以問題確認了。

因為堆是分配的一塊區域,每一塊區域的開始地址對齊值就是上面設置的對齊大小,分配區塊后作為其他模塊使用,比如pbuf使用,前面部分作為管理結構體

struct pbuf 操作,所以實際是將一個區塊地址強制轉為了結構體指針。

此時訪問結構體成員,編譯器是自動按照自然對齊生成匯編指令的,因為編譯器并不知道你的對齊要求,所以如果系統不支持對應的指令非對其訪問就有問題,但是有些系統對應的匯編指令的行為支持不對齊訪問那么就沒有問題。

當然出于可靠性設計,建議不要進行強制類型轉換,比如MISRA標準里的規范就是如此。

如果代碼要做到兼容性可靠性非常好就要注意這個問題,此時不能使用強制類型轉換,而是使用字節序手動拼接得到成員的值。

但是出于靈活性考慮,很多協議棧的設計都是直接使用強制類型轉換的,所以這時用戶就需要注意,比如這里我們可以配置#define MEM_ALIGNMENT 4U

來保證上述分配出來的地址p是4字節對齊的,所以按照偏移,其成員也是4字節對齊的,sw指令操作的就是4字節對齊的成員,就不會有問題。

三.總結

以上分享一個簡單的案例,目的是提醒下要注意類似問題,尤其有指針強制類型轉換的要注意對齊問題。問題不難,也不復雜,但是可以作為check list的case可以作為檢查項目。

關鍵詞:

 

最近更新