STM32L4R9 的 QuadSPI Flash 通讯速率不理想

[复制链接]

STMCU小助手发布时间：2023-2-14 16:21

文章
文章封面:
文章简介:	STM32L4R9 的 QuadSPI Flash 通讯速率不理想

1. 引言 客户反应 STM32L4R9 同 QSPI Flash 通讯，测出来的读取速率为 10MB/s，和理论值相差较大。

2. 问题分析
按照客户的时钟配置和 STM32L4R9 的数据手册中的数据，OSPI 读数速率为 10MB/s 肯定存在问题。同时我们也可以在 AN4760 应用手册中看到如下说明：

J_E26%$$[6_`$UJTB0`FR]N.png

在客户系统中，IO0~IO3 的 4 线通讯模式下信号波形如下图，可以看出每经过 8 个CLK 周期就有很长一段时间的延时。如果提高 CPU 的主频，这个延时会缩短，但客户测到最短的延时也有 200ns，并且一直存在：

IR2~ST4W26[VL]]A9Z~HW`0.png

3. 问题解决

从客户测试波形上看，由于是 4 条数据线，因此 8 个 clock 正好是 4bytes，也就是32bits 数据。怀疑 STM32L4R9 QSPI 在 DMA 通讯中，读到一个 word（32bits）数据后需要在内部做一定的数据处理，造成时间延迟。
分析代码发现，DMA 设置的是 byte 传输模式，如下面代码：
#define BUFFERSIZE (COUNTOF(aTxBuffer) - 1)
hdma.Init.PeriphDataAlignment = DMA_PDATAALIGN_BYTE;
hdma.Init.MemDataAlignment = DMA_MDATAALIGN_BYTE;

STM32L4R9 是 Cortex-M4 内核，系统总线是 32bits 的，怀疑是在 32bit 总线上传输byte 数据会降低效率，造成延迟，于是修改代码如下：
示例代码在下面路径，需要使用附件中的 main.c 文件替换掉下面文件中的 main.c：
\STM32Cube_FW_L4_Vxx\Projects\32L4R9IDISCOVERY\Examples\OSPI\OSPI_NOR_ReadWrite_DMA\EWARM
另外程序中做如下改动：
#define BUFFERSIZE 1024 // (COUNTOF(aTxBuffer) - 1)
hdma.Init.PeriphDataAlignment = DMA_PDATAALIGN_WORD; hdma.Init.MemDataAlignment = DMA_PDATAALIGN_WORD; 配置时请留意 OSPIHandle.Init.FifoThreshold = 4;
//也需要 4 的倍数。修改代码后进行测试，代码读 4096bytes 的图像（1026 words），发现每个 word 数据中间的延迟已经没有了。之前速度提不上去的问题是 DMA byte 设置引起，因为STM32L4R9 是 32bits 系统，使用 8bits 传输会降低效率，需要改为 DMA 32bits 配置就OK 了。图形数据传输的总字节数也要设置为 4 的倍数，不足的需要补

)DU)7O7MH_JF}1GIKF8M8G4.png