1、DMA ZONE的大小只能是16M ?
这个答案在32位X86计算机的条件下是成立的,但是在其他的绝大多数情况下都不成立。
首先我们要理解DMA ZONE产生的历史原因是什么。DMA可以直接在内存和外设之间进行数据搬移,对于内存的存取来讲,它和CPU一样,是一个访问master,可以直接访问内存。
DMA ZONE产生的本质原因是:不一定所有的DMA都可以访问到所有的内存,这本质上是硬件的设计限制。牛B的DMA引擎是访问内存范围是没有限制的,就可以不用DMA ZONE的内存,可以不使用GPF_DMA标志。
在32位X86计算机的条件下,ISA实际只可以访问16MB以下的内存。那么ISA上面假设有个网卡,要DMA,超过16MB以上的内存,它根本就访问不到。所以Linux内核干脆简单一点,把16MB砍一刀,这一刀以下的内存单独管理。如果ISA的驱动要申请DMA buffer,你带一个GFP_DMA标记来表明你想从这个区域申请,我保证申请的内存你是可以访问的。
DMA ZONE的大小,以及DMA ZONE要不要存在,都取决于你实际的硬件是什么。比如我在CSR工作的时候,CSR的primaII芯片,尽管除SD MMC控制器以外的所有的DMA都可以访问整个4GB内存,但MMC控制器的DMA只能访问256MB,我们就把primaII对应Linux的DMA ZONE设为了256MB 。
这个在配置 你的DMA设备的时候要配置你DMA引擎可以访问到的内存,比如申请dma内存的接口 dma_alloc_coherent()申请的内存来自DMA ZONE 也不一定来自 DMA_ZONE ,而是根据你的定义DMA访问范围决定的。
static void *__dma_alloc(struct device *dev, size_t size, dma_addr_t *handle,
gfp_t gfp, pgprot_t prot, bool is_coherent, const void *caller)
{
u64 mask = get_coherent_dma_mask(dev);
…
if (mask < 0xffffffffULL)
gfp |= GFP_DMA;
…
}
对于primaII而言,绝大多少的外设的dma_coherent_mask都设置为0XffffffffULL(4GB内存全覆盖),但是SD那个则设置为256MB-1对应的数字。这样当primaII的SD驱动调用dma_alloc_coherent()的时候,GFP_DMA标记被设置,以指挥内核从DMA ZONE申请内存。但是,其他的外设,mask覆盖了整个4GB,调用dma_alloc_coherent()获得的内存就不需要一定是来自DMA ZONE。
2、DMA ZONE 只能做DMA 内存吗?
DMA ZONE的内存做什么都可以。DMA ZONE的作用是让有缺陷的DMA对应的外设驱动申请DMA buffer的时候从这个区域申请而已,但是它不是专有的。其他所有人的内存(包括应用程序和内核)也可以来自这个区域。
3、如何保证 DMA 和 cache的一致性?dma_alloc_coherent()申请的内存是非cache的吗?申请DMA内存有几种接口?
回答请参考 :dma 和 cache的一致性
4、dma_alloc_coherent()申请的内存一定是物理连续的吗?
绝大多数的SoC目前都支持和使用CMA技术,并且多数情况下,DMA coherent APIs以CMA区域为申请的后端,
这个时候,dma alloc coherent本质上用__alloc_from_contiguous()从CMA区域获取内存,申请出来的内存显然是物理连续的。
这一点,在设备树dts里面就可以轻松配置,要么配置一个自己特定的cma区域,要么从“linux,cma-default”指定的缺省的CMA池子里面取内存。
但是,针对有MMU的DMA引擎,dma_alloc_coherent 申请的物理地址是可以不连续的,MMU会将不连续的物理地址,转化为连续的虚拟地址给DMA使用。
另外,支持聚集散列的DMA引擎,物理地址也是可以不连续的,不过要采用流式映射的 dma_map_sg 来处理cache一致性的问题。
5、关于如何配置memory节点,如何配置CMA节点?
可以参考下面的官方文档:
https://buildmedia.readthedocs/media/pdf/devicetree-specification/latest/devicetree-specification.pdf
reserved-memory {
#address-cells = <1>;
#size-cells = <1>;
ranges;
/* global autoconfigured region for contiguous allocations */
linux,cma {
compatible = "shared-dma-pool";
reusable;
size = <0x4000000>;
alignment = <0x2000>;
linux,cma-default;
};
display_reserved: framebuffer@78000000 {
reg = <0x78000000 0x800000>;
};
multimedia_reserved: multimedia@77000000 {
compatible = "acme,multimedia-memory";
reg = <0x77000000 0x4000000>;
};
};
注意:这里重复 一下下面的区别。
#address-cells = <1>; # reg的地址需要一个 u32 位的数字表示
#size-cells = <0>; # 地址的长度 需要0个 u32 位的数字表示,就是不需要
cpus {
#address-cells = <1>;
#size-cells = <0>;
cpu@0 {
compatible = "arm,cortex-a9";
reg = <0>;
};
cpu@1 {
compatible = "arm,cortex-a9";
reg = <1>;
};
};
#address-cells = <1>; # reg的地址需要一个 u32 位的数字表示
#size-cells = <1>; # 地址的长度 需要1个 u32 位的数字表示
uart{
#address-cells = <1>;
#size-cells = <1>;
...
serial@101f0000 {
compatible = "arm,pl011";
reg = <0x101f0000 0x1000 >;
};
}
#address-cells = <2>; # reg的地址需要2个 u32 位的数字表示
#size-cells = <2>; # 地址的长度 需要2个 u32 位的数字表示
更多推荐
DMA内存大小、连续性、cache一致性、如何配置CMA的总结
发布评论