Vulkan系列教程—VMA教程(四)—内存预算(Memory Budget)
  PnX1wBG0sNlo 2023年11月02日 91 0

前言

VMA(Vulkan Memory Allocator),是AMD提供的Vulkan内存分配管理器,那么Vulkan的内存分配为何要使用VMA这种内存分配器呢?原因就在于其显存的分配次数是有限的(比如4096次),那么我们就需要分配一整块显存,然后自己使用offset以及size来进行分割使用,这个过程冗长繁杂,而且容易出错,那么VMA就成为了我们管理Vulkan内存的首要选择。


当开发一款图形学为主的游戏或者程序的时候,必须避免分配内存的时候超出物理内存承受能力。当内存被过量分配的命令提交之后,不好的事情就会发生( 取决于GPU类型,图形驱动,以及操作系统)。
  • 程序可能不会出任何问题。
  • 程序可能会变慢,因为某些GPU的内存(VRAM)会被分配到CPU端的内存种(RAM),那么GPU想访问这块内存就得通过PCI总线。
  • 一个新的内存分配,可能会花费长达几秒钟,甚至可能冻结整个系统。
  • 新的内存分配可能会返回VK_ERROR_OUT_OF_DEVICE_MEMORY
  • 可能会引发GPU的崩溃(crash),称为TDR(Timeout Detection & Recovery),返回的错误是VK_ERROR_DEVICE_LOST

一、Querying for budget(检查内存预算)

为了获得当前系统内存使用情况以及可用的内存预算,使用 vmaGetHeapBudgets()这个VMA函数,返回一个 VmaBudget结构提,里面包含了一些数值变量(都是以bytes)为单位,描述了Vulkan的堆内存的情况。

先明确几个概念:

  • 堆内存(Heap Memory)属于操作系统管辖范围,然后各种程序都有可能再这一块堆内存上拿到显存。
  • 你自己的Vulkan程序的管辖范围,在这里面 ,有的内存分配是你自己管理,有的你可能会托付给VMA。
  • VMA内存范围,是在Vulkan之上来管理,是指一切通过Vma进行Allocate分配的内存。VMA会在堆内存上先分配各种Chunk,然后再每个Chunk上自己再分配Allocation给到我们使用者
//函数定义,这里传入的pBudgets是一个已经分配好的内存数组
VMA_CALL_PRE void VMA_CALL_POST vmaGetHeapBudgets(
VmaAllocator allocator,
VmaBudget* pBudgets)

//返回结果结构
typedef struct VmaBudget
{
/** 本堆内存当中,已经被VMA分配出去的内存数量(这里是Chunk分配的总数bytes,有的被allocation用了,有的还没被用
*/
VkDeviceSize blockBytes;

/** 对于本堆内存来说,已经被VMA分配到Allocation当中的内存有多少,那么
`blockBytes - allocationBytes`这个减法结果,就是当前剩余的没被Allocation用掉的内存池,当然,由于内存碎片的存在,也有可能代表了一些没法被使用且浪费的内存。
*/
VkDeviceSize allocationBytes;

/**
这个数值,必须通过开启 `VK_EXT_memory_budget`的Vulkan特性才能获取
对于整个程序而言(Vulkan)层面上,这块Vulkan的堆内存被使用了多少
这个数值往往会大于blockBytes,因为这块堆内存不只是VMA再使用,可能还会被
SwapChain,Pipeline,DescriptorSet,CommandBuffer或者其他不是从VMA当中分配的VkDeviceMemory使用!
*/
VkDeviceSize usage;

/**
这个数值,必须通过开启 `VK_EXT_memory_budget`的Vulkan特性才能获取
描述了这块堆内存给到你自己的Vulkan程序的可见大小,有可能比 `VkMemoryHeap::size[heapIndex]`要小,因为
其他应用程序可能也会占用这块内存。
`budget - usage` 这个减法值就代表了可以被使用的剩余内存量。超过这个数值再去分配就各种问题了。
*/
VkDeviceSize budget;
} VmaBudget;

注意

  • 这里传入的pBudgets是一个已经分配好的内存数组,里面元素的数量必须大于等于当前显卡的堆内存的数量。
  • allocationBytes这个值可能会大于blockBytes,因为存在内存换页,比如GPU想分配一个内存,结果不够用了,就把没用到的资源放到RAM,然后给新的腾地方,像这种也会被计算到allocationBytes当中。

请注意vmaGetHeapBudgets返回的数值信息不同于 vmaCalculateStats(). vmaGetHeapBudgets(),并且比他们更快。vmaGetHeapBudgets可以每一帧都调用甚至是每一次内存Allocation的分配之前都可以调用,vmaCalculateStats就用的比较少,只是为了得到静态信息,比如你要Debug。

我们应该使用VK_EXT_memory_budget 这个Device扩展去获得Vulkan的预算信息,VMA可以自动的应用这个扩展。当这个扩展没有被开启的时候,分配器的行为不会发生改变,但是当它估计当前的使用以及可用情况的时候,在精确度方面就出现了一些偏差。为了使用这个扩展:

  • 确保VK_EXT_memory_budget (Device扩展)以及VK_KHR_get_physical_device_properties2 (Instance扩展)已经被开启了。
  • 在创建VmaAllocator的时候,开启 VMA_ALLOCATOR_CREATE_EXT_MEMORY_BUDGET_BIT标识符。
  • 在每一帧都要调用vmaSetCurrentFrameIndex这个函数,传入当前帧号,这个函数可以每一帧都更新当前的Budget预算。这种更新,是从Vulkan内部获取一次数据,然后本帧的各种Allocation都会依赖于这个数据进行检查,你不需要每一次Allocation都调用Vulkan内部的东西了。

二、Controlling memory usage(控制内存使用)

如果你想限定所有的Allocation操作都能够在Budget预算范围内搞定(比如不能换页,比如不能VRAM转RAM),不超出边界,还是有一些方法的:

首先,当你要本次的分配,需要分配一块全新的内存Chunk的时候,VMA会努力在Budget预算范围内进行分配。如果超出了这个预算范围,可能会分配一个比原定数额小的内存Chunk。即便你是需要分配一个Dedicated(专用)内存,也会被压制在预算范围内,给出一个小的内存块。

第二,如果你要分配的内存大小加上当前已经使用的大小,超出了内存Budget,默认来讲,VMA会把这件事丢给Vulkan去执行,让Vulkan来决定失败还是成功。

你可以通过启用VMA_ALLOCATION_CREATE_WITHIN_BUDGET_BIT 这个Flags来避免丢给Vulkan决策,这个是VmaAllocationCreateInfo当中的Flags。

使用这个Flag后,当内存分配超出Budget就不会成功。当Lost Allocations这个VMA特性被启用的时候,如果超出边界就会做LOST换页行为(这个我们后面的章节会详细介绍,说白了就是不用的资源先换到RAM)。如果换页都不行了,那么就会丢出VK_ERROR_OUT_OF_DEVICE_MEMORY。这种机制一般都是用于系统不必须的资源上面,比如Texture贴图;当然这种不必须的资源,不能是创建关键资源的时候必须的资源。

最后,你也可以使用 VMA_ALLOCATION_CREATE_NEVER_ALLOCATE_BIT这个flag去保证本次分配必须在当前VMA已经创建的Chunk范围内。如果要分配新的Chunk池子, 那就会以VK_ERROR_OUT_OF_DEVICE_MEMORY的返回失败告终。这个主要是保证了分配速度,因为永远不需要深入Vulkan内部分配新的Chunk内存块了。

注意一点,如果使用了用户**自主内存池( Custom memory pools )**并且把 VmaPoolCreateInfo::minBlockCount设置为大于0的数值,那么就会在不检查Budget的情况下去分配内存Chunk块了。

总结

以上就是今天的内容,大家对于vulkan的学习,也可以参考我出品的vulkan系列教程,下面给大家贴出链接。


​Vulkan原理与实战—铸造渲染核武器—基石篇​

【版权声明】本文内容来自摩杜云社区用户原创、第三方投稿、转载,内容版权归原作者所有。本网站的目的在于传递更多信息,不拥有版权,亦不承担相应法律责任。如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@moduyun.com

  1. 分享:
最后一次编辑于 2023年11月08日 0

暂无评论

PnX1wBG0sNlo