RTOS系统全Thumb编译+Neon加速火力全开
  qUJOhJyC3pLU 2023年11月02日 47 0


Linux内核支持受限的NEON加速,并且不能使用硬浮点编译,这一点上RTOS系统更加灵活,它不但可以全系统使用NEON SIMD单元,而且还可以全系统thumb编译,在一些要求快启动的场合,非常有帮助。

Melis中的做法:

全系统SIMD加速:开启flag:

ARCH_VFPUSED := -mfpu=neon-vfpv4 -mtune=cortex-a7 -march=armv7ve -mcpu=cortex-a7 -mfloat-abi=hard
-mfpu=neon-vfpv4 enables the use of ARM VFPv4 instructions. If this option is not specified, VFPv3 is the default, armv7ve enables the use of ARMv7VE Virtualization Extensions instructions.

全系统 Thumb编译:

ARCH_VFPUSED += -mthumb

ARM Linux内核开启Thumb编译:

其实不止Melis,Linux 也支持内核Thumb编译,方法是通过打开CONFIG_THUMB2_KERNEL配置选项,本质上打开的是同样的选项。

RTOS系统全Thumb编译+Neon加速火力全开_linux

Linux关于ARM的实现有两个配置和THUMB支持有关,分别是CONFIG_ARM_THUMB和CONFIG_THUMB2_KERNEL.虽然相像,但是功能完全不同,CONFIG_ARM_THUMB是管用户态的,表示是否支持用户态thumb应用,在Kconfig对其解释非常清楚,如果不选中,当用户态进行THUMB切换时,将在信号处理流程中crash.

RTOS系统全Thumb编译+Neon加速火力全开_linux内核_02

此外,由于是针对用户态的配置,所以不会对编译内核产生任何影响,也就是不应该影响内核的Makefile构建系统,我们grep一下看是否CONFIG_ARM_THUMB是这样的,如下图,确实是没有影响到Makefile文件。

RTOS系统全Thumb编译+Neon加速火力全开_linux_03

看另一个CONFIG_THUMB2_KERNEL

RTOS系统全Thumb编译+Neon加速火力全开_linux内核_04

根据名字就可以看出,这个选项是管内核态的,也就是控制内核代码是否按照thumb指令编译的,同样,看注释解释的明明白白的:

RTOS系统全Thumb编译+Neon加速火力全开_linux_05

同样grep一下它的内核势力范围,不出意外,应该能在内核makefile中看到它的身影,可以看出,它的势力范围要广的多:

RTOS系统全Thumb编译+Neon加速火力全开_用户态_06

打开arch/arm/Makefile,果然看到它增加了thumb编译指令到FLAGS里面。

RTOS系统全Thumb编译+Neon加速火力全开_linux_07

除了上面两个,其实还有一个选项CONFIG_ARM_THUMBEE,它需要CPU支持 THUMBEE扩展才支持。

RTOS系统全Thumb编译+Neon加速火力全开_linux_08

 配置作用范围如下:

RTOS系统全Thumb编译+Neon加速火力全开_用户态_09

在系统初始化的时候注册了一个notifier,应该是在内核切换线程的时候由switch_to调用的。

RTOS系统全Thumb编译+Neon加速火力全开_linux_10

THUMBEE是一个支持高级语言JIT的特性,知道就好了。


结束!

【版权声明】本文内容来自摩杜云社区用户原创、第三方投稿、转载,内容版权归原作者所有。本网站的目的在于传递更多信息,不拥有版权,亦不承担相应法律责任。如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@moduyun.com

  1. 分享:
最后一次编辑于 2023年11月08日 0

暂无评论

推荐阅读
  I7LiCMSIjWYz   2023年11月02日   44   0   0 人工智能区块链
qUJOhJyC3pLU