0

0

.NET9 PreView6硬件内部生成和浮点SMID运算

看不見的法師

看不見的法師

发布时间:2025-04-25 15:48:28

|

756人浏览过

|

来源于php中文网

原创

.net9 preview6硬件内部生成和浮点smid运算

请注意,.NET9 PreView6并没有对AOT进行重大更新。在.NET9 PreView2中曾经对AOT进行了自举模式,参考:.NET9 AOT ILC的重大变化。

硬件内部生成的大多数硬件内部都有其相应的优化,而应用层级只需要传递相应的参数即可。比如一些硬件希望用户为硬件内部的API的某些参数传递常量,这些常量可以直接编码到硬件内部底层的指令中,不需要加载到寄存器或内存中,然后进行访问。如果没有提供常量,则会有相同逻辑但速度较慢的实现。

例如:

static byte Test1(){
    Vector128 v = Vector128.Zero;
    byte size = 1;
    v = Sse2.ShiftRightLogical128BitLane(v, size);
    return Sse41.Extract(v, 0);
}

v是Vector128初始化的128个0,Sse2.ShiftRightLogical128BitLane把v向右移动size位,返回结果。Sse41.Extract则是返回v里面的某个索引项。比如以下返回3:

Vector128 vector = Vector128.Create(1, 2, 3, 4);
int extractedValue = Sse41.Extract(vector, 2);

在调用Sse2.ShiftRightLogical128BitLane的时候,JIT可以用常量替代,JIT具备这种优化。但是在确定生成加速代码还是等逻辑慢实现的时候,如果JIT检测到参数变量而不是常量,于是很早就确定了不对其进行优化形式的调用。

BlessAI
BlessAI

Bless AI 提供五个独特的功能:每日问候、庆祝问候、祝福、祷告和名言的文本生成和图片生成。

下载

之前的代码:

; Method Program:Test1():ubyte (FullOpts)
G_M000_IG01:                ;; offset=0x0000
       sub      rsp, 72
G_M000_IG02:                ;; offset=0x0004
       vxorps   xmm0, xmm0, xmm0
       vmovaps  xmmword ptr [rsp+0x20], xmm0
       lea      rdx, [rsp+0x20]
       lea      rcx, [rsp+0x30]
       mov      r8d, 1
       call     [System.Runtime.Intrinsics.X86.Sse2:ShiftRightLogical128BitLane(System.Runtime.Intrinsics.Vector128`1[ubyte],ubyte):System.Runtime.Intrinsics.Vector128`1[ubyte]]
       vmovaps  xmm0, xmmword ptr [rsp+0x30]
       vpextrb  eax, xmm0, 0
G_M000_IG03:                ;; offset=0x0030
       add      rsp, 72
       ret
; Total bytes of code: 53

RyuJIT 现在可以识别更多像这个例子这样的情况,并用其常量值替换变量参数,从而生成加速代码,而不会过早地确定不优化。下面是上述示例的新代码生成所示:

; Method Program:Test1():ubyte (FullOpts)
G_M11031_IG01:  ;; offset=0x0000
G_M11031_IG02:  ;; offset=0x0000
       vxorps   xmm0, xmm0, xmm0
       vpsrldq  xmm0, xmm0, 1
       vpextrb  eax, xmm0, 0
G_M11031_IG03:  ;; offset=0x000F
       ret
; Total bytes of code: 16

用于浮点和 SIMD 运算的恒定折叠是 RyuJIT 中现有的优化,其中可以在编译时计算的表达式被替换为它们计算的常量,从而消除了运行时的计算。许多新功能的示例:

浮点二进制运算,其中一个操作数是一个常量:x + NaN现在折叠成 NaNx * 1.0现在折叠成 xx + -0现在折叠成 x。例如,硬件内部函数假设是:Vectorx + Vector.Zero现在折叠成 xx & Vector.Zero现在折叠成 Vector.Zerox & Vector.AllBitsSet现在折叠成 x。查看 dotnet/runtime #103206 和 dotnet/runtime #103143 进行更深入的了解。

相关专题

更多
java基础知识汇总
java基础知识汇总

java基础知识有Java的历史和特点、Java的开发环境、Java的基本数据类型、变量和常量、运算符和表达式、控制语句、数组和字符串等等知识点。想要知道更多关于java基础知识的朋友,请阅读本专题下面的的有关文章,欢迎大家来php中文网学习。

1463

2023.10.24

Java 桌面应用开发(JavaFX 实战)
Java 桌面应用开发(JavaFX 实战)

本专题系统讲解 Java 在桌面应用开发领域的实战应用,重点围绕 JavaFX 框架,涵盖界面布局、控件使用、事件处理、FXML、样式美化(CSS)、多线程与UI响应优化,以及桌面应用的打包与发布。通过完整示例项目,帮助学习者掌握 使用 Java 构建现代化、跨平台桌面应用程序的核心能力。

37

2026.01.14

php与html混编教程大全
php与html混编教程大全

本专题整合了php和html混编相关教程,阅读专题下面的文章了解更多详细内容。

19

2026.01.13

PHP 高性能
PHP 高性能

本专题整合了PHP高性能相关教程大全,阅读专题下面的文章了解更多详细内容。

37

2026.01.13

MySQL数据库报错常见问题及解决方法大全
MySQL数据库报错常见问题及解决方法大全

本专题整合了MySQL数据库报错常见问题及解决方法,阅读专题下面的文章了解更多详细内容。

19

2026.01.13

PHP 文件上传
PHP 文件上传

本专题整合了PHP实现文件上传相关教程,阅读专题下面的文章了解更多详细内容。

16

2026.01.13

PHP缓存策略教程大全
PHP缓存策略教程大全

本专题整合了PHP缓存相关教程,阅读专题下面的文章了解更多详细内容。

6

2026.01.13

jQuery 正则表达式相关教程
jQuery 正则表达式相关教程

本专题整合了jQuery正则表达式相关教程大全,阅读专题下面的文章了解更多详细内容。

3

2026.01.13

交互式图表和动态图表教程汇总
交互式图表和动态图表教程汇总

本专题整合了交互式图表和动态图表的相关内容,阅读专题下面的文章了解更多详细内容。

45

2026.01.13

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
Git 教程
Git 教程

共21课时 | 2.7万人学习

Django 教程
Django 教程

共28课时 | 3.1万人学习

React 教程
React 教程

共58课时 | 3.6万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号