原来汇编中的循环是这么玩儿的

汇编系列其实也在一直更新,只不过更新的频率会挺慢的。。。由于白天一直忙于工作,空闲时间还要看书、学习各种技术栈,早上也要抽时间早期健身,晚上回家还要陪家人 + 学习,时间安排的满满当当,所以我就慢慢写,各位读者也别太着急,我其实真想再分一个自己出来。

之前的文章中介绍过 [0] 表示的是内存单元,它一般存储在 ds 寄存器中,偏移地址为 0 。比如下面的指令

就是将一个内存单元的内容送入 ax,这个内存单元的长度为 2 个字节,正好存放一个字型数据,偏移地址为 0 ,段地址在 ds 中。这种寻址方式相当于是直接寻址。

比如下面代码

就是将一个内存单元的地址送入 al 中,这个内存单元的长度是 1 字节,存放字节型数据,偏移地址位 0 ,段地址在 ds 中。

所以要描述一个完整的一个内存单元,应该需要两种信息:即内存单元的地址和内存单元的长度

比如我们要读取一个 10000H 的数据,你可能会需要下面这段代码。

上面这三条指令就把 10000H 读取到了 al 中。

但是表示内存地址的方式不只有直接指定其内存地址,还可以用一种间接寻址的方式,比如 [bx],它表示的是一种寄存器间接寻址,也是一种偏移地址,同样的,比如我们要读取一个 10000H 的数据,使用 [bx] 这种方式的代码如下(假设 ds = 1000H)

这样计算机就会寻找段地址为 1000H,偏移地址为 0001H 的数据放入到 ax 中。

它的中文解释就是 把 [bx] 指向的地址中的内容,送入 ax 寄存器中

比如下面这段代码

它表示的就是将偏移地址为 bx 的数据,送入到 ax 中,送入的内存单元地址是 2 个字节,存放字型数据。

又比如下面这段代码

它表示的就是将偏移地址为 bx 的数据,送入到 al 中,送入的内存单元地址是 1 个字节,存放字节型数据。

[bx] 这种间接寻址的好处就是每次偏移地址不是固定的,这为我们接下来的循环指令奠定了基础。

为了更方便的描述后面,我们后面使用 () 来表示一个寄存器或者内存单元中的内容。

这里需要注意一下,() 内的表示的元素一般有三种类型:

寄存器名,比如 (ax) 就表示 ax 中的内容,(al) 就表示 al 中的内容。段寄存器名,比如 (ds) 就表示段寄存器 ds 中的内容。内存单元的物理地址,比如 ((ds) * 16 + (bx)),一个 20 位的数据。

我们知道,寄存器存储的数据类型有两种,字型和字节型,字型数据一般用 ax 这类寄存器来存储,字节型数据一般用 ah 、al 这种寄存器来存储。

同样的,() 内的数据类型也有两种,字型和字节型。比如 (al)、(bl)、(cl) 这种表示的数据就是字节型,而 (ax)、(bx)、(cx) 表示的数据就是字型。

在了解完上述的这些知识点后,我们就可以来正式看一下 [bx] 了。

再来啰嗦一下 [bx] 的寻址方式,比如下面代码

bx 中存放的数据作为一个偏移地址,这里用 EA 表示(没有其他意思,只是单纯地表示偏移地址),段地址在 ds 中,用 SA 表示(同 EA 的解释),将 SA:EA 处的数据送入 ax 中,即 (ax) = ((ds) * 16 + (bx))。

可以将内存单元送入寄存器中,也可以将寄存器的数据送入到内存单元中,如下代码所示

就是将 ax 中的数据送入到 SA:EA 处,即 ((ds) * 16 + (bx)) = (ax)。

为了让大家加深对 [bx] 的认识,我们通过一些汇编指令来认识一下程序的执行过程,代码如下

下面我们就按照每一行指令来分析一下

首先,mov ax,2000H 就是将 2000 送入 ax 中,mov ds,ax 就是将设置段地址为 2000 H,mov bx,1000H 就是将 1000 送入 bx 中,mov ax,[bx] 就是将 2000:1000 处的地址送入到 ax 中(因为段基址为 2000,偏移地址 dx 为 1000),2000H:1000H 处的指令是 00be,所以 ax = 00BEH ,存储字型数据,示意图如下

inc bx 就是将寄存器 bx 的值加 1,此处有两条 inc 指令,所以执行完成后 bx = 1002H,此处段基址:偏移地址为 2000H:1002H。

然后下面 (第七行指令)mov [bx],ax 就是将 ax 中的数据送入到 [bx] 中,也就是 1002H 处,指令执行后,2000:1002 单元的内容为 BE,2000:1003 单元的内容为 00,存放字型数据,执行完成后的示意图如下

继续执行第 8、9 行的指令,inc bx ,执行完成后 bx = 1004H,然后执行第 10 行指令 mov [bx],ax ,指令执行前: ds = 2000H,bx = 1004H,mov [bx],ax 相当于是把 ax 中的数据送到 2000:1004 处,指令执行完成后,2000:1004 的单元内容为 BE,2000:1005 的单元内容为 00 ,如下示意图所示

接下来执行第 11 行指令,inc bx,执行完成后 bx = 1005H,mov [bx],al 是把 al 中的数据送入内存 2000:1005 处,指令执行完成后,2000:1005 处的单元内容为 BE,如下示意图所示

继续执行指令,第13、14 行指令和 11 、12 行指令一样,它的意思就是将 bx 的值加一之后,将 al 的值送入到指定地址处,执行完成后的 ds = 2000H,bx = 1006H,所以 2000:1006 处的内容是 BE(al 存储的数据),示意图如下

想必大家跟完上面的流程后,应该对 [bx] 这个间接寻址方式有了比较深刻的认识。

下面想个问题,使用汇编编程计算 2 * 2 ,并将结果存储在 ax 寄存器中。

这个思路还是比较简单的,直接将 2 放在 ax 寄存器中,然后执行 ax 的 add 操作就可以了,下面是汇编代码

上面这段代码中的计算量还比较低,但是如果要让你计算 2 * 2 * 2 * 2 * 2 * 2 * 2 * 2 * 2 呢,你难道要写 n 个 add ax,ax 吗?

这就很繁琐啊,所以不能这么玩,那该怎么搞呢?这里就需要一种能够循环之星 add ax,ax 的指令了,这个指令就是 Loop。

Loop 指令能够循环判断是否执行指定的指令,它的执行流程就相当于我们 Java 中的 for 循环。

我们先来使用 Loop 改写一下上面 n 个 2 相乘的代码,然后再讲解一下 Loop 的使用。

可以看到,我们使用 8 个 2 相乘的代码被优化的这么简单,这就是 loop 指令的精髓所在。

其实关键代码就是三条指令,即

  • mov cx,8
  • s: add ax,ax
  • loop s

翻译过来的意思就是将 8 放在 cx 中,然后给 add ax,ax 处设置一个标号,然后执行 s 循环。

loop 指令的格式是:loop 标号,CPU 执行 loop 指令的时候,要进行两步操作,第一步:(cx) = (cx) – 1,第二步:判断 cx 的值,不为 0 则转至标号(上面代码是 s)处继续执行指令,如果为 0 则向下执行(上面代码中乡下继续执行就是 mov ax,4c00h)。上面代码中,我们把 8 送入了 cx 中,也就是说,cx 中存储的就是执行次数。

下面我们详细介绍一下上面这段程序的执行过程,从中体会一下 cx 和 loop s 是如何配合实现循环的。

(1) 执行 cx,8 ,设置 cx = 8

(2) 执行 add ax,ax(第 1 次)

(3) 执行 loop s 将 cx 的值 – 1,此时 (cx) = 7,(cx) != 0 ,所以转至 s 处

(4) 执行 add ax,ax(第 2 次)

(5) 执行 loop s 将 cx 的值 – 1,此时 (cx) = 6,(cx) != 0 ,所以转至 s 处

(6) 执行 add ax,ax(第 3 次)

(7) 执行 loop s 将 cx 的值 – 1,此时 (cx) = 5,(cx) != 0 ,所以转至 s 处

(8) 执行 add ax,ax(第 4 次)

(9) 执行 loop s 将 cx 的值 – 1,此时 (cx) = 4,(cx) != 0 ,所以转至 s 处

(10) 执行 add ax,ax(第 5 次)

(11) 执行 loop s 将 cx 的值 – 1,此时 (cx) = 3,(cx) != 0 ,所以转至 s 处

(12) 执行 add ax,ax(第 6 次)

(13) 执行 loop s 将 cx 的值 – 1,此时 (cx) = 2,(cx) != 0 ,所以转至 s 处

(14) 执行 add ax,ax(第 7 次)

(15) 执行 loop s 将 cx 的值 – 1,此时 (cx) = 1,(cx) != 0 ,所以转至 s 处

(16) 执行 add ax,ax(第 8 次)

(15) 执行 loop s 将 cx 的值 – 1,此时 (cx) = 0,(cx) == 0 ,所以转至 s 处

(16) 执行 mov ax,4c00h(循环结束)

从上面这个过程中,我们可以总结处用 cx 和 loop 指令相配合实现循环功能的 3 点注意事项:

  • 在 cx 中存放循环次数。
  • loop 指令中的标号所标识的地址要在前面
  • 要循环执行的程序段,要写在标号和 loop 指令的中间。

所以综上所述,使用 Loop 和 cx 相配合实现的循环功能的结构如下:

比如我们想用 Loop 循环计算出 123 * 456 这个值,就可以使用这种方式

如果文章对你有帮助,小伙伴们三连走起呀!

汇编语言的五大技巧

(此文来自乐字节)

编程是门艺术,大多数开发者实际工作中只是开发App,正常来说是不会接触到汇编的,主要有两大原因,一来编译语言不容易学习,二来,日常生活中比较少用到。

汇编语言是最古老的编程语言,在所有的语言中,它与原生机器语言最为接近。它能直接访问计算机硬件,要求用户了解计算机架构和操作系统。学习汇编最大的用处就是可以帮助我们更好地理解高级语言,因此还是很有必要的,

本文使用RISC-V 为例来向大家展示,来如何使用编写语言设计程序逻辑,并最终将程序逻辑转换为汇编语言的程序。

用合适的语言设计逻辑

这是最难的一步,许多学生想直接编写完整的功能模块的软件包。但是,如果你不喜欢汇编,那么这是一种注定要失败的方法,相反,为了把逻辑从语言中分离出来,我们必须用我们能理解的语言来写。

如果一个学生不懂C语言或一些低级语言,那么我建议他们用伪代码来写。太高级的语言编译困难,而太低级的语言又会讲逻辑设计困难,所以,推荐使用C/C++或其他类似的语言。

在翻译时,有些编辑器可以把它们并排放在一起,这是很有帮助的。因为在大脑中保留一份指令列表是很困难的,特别是当你在编译一个复杂的程序时。

一步一个脚印

许多学生试图从头到尾编写整个程序,而中间没有测试任何内容。如果是初学者,我建议用增量式编程,关键是在完成一部分逻辑时进行测试。这可以像完成一个for循环就进行测试。

测试的一种方法是将C/C++程序与汇编程序连接在一起,你可以通过在C++中创建函数程序集的原型并在两者之间切换来实现这一点。你需要确保两者是不同的,否则链接会出错,按照一般的做法通常会在C函数前面加上一个“c”来区分。我们可以调用Show来运行汇编语言编写的函数:

extern \”C\” { // Turn off name mangling void show(int *x); }

extern \” C \”将告诉c++函数遵循C的\”调用约定\”。我们真正关心的是关闭名称修改,这样我们就可以创建一个名为“show”的标签,并拥有我们的函数。

了解汇编语言的功能定位

正如我乐字节同事常说的那样:“认清自己的角色”。知道C/ C++为我们做了什么和程序集没有为我们做什么是很重要的。。例如,4 + 3 * 4将自动将运算排序为先执行乘法,再执行加法。然而,在汇编中,我们必须先选择乘法指令,然后再选择加法指令。

知道如何调用函数

大多数ISA架构都会附带调用约定手册,比如ARM和RISC-V。这些只是为在所有语言中调用函数制定了一些基本规则。不过幸运的是RISC-V寄存器的 “ABI” 命名规则,有助于程序员理解它们的含义。比如:

整数参数在寄存器 A0-A7 中,浮点参数在寄存器 FA0-FA7 中

通过对堆栈指针的 sub 操作去分配函数堆栈。在调用完成后使用 add 操作进行销毁 堆栈大小必须以 8 的整数倍形式分配

所有参数和临时寄存器必须在函数调用后,被视为销毁态

在函数调用之后,已保存寄存器才能被显式保存。如果使用了任何已保存的寄存器,则必须在函数返回之前还原它们的原始值

通过 a0 寄存器做为返回值,将数据返回给调用方。

.global main

main:

你可以从上面的代码中看到,我们首先分配我们的堆栈框架,保存所有需要保存的寄存器,执行,然后在返回之前撤消的所有寄存器。

文档

用C或其他语言编写汇编代码会让你为每一行C代码编写多行汇编代码。如果你试图调试程序,这可能会让你有些难度,所以,我总是写C代码作为汇编的注释,然后把它拆开,并展示我做它的每一步。

你可以从上面的代码中看到,我有原始的C代码(第一个注释),然后对每个片段进行内联注释。这样的方式使我们能够保证程序可以正确地执行每一步。

PS:自学视频阿里P8强烈推荐的8个Java项目实战大合集B站(点击下方链接即可观看)

本文作者及来源:Renderbus瑞云渲染农场https://www.renderbus.com

点赞 0
收藏 0

文章为作者独立观点不代本网立场,未经允许不得转载。