深入理解计算机系统(第三版)/ CSAPP 杂谈,第3章:程序的机器级表示

  • x86-64寄存器起名:8位,%al;16位,%ax;32位,%eax;64位,%rax

  • x86-64寄存器作用:

  • %rax: 返回值
  • %rbx: 被调用者保存
  • %rcx: 第4个参数
  • %rdx: 第3个参数
  • %rsi: 第2个参数
  • %rdi: 第1个参数
  • %rbp: 被调用者保存
  • %rsp: 栈指针
  • %r8: 第5个参数
  • %r9: 第6个参数
  • %r10: 调用者保存
  • %r11: 调用者保存
  • %r12: 被调用者保存
  • %r13: 被调用者保存
  • %r14: 被调用者保存
  • %r15: 被调用者保存

  • 操作数分三种:立即数,寄存器,内存引用

  • 汇编立即数表示:以$开头,跟着标准C表示法,如$-577,$0x1F。不同的指令允许的立即数范围不同

  • 寻址方式:立即数寻址,立即数作为值;寄存器寻址,寄存器值作为值;绝对寻址,立即数对应内存地址的内存值;间接寻址,寄存器值对应内存地址的内存值;变址寻址,运算表达式对应内存地址的内存值

  • 表达式:(s取值1,2,4,8)

  • $Imm: Imm,立即数寻址

  • ra: R[ra],寄存器寻址
  • Imm: M[Imm],绝对寻址
  • (ra): M[R[ra]],间接寻址
  • Imm(rb): M[Imm + R[rb]],(基址+偏移量)寻址
  • (rb, ri): M[R[rb] + R[ri]],变址寻址
  • Imm(rb, ri): M[Imm + R[rb] + R[ri]],变址寻址
  • (,ri, s): M[R[ri] * s],比例变址寻址
  • Imm(,ri, s): M[Imm + R[ri] * s],比例变址寻址
  • (rb,ri, s): M[R[rb] + R[ri] * s],比例变址寻址
  • Imm(rb,ri, s): M[Imm + R[rb] + R[ri] * s],比例变址寻址

—- 2018.11.11 —-

  • movb, movw, movl, movq 分别表示把1,2,4,8字节的数据从源位置复制到目标位置。x86-64 限制源位置和目标位置不能两个都是内存。大部分指令都会有这4种变种,但如pushq,popq,leaq等指令没有

  • movz,movs是0扩展和符号扩展指令,将较小的数从寄存器或内存转移到寄存器中。

  • x86-64中,栈中低地址是栈顶,高地址是栈底。pushq时%rsp减小,popq时%rsp增大。

  • leaq S,D: 将S所表示的地址值赋值给D,经常用来做一些简单的算法。比如z = x+4*y可能表示为leaq (%rdi, %rsi, 4), %rax

  • 一元操作中,操作数既是源也是目的。操作数可以是内存地址。

  • 二元操作中,源操作是第一个,目标操作是第二个。如subq %rax, %rdx等价与%rdx = %rdx – %rax。如果第二个操作数是内存地址,则必须读出,执行,再写入。注:此时应该会生成多条机器指令,则该操作不是原子操作。否则i++可以写成addq $1, (%rax)岂不是原子操作?所以推断该操作不是原子操作。

  • sarq,shrq表示算术右移和逻辑右移。salq, shlq表示算术左移和逻辑左移,但由于补码的特性,他们的操作结果是一样的。

*x86-64还为128位操作提供有限支持,当imulq和mulq为双操作数时,是64位乘法;当为单操作数时,另一个乘数将视为%rax,而结果将存放在%rdx(高64位),%rax(低64位)中。

—- 2018.11.18 —-

  • 条件码用于控制。最常用的四个是,CF: 进位标志,ZF:零标志,SF:符号标志,OF:溢出标志

  • 通过SET指令访问条件码,入sete/setz %al就是将ZF设置到%eax的最低byte上(0或1)

  • jmp表示跳转指令,一般汇编用一个标号来指定,如jmp .L1。也可以利用寄存器,如jmp *%rax表示跳转到%rax的值的地址,jmp *(%rax)表示跳转到%rax值对应的内存值的内存地址去。和SET一样,也有je,js,jle等指令

  • GCC当switch的情况较多,且跨度较小的时候,会使用地址跳转表来翻译switch

  • 当x86-64过程需要的存储空间超出寄存器能够存放的大小时,就回在栈上分配空间,这个部分称为过程的栈帧

  • call指令用于函数调用,此时将会把将紧跟着当前地址后面的那条指令的地址压入栈,并吧要跳转的函数地址设置到PC。退出时用ret。

  • 局部数据存到需要内存中的几种情况:

    1. 寄存器不够用
    2. 对局部变量使用了地址运算符&
    3. 某些局部变量是数组或结构体(如果优化了则不一定)
  • 数据对齐可提高软件性能,减少读的次数和额外的处理。无论数据是否对齐,x86-64都可以正确工作。汇编中在文件头部声明.align 8来保证后面的数据的起始地址都是8的倍数。

  • 对于结构体,字段之间也可能会存在间隙,以保证每个结构元素都满足它的对齐需求。

  • 对齐原则是任何K字节的基本对象的地址必须是K的倍数。

  • Linux上最新版的GCC已经会讲栈地址随机化,使得栈溢出攻击变得更加困难

版权所有,转载请注明出处:
https://sickworm.com/?p=471

发表回复

您的电子邮箱地址不会被公开。 必填项已用 * 标注

此站点使用Akismet来减少垃圾评论。了解我们如何处理您的评论数据