深入理解计算机系统（第三版）/ CSAPP 杂谈，第3章：程序的机器级表示

深入理解计算机系统, 读书 · 2018年11月4日

x86-64寄存器起名：8位，%al；16位，%ax；32位，%eax；64位，%rax
x86-64寄存器作用：
%rax: 返回值
%rbx: 被调用者保存
%rcx: 第4个参数
%rdx: 第3个参数
%rsi: 第2个参数
%rdi: 第1个参数
%rbp: 被调用者保存
%rsp: 栈指针
%r8: 第5个参数
%r9: 第6个参数
%r10: 调用者保存
%r11: 调用者保存
%r12: 被调用者保存
%r13: 被调用者保存
%r14: 被调用者保存
%r15: 被调用者保存
操作数分三种：立即数，寄存器，内存引用
汇编立即数表示：以$开头，跟着标准C表示法，如$-577，$0x1F。不同的指令允许的立即数范围不同
寻址方式：立即数寻址，立即数作为值；寄存器寻址，寄存器值作为值；绝对寻址，立即数对应内存地址的内存值；间接寻址，寄存器值对应内存地址的内存值；变址寻址，运算表达式对应内存地址的内存值
表达式：（s取值1，2，4，8）
$Imm: Imm，立即数寻址
ra: R[ra]，寄存器寻址
Imm: M[Imm]，绝对寻址
(ra): M[R[ra]]，间接寻址
Imm(rb): M[Imm + R[rb]]，（基址+偏移量）寻址
(rb, ri): M[R[rb] + R[ri]]，变址寻址
Imm(rb, ri): M[Imm + R[rb] + R[ri]]，变址寻址
(,ri, s): M[R[ri] * s]，比例变址寻址
Imm(,ri, s): M[Imm + R[ri] * s]，比例变址寻址
(rb,ri, s): M[R[rb] + R[ri] * s]，比例变址寻址
Imm(rb,ri, s): M[Imm + R[rb] + R[ri] * s]，比例变址寻址

---- 2018.11.11 ----

movb, movw, movl, movq 分别表示把1，2，4，8字节的数据从源位置复制到目标位置。x86-64 限制源位置和目标位置不能两个都是内存。大部分指令都会有这4种变种，但如pushq，popq，leaq等指令没有
movz，movs是0扩展和符号扩展指令，将较小的数从寄存器或内存转移到寄存器中。
x86-64中，栈中低地址是栈顶，高地址是栈底。pushq时%rsp减小，popq时%rsp增大。
leaq S,D: 将S所表示的地址值赋值给D，经常用来做一些简单的算法。比如z = x+4*y可能表示为leaq (%rdi, %rsi, 4)， %rax
一元操作中，操作数既是源也是目的。操作数可以是内存地址。
二元操作中，源操作是第一个，目标操作是第二个。如subq %rax, %rdx等价与%rdx = %rdx - %rax。如果第二个操作数是内存地址，则必须读出，执行，再写入。注：此时应该会生成多条机器指令，则该操作不是原子操作。否则i++可以写成addq $1, (%rax)岂不是原子操作？所以推断该操作不是原子操作。
sarq，shrq表示算术右移和逻辑右移。salq, shlq表示算术左移和逻辑左移，但由于补码的特性，他们的操作结果是一样的。

*x86-64还为128位操作提供有限支持，当imulq和mulq为双操作数时，是64位乘法；当为单操作数时，另一个乘数将视为%rax,而结果将存放在%rdx（高64位），%rax（低64位）中。

---- 2018.11.18 ----

条件码用于控制。最常用的四个是，CF: 进位标志，ZF：零标志，SF：符号标志，OF：溢出标志
通过SET指令访问条件码，入sete/setz %al就是将ZF设置到%eax的最低byte上（0或1）
jmp表示跳转指令，一般汇编用一个标号来指定，如jmp .L1。也可以利用寄存器，如jmp *%rax表示跳转到%rax的值的地址，jmp *(%rax)表示跳转到%rax值对应的内存值的内存地址去。和SET一样，也有je，js，jle等指令
GCC当switch的情况较多，且跨度较小的时候，会使用地址跳转表来翻译switch
当x86-64过程需要的存储空间超出寄存器能够存放的大小时，就回在栈上分配空间，这个部分称为过程的栈帧
call指令用于函数调用，此时将会把将紧跟着当前地址后面的那条指令的地址压入栈，并吧要跳转的函数地址设置到PC。退出时用ret。
局部数据存到需要内存中的几种情况：
1. 寄存器不够用
2. 对局部变量使用了地址运算符&
3. 某些局部变量是数组或结构体（如果优化了则不一定）
数据对齐可提高软件性能，减少读的次数和额外的处理。无论数据是否对齐，x86-64都可以正确工作。汇编中在文件头部声明.align 8来保证后面的数据的起始地址都是8的倍数。
对于结构体，字段之间也可能会存在间隙，以保证每个结构元素都满足它的对齐需求。
对齐原则是任何K字节的基本对象的地址必须是K的倍数。
Linux上最新版的GCC已经会讲栈地址随机化，使得栈溢出攻击变得更加困难

版权所有，转载请注明出处：
https://sickworm.com/?p=471

#CSAPP