SickWorm的博客

深入理解计算机系统(第三版)/ CSAPP 杂谈,第1章:计算机系统漫游

深入理解计算机系统, 读书  ·  

本书第1章向我们介绍了信息的定义,以及程序是如何运行在计算机上的。

信息就是位+上下文

信息的本体是一连串的0101010101的bits,但是bits可以被解析为不同的含义,如何被解析就取决于上下文。

举个生活中的例子。“你好烦啊”如果是在一对情侣的温馨时刻中出现,那这句话可以被理解为“你个烦人的小妖精搞得我不要不要的”。而如果出现在母亲指责孩子,并且喋喋不休的情景下孩子的顶嘴,就应该理解为“你不要再说了我听不进去”。这就是上下文的作用,同样的内容,会被解析为不同的信息。

本文用到的例子是一串bits,如果代码想解析你为无符号整数,那这串bits就是正整数的信息;如果想解析为浮点数,那就是小数的信息,且与正整数代表的值可能完全不一样了。放大一点说,代码执行时当前的寄存器值,全局变量的值,栈帧的状态;程序运行时内存缓存的值,数据库的数据,都是它们的上下文。

程序的编译

现代编程语言具有很高的抽象程度,这是为了让人们更高效率的编写业务逻辑。而所有的程序代码都会在最终以机器码的形式执行,因为计算机只认识机器码。程序代码转换为机器码的过程大致都是如下的流程:

预处理:解掉一些语法糖,和调整部分代码,使其更方便的被编译器编译

编译器:将预处理后的代码进行编译,得到中间代码。中间代码不一定是汇编语言,也可能是C语言或其他语言,这取决于编译器的实现,一切为了效率。近几年比较流行的llvm,很多语言都基于它实现了编译器,而llvm也有它专用的中间语言IR。

汇编器:如果你实现的中间语言是汇编,那就是汇编器,否则就是其他器。这部将中间语言转换为可执行代码。可执行代码可能是计算机机器码,也有可能是某些依赖虚拟机的语言的虚拟机机器码。

链接器:代码以文件为单位进行编译。如果引用了文件外的方法,变量,则会在编译时留下一个“接口”,因为它暂时无法被确定。在链接阶段将会确定这些“接口”。

系统的硬件组成

讲了系统的硬件组成,直接看就行。比较有意思的是多层缓存机制。

进程,文件,网络,并发和并行

讲了计算机的一些代码执行和IO通信的机制。

版权所有,转载请注明出处:
https://sickworm.com/?p=440