p1-1-understanding-programming-languages 第一章理解编程语言

1. 了解 “程序”、“编程语言” 和 “编程”

[x] 什么是程序？什么是编程语言？

简单地说，程序就是人类书写交由机器去执行的一系列指令；而编程语言是书写时遵照的语法规则。

[x] “编程” 到底是什么样的一种活动？

编程很像教孩子，计算机就像一个孩子，一开始什么都不懂，也不会自己思考，但非常听话，你教TA怎样就怎样，一旦学会的就不会忘，可以不走样地做很多次不出错。但是如果教的不对，TA也会不折不扣照做。

[x] 成功 “编程” 的关键之处在哪里？

对我们来说，和孩子的教育一样，关键在于理解对方的沟通语言，以及理解对方会如何理解你的表达。

2. 了解计算机系统和 CPU

[x] 计算机由哪几部分组成？

计算机本身并不复杂，大致上就是三部分：

中央处理器（CPU）：负责执行指令；

内存：负责存放 CPU 执行所需要的数据；

各种外设，像硬盘、键盘、鼠标、显示设备、网卡等等这些都是。

[x] 其中最重要的是哪一部分？

这里面 CPU 是核心的核心。

[x] 为什么 CPU 如此重要？

因为它相当于人的大脑，我们教给计算机的指令实际上就是 CPU 在一条一条地执行，执行过程中会读写内存里的数据，会调用各种外设的接口（通过一种叫做“设备驱动”的软件模块）来完成数据的输入输出（I/O）操作。

[x] CPU 的本质是什么？

CPU 是一种计算机芯片。

[x] 有哪些芯片？它们之间有何不同？

芯片可以执行的指令是在设计时就定好的，不同芯片有不同的指令集，固化在硬件里，一般无法改变。因为大小、发热和功耗等问题，芯片的指令集不能面面俱到，而是有所侧重，比如一般计算机里 CPU 芯片比较擅长整数的运算，而 GPU（图形处理芯片，也就是显卡）比较擅长浮点数的运算，计算机图形处理尤其是 3D 图形处理会涉及大量的浮点运算，所以通常交给 GPU 去做，又快又省电；后来人们发现除了 3D 图形处理，人工智能等领域的一些科学计算也多是浮点运算，所以 GPU 也被拿来做这些计算工作。而我们的手机里的芯片，是把 CPU/GPU 还有其他一些做特殊工作的芯片集成在一块硅晶片上，这样可以节省空间，也能节约功耗，这种高度集成的芯片就叫 SoC（System on Chip）。

3. 了解汇编

[x] CPU 可以执行的代码长啥样？


_add:                                   ## @add
push rbp
mov rbp, rsp
mov dword ptr [rbp - 4], edi
mov dword ptr [rbp - 8], esi
mov esi, dword ptr [rbp - 4]
add esi, dword ptr [rbp - 8]
mov eax, esi
pop rbp
ret

_main: ## @main push rbp mov rbp, rsp sub rsp, 16 mov dword ptr [rbp - 4], 0 mov edi, 27 mov esi, 15 call _add add rsp, 16 pop rbp ret


- [x] 这种代码叫什么名字？

> 汇编指令（assembly）。

- [x] CPU 实际执行的指令是什么？

> 机器指令（machine code）。

- [x] CPU 可以执行的代码——汇编指令（assembly）和 CPU 实际执行的指令——机器指令（machine code）之间有什么关系？

> 汇编指令（assembly）和 机器指令（machine code）几乎一样了，只是机器语言是二进制的，全是 01011001 这样，而汇编将其翻译成了我们稍微看得懂的一些指令和名字。

- [x] 汇编指令集包含多少指令？

> 机器可以直接执行的指令其实不多，在 Intel 官方的 x64 汇编文档 里列出的常用指令码只有 20 多个，上图中的 mov push pop add sub call ret 等都是。

- [x] 计算机执行的这些指令是什么意思？

> - 把数放到某地方，可能在 CPU 内部也可能在内存里；
> - 对某地方的数进行特定运算（通常是加减乘除）；
> - 跳转到另一个地方执行一段指令；
> - 返回原来的位置继续执行。 如此这般。

## 4. 了解 编译器

- [x] 既然 CPU 实际上就只会这种语言，别的它都听不懂，那对于那些涉及复杂的逻辑流程的任务，难道我们要直接写汇编代码来操作计算机吗？那写起来也太费劲了吧？

> 想来想去，是不是有可能我们用某种方式写下我们解决问题的方法，然后让计算机把这些方法翻译成上面那种计算机懂的指令呢？这种翻译的程序肯定不好写，但是一旦写好了以后所有人都可以用更接近人话的方式表达，计算机也能自己翻译给自己并且照做了，所谓辛苦一时享受一世，岂不美哉。程序员的典型思维就是这样：如果有个对人来说很麻烦的事情，就要试试看是不是可以让计算机来做。
> 
> 这个想法早已被证明完全可行，这样的翻译程序叫做“编译器（compiler）”。现在存在于世的编程语言有数百种，每一种都对应一个编译器，它可以读懂你用这语言写的程序，经过词法分析（tokenizing）、语法分析（parsing）、语义分析（semantic analysis）、优化（optimization）和代码生成（code emission）等环节，最终输出像上面那样机器可以看懂和执行的指令。

- [x] 那上面的汇编代码是 "什么语言" 通过 "什么编译器" 翻译出来的？

> 是如下的 C 语言代码通过 LLVM/Clang 编译器的处理生成的：

```c
int add(int a, int b) {
   return a + b;
}

int main() {
   return add(27, 15);
}

[x] C 语言是什么样的一种语言？

C 语言被公认是最接近机器语言的“高级编程语言”，因为 C 语言对内存数据的管理方式几乎和机器语言是一样的“手工操作”，需要编程者非常了解 CPU 对内存的管理模式。但尽管如此，C 语言还是高级编程语言，很接近我们人类的语言，基本上一看就懂。

[x] 有编译器这样的 “自动翻译” 实在是太好了！要不然得写 “汇编代码”，那得多费劲啊，对吧？

对的。各种各样的高级编程语言，总有一样适合你，这些语言极大地降低了计算机编程的门槛，让几乎所有人都有机会编程，而这一切都是因为有编译器这样的“自动翻译”存在，使得我们写好的程序可以被编译器翻译为机器代码，然后被机器运行 —— 等同于建立了人类和机器之间沟通的桥梁。

[x] 那我能设计自己的编程语言吗？

编译理论和实现架构已经发展了很多年，已经非常成熟，并在不断优化中。只要愿意学习，任何人都可以设计自己的编程语言并为之实现一个编译器。

5. 了解解释器和解释运行

[x] 编译器把我们写好的所有程序整篇读完然后翻译为机器代码，然后拿给计算机运行 —— 这是一种运行程序的方法，还有没有其他方法？

还有另外一种运行程序的方法，不需要把所有程序写完再运行，而是可以逐句翻译指令，写一句翻译一句执行一句，做这件事的也是一个程序，叫解释器（interpreter）。

[x] 解释器和编译器的主要区别在哪里？

主要区别就在于，解释器读入源代码是一行一行处理的，读一行执行一行。

[x] 这种处理方式的优势在哪里？

解释器的好处是，它可以实现一种交互式的编程，启动解释器之后，你说一句解释器就回你一句，有来有回，很亲切，出了问题也可以马上知道。

[x] Python 是什么样的一种语言？

Python 就是一种解释型语言。

[x] 怎么查看 Python 的解释器？

在命令行界面运行 python3 主程序，就会进入一个交互式的界面，输入一行程序立刻可以得到反馈。这就是 Python 的解释器界面。输入 exit() 回车，就可以退出 Python 的 REPL。

[x] REPL 是什么？

这种输入一行执行一行的界面有个通用的名字叫做 REPL（read–eval–print loop 的缩写），意思是这个程序可以读取（read）你的输入、计算（evaluate）、然后打印（print）结果，循环往复，直到你退出。

[x] 那我们在 Python 的解释器中，只能逐行输入程序吗？

我们还可以把 Python 程序源代码（source code）存进一个文件里，然后让解释器直接运行这个文件。

[x] 具体怎么做呢？

例如：

打开命令行界面，执行下面的操作：
cd ~/Code
touch hello.py
code hello.py
在打开的 VSCode 中输入下面的代码：
print(f'4 + 9 = {4 + 9}')
print('Hello world!')
保存，回到命令行界面执行：
python3 hello.py
解释器会读取 hello.py 里面的代码，一行一行的执行并输出对应的结果。

[x] 解释器的实现方式是什么？

解释器的实现方式有好几种：

分析源代码，直接执行（做某些解释器已经定义好的事情），或者

把源代码翻译成某种特定的中间代码，然后交给一个专门运行这种中间代码的程序执行，这种程序通常叫虚拟机（virtual machine），或者

把源代码编译为机器代码然后交给硬件执行。

[x] 那 “解释器的实现方式” 和 “编译器的实现方式” 有何区别？前者和后者（编译器把我们写好的所有程序整篇读完然后翻译为机器代码，然后拿给计算机运行）好像差不多？

无论解释器的实现方式是哪一种，其实也会有词法分析、句法分析、语义分析、代码优化和生成等过程，和编译器的基本架构是相似的，事实上由于实现上的复杂性，有时候编译和解释之间并没有那么硬的界限。

[x] 那 Python 官方解释器的工作原理是什么？

Python 官方解释器的工作原理是上列的第二种，即生成中间代码(叫做 “字节码 bytecode”)和虚拟机的方式；而另外有种 Python 的实现（PyPy）采用的是第三种方式，即预编译为机器码的方式。

[x] 在这本书里，我们用哪个 Python 解释器来运行 python 代码？这种解释器的实现方式是哪一种？

在这本书里，绝大部分代码运行用的是 Jupyter Lab。

[x] 为什么要用 Jupyter Lab？

Jupyter Lab 的目标是把 REPL 做的更好用，让我们可以在浏览器中使用，有更好的语法高亮显示，最棒的是，Jupyter Lab 可以把我们交互编程的过程保存下来，与人共享。不过它背后还是 Python 解释器，和命令行界面下运行 python 没有本质区别（但用起来的愉快程度和效率还是有很大区别的）。

Jupyter Lab 通过一个可扩展的架构正在支持越来越多的文档类型和编程语言，以后学习很多别的语言也可以用它。

6. 总结

[x] 这一章讲了哪些东西？

程序是人类书写交由机器去执行的一系列指令，而编程语言是书写时遵照的语法规则；

计算机 CPU 只能理解非常基础的指令，人要直接写出机器指令是困难和低效的；

编译器和解释器是一些特殊的程序，能够把我们用高级编程语言编写的程序翻译成机器指令，然后交给计算机去执行；

可以通过 "命令行 REPL"、"命令行加源文件" 和 "Jupyter Lab 这样的可视化环境" 来运行 Python 程序，背后都是 Python 解释器。

Logging

2020-02-13 20:31:13 initialize

xuzhengfu / pilot

p1-1-understanding-programming-languages 第一章理解编程语言 #19

1. 了解 “程序”、“编程语言” 和 “编程”

2. 了解计算机系统和 CPU

3. 了解汇编

5. 了解解释器和解释运行

6. 总结

Logging

xuzhengfu / pilot

p1-1-understanding-programming-languages 第一章 理解编程语言 #19

1. 了解 “程序”、“编程语言” 和 “编程”

2. 了解 计算机系统和 CPU

3. 了解 汇编

5. 了解 解释器和解释运行

6. 总结

Logging

p1-1-understanding-programming-languages 第一章理解编程语言 #19

2. 了解计算机系统和 CPU

3. 了解汇编

5. 了解解释器和解释运行