分享

c编译程序是一组机器语言指令,C语言、汇编语言、机器指令、CPU之间是怎么联系起来的?...

 山峰云绕 2022-08-04 发布于贵州

CPU的全称是中央处理单元,是计算机进行运算的核心,根据使用的技术不同,CPU又分为X86,X64,ARM、DSP、单片机等不同的体系结构。在每种CPU上都有一套特定的指令集,这就是人们常说的机器指令,直接使用机器指令编写的程序就是机器语言程序。

理论上来说,是可以通过机器语言直接编写任何程序的(早期都是直接使用机器语言编程,那时程序相对比较简单),并且编写的程序可以直接运行,但是使用机器语言编程对程序员的要求极高,代码无法移植且不便于人直接阅读,于是人们发明了一组符号,用来表示这些机器指令,这就是汇编语言。汇编语言编写的程序计算机无法直接运行,需要一个叫做汇编器的程序转换为机器语言才可以在特定机器上运行。

而C语言是比汇编语言更高级的语言,使用C语言编写的程序也是无法在计算机上直接运行的,它需要编译器将C语言代码转换为机器语言,这个过程又分为几个子步骤,见下图。

为了使题主的问题更加完善,在这里补充两个概念,链接器与反汇编。

在大型程序中,往往会将任务分解为许多不同的子任务,每个子任务对应一个源文件,在C语言中就是多个C文件,编译器将每个C文件编译成一个目标文件(一般在Windows中是obj文件,Linux中是

.o

文件),这些目标文件也是机器指令,但是缺少一些必要的信息,无法直接运行,需要链接器将这些文件链接起来,再加上一些库文件与可执行文件头信息,成为一个可执行文件(Windows是PE格式,Linux是ELF格式)。

通常,在查看一个二进制文件时(目标文件或者可行性文件),不会直接显示机器指令,而是以汇编语言显示,这是因为此过程中有一个反汇编程序,将机器指令转换为汇编语言,它的功能刚好与汇编过程相反。

机器语言 也就是我们看到的二进制指令,二进制指令在电路中代表高电平低电平。它是可以在CPU中直接进行运算的。而汇编语言是属于低级语言。他需要通过汇编器连接器将汇编代码转换为二进制机器语言。这个转换过程,我们称之为编译。同理,c语言也有它的编译器。编译器会将c语言代码编译成二进制机器语言。举个很形象的例子。我们和外国人打交道,有时候我们的语言水平可能跟他们正常沟通是有问题的,但是呢,如果中间有一个翻译人员,就可以通过翻译人员的翻译进行沟通。而这个翻译人员就相当于编程语言中的编译器。我们就相当于编程语言。这个外国人就相当于CPU。

假如你设计一个数字电路,包括一个加法器和一个乘法器。

你希望根据需要,有时对输入数据做加法,有时对输入做乘法,该怎样做呢?最早的计算机,是靠手工连线的,与其说是计算机,不如说是巨型面包板。直到冯洛伊曼的edvac计划把存储器引入计算机。

假设加法器和乘法器都具有使能端,两个使能端为01,就是加法器工作,是10,就是乘法器工作。

然后为了让电路根据要求的顺序做加法和乘法,你把一系列01、10存储起来,当你要做加法,加法,乘法,加法时,存储的就是01011001。你增加了一个时序电路,每次读出两个位,把高低电平加在两个使能端上,替代你的手工接线。01和10这两个数码能控制电路的行为,起名叫机器码。

然而这样二进制的东西并不好记忆。于是你给01起了个名字,叫add,10起名叫mul。你的这组运算就记为add,add,mul,add。

add,mul这种助记符,就叫代码,具体说是汇编代码;你会找一个悲催的助手,帮你把代码替换成01,10这种机械码。当然总有一些助手认为这个活动太没有人生价值,于是不甘心当花瓶的女助手葛丽丝·霍普(Grace Murray Hopper)设计了将代码翻译成机器码的代码,这个活儿以后就由机器来做,编译器出现了。

因此所谓cpu认识代码,是一种拟人化的修辞,偏文艺了。cpu只是一种根据高低电平输入,产生特定的高低电平输出的机器。代码不过是助记符。

后来你觉得add,add,add,add,add这类写法太烦,于是发明了五连加,7连乘之类的写法——高级语言代码诞生了。葛丽丝·霍普搞了cobol,约翰·巴科斯(John Warner Backus)搞了FORTRAN等等。

但是相对来说第一批的高级语言写起来比较烦,比如FORTRAN语言,子程序用function开头,用end结束。相信用过python的人都会觉得FORTRAN太学究气息了。

所以后来丹尼斯·里奇(Dennis Ritchie )在开发unix系统的同时,顺便设计了语法简单的c语言。main()可比function main()end简便多了。

谢邀。

简单说说这几者的关联吧。

通常,C语言程序可被C编译器翻译成汇编语言编写的汇编程序,汇编程序被汇编器翻译成可执行代码,而可执行代码主要包括机器指令及其使用的数据。

举例子吧:

C和汇编

C语言代码:int b = 3;

int a = 2 + b;

可被C编译器翻译成汇编代码(以x86 CPU为例):movl $3, -8(%rbp)

movl -8(%rbp), %eax

addl $2, %eax

可以看出,第一行C代码被翻译成两行汇编代码,第二行C代码被翻译成一行汇编代码。C代码和汇编代码没有一一对应关系。

同一份C代码可被不同的C编译器翻译成不同的汇编代码,对应不同的CPU。

汇编代码和机器指令

接下来,上述三行汇编代码可被x86汇编器翻译成可执行代码,其中的机器指令如下:c7 45 f8 03 00 00 00

8b 45 f8

83 c0 02

汇编代码与机器指令是一一对应的关系。每个不同的CPU家族,对应着不同的机器指令体系,也一一对应着相应的汇编语言体系。比如ARM和x86就是两个不同的体系。

机器指令和CPU

CPU是机器指令的执行者。通常,CPU从内存(RAM)中读取并逐条执行机器指令。

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多