C语言是在B语言的基础上发展起来的。
C的根源是ALGOL 60,1960年ALGOL 60是一种面向问题的高级语言,离硬件比较远,1963年的时候推出了CPL语言,CPL在ALGOL 60的基础上更接近硬件一些,但很难实现,1967年,对CPL语言做出了简化,推出了BCPL语言,1970年又对BCPL语言为基础,又做出了进一步的简化,设计出了很简单的的而且接近硬件的BCPL语言简称B语言(BCPL的第1个字母),并且用了B语言编写的第1个UNIX操作系统,在PDP 7上实现,此时的B语言过于简单,功能有限,在1972-1973年间,D.M.Ritchie在B语言的基础上设计出了C语言(BCPL的第2个字母),C语言保持了B语言的优点(精炼,接近硬件)又克服了缺点(过于简单,数据无类型等)。它就经受住了时间的考验,在许多情况下仍然是最流行的编程语言之一。
Basic Combined Programming Language(BCPL),1967年由剑桥大学的Matin Richards在同样由剑桥大学开发的CPL语言上改进而来。BCPL最早被用做牛津大学的OS6操作系统上面的开发工具。后来通过美国贝尔实验室的改进和推广成为了UNIX上的常用开发语言。
BCPL有些类似于Fortran,也是典型的面向过程的高级语言。BCPL的语法更加靠近机器本身,适合于开发精巧,高要求的应用程序,同时对编译器的要求也不高。BCPL也是最早使用库函数封装基本输入输出的语言之一,这使得他跨平台的移植性很好。BCPL的代码用小写字母书写,有别于同时代的BASIC和PASCAL。BCPL对于字符串的支持很差,内存管理也很糟糕。
BCPL本身并没有被使用太长时间。1970年,贝尔实验室的Ken Thompson在BCPL的基础上改进出了B语言,用于书写UNIX。这个名字取自BCPL中的第一个字母。B语言使用的时间更短,三年后的1973年同样是贝尔实验室的D.M.RITCHIE将B语言进一步改进,并且取了BCPL中的第二个字母将其命名为C语言。而C语言和C++则在日后成为了最流行的高级语言。
1964年,美国麻省理工、贝尔实验室、通用电气准备为GE-645大型机开发一套多人多任务操作系统MULTICS。
参与研发的一位贝尔实验室研究员肯·汤普森搞了一台废弃的DEC PDP-7计算机,PDP-7字长为18位,其标准主内存为4K字(相当于9千字节),可以升级到64K字(144 KB)。
DEC PDP-7
肯·汤普森伙同好友丹尼斯·里奇在上面研发了一个操作系统
丹尼斯·里奇
虽然这个操作系统比较简陋,但公认是UNIX操作系统的雏形。已经显示出Unix的一些基本特征——简洁、高效、比当时所有的操作系统都更注重交互性、对程序员友好。具备一个简陋的文件系统,有特殊的文件类型及支持目录和设备,甚至可以支持多任务。它的核心是用汇编写的(汇编器也是肯·汤普森自己写的),不具备可移植性。只支持两个用户。
这个系统除了使用汇编语言之外,还是用了一种在BCPL语言基础上由肯·汤普森发明的B语言。叫B语言,就是把BCPL精简提炼的意思。
B语言不支持数据类型和结构,接近底层。后来丹尼斯·里奇在B语言的基础上增加了数据类型和结构的支持,推出了C语言(意思是“BCPL”中排在B之后)。
肯·汤普森1970年借为贝尔实验室专利部开发一套文字处理系统的机会,搞到了一台PDP-11/20。他们把UNIX从PDP-7上移植了过来,汇编写的代码没什么可移植性,所以基本上就是在PDP-11上重写了一次,让C语言有了大显身手的用武之地,也是第一次使用高级语言开发操作系统。
贝尔实验室成了Unix的第一个商业用户,这是在1971年11月,在与系统配套的手册中,该版本被称做“First Edition”。
这么好用的东西在业界引起了极大反响,无论是UNIX还是C语言,成了当时计算机科学界研究的热门。两位大神也从来不敝帚自珍,不但利用贝尔实验室无法限制UNIX版权大量邮寄这款操作系统给当时的同仁,还经常帮助他们解决安装使用UNIX中遇到的问题。
同时,计算机科学家和工程师们也不断对UNIX添砖加瓦,各路大神编写了各种Unix版本和各种Unix-like操作系统,其中有Linus Torvalds用C语言写的linux。
后来肯·汤普森又在谷歌写出了go语言代替c语言与Python/ target=_blank class=infotextkey>Python,谷歌的文化是提倡每周五天干工作事4天,剩余一天自己安排,go语言就是在这种情况下开发出来的。
Go的三个作者分别是:Robert Griesemer(罗伯特.格利茨默),Rob Pike(罗伯.派克)和 ken Thompson(肯.汤普森)。
.Robert在开发Go之前是Goole V8 、Chubby和HotSpot JVM的主要奉献者;
.Rob主要是Unix 、UTF-8、 plan9的作者;
.ken主要是B语言、C语言的作者、Unix之父。
Go语言设计初衷
1、设计Go语言是为了解决当时google开发遇到的问题:
2、Google开发中的痛点 :
3、如何解决当前的问题和痛点?
Go希望成为互联网时代的C语言。多数系统级语言(包括Java和C#)的根本编程哲学来源于C++,将C++的面向对象进一步发扬光大。但是Go语言的设计者却有不同的看法,他们认为值得学习的是C语言。C语言经久不衰的根源是它足够简单。因此,Go语言也是足够简单。
他们当时设计Go语言的目标是为了消除各种缓慢和笨重、改进各种低效和扩展性。Go是有那些开发大型系统的人设计的,同时也是为了这些人服务的,它是为了解决工程上的问题,不是为了研究语言设计;它还是为了让我们的编程变得更舒适和方便。
在今天,有许多编程语言可以让开发者研发出比C更高效的应用,这些语言拥有丰富的内置库,可以简化与JSON、XML、UI、网页、客户端请求、数据库链接、媒体操作等工作。尽管如此,C依然仍将长期活跃在编程一线,为什么呢?
那让我们一起来看看C语言都有哪些无与伦比的优势。
汇编语言的可移植性差,可C语言却是一门可移植性非常好的语言。它尽可能地接近机器,同时它几乎普遍适用于现有的处理器架构。几乎现有的每个架构至少有一个C语言编译器。如今,由于现代编译器产生高度优化的二进制文件,用手写的汇编来改进它们的输出并不是一件容易的事。
由于它的可移植性和效率高效,"其他编程语言的编译器、库和解释器经常用C语言实现"。像Python、Ruby和php这些解释性语言的主要实现都是基于C语言,它甚至被其他语言的编译器用来与机器通信。例如,C是Eiffel和Forth的中间语言。意味着这些语言的编译器不需要为每个要支持的架构生成机器代码,而只是生成中间的C代码,由C编译器处理机器代码的生成。
C语言也已成为开发人员之间交流的一种语言。正如Dropbox工程经理、Cprogramming.com创建者Alex AllAIn所说:
C语言作为一门伟大的语言,可以让大多数人以能接受的方式来表达编程中的常见想法。此外,C语言在使用中也有语法结构也会出现在其他语言中,例如,用于命令行参数的argc和argv,以及循环结构和变量类型,因此,即使对方不懂C语言,你也能找到一些共同点来与他们交谈。
内存管理和指针运算是C语言的重要特征,使C语言成为系统级编程(操作系统与嵌入式系统)的最佳搭档。
在硬件/软件边界,计算机系统和微控制器将其外设和I/O引脚映射到内存地址。系统应用程序必须读取和写入这些自定义的内存位置,以便与外界进行通信。因此,C语言操作任意内存地址的能力对于系统编程是必不可少的。
例如,一个微控制器可以这样设计:每当地址0x40008001的第4位被设置为1时,内存地址0x40008000中的字节就会被通用异步接收/发送器(或UART,一种与外设通信的常见硬件组件)发送,并且在设置后,它将被外设自动取消。下来演示一个C函数代码,它通过该UART发送一个字节:
#define UART_BYTE *(char *)0x40008000
#define UART_SEND *(volatile char *)0x40008001 |= 0x08
void send_uart(char byte)
{
UART_BYTE = byte; // write byte to 0x40008000 address
UART_SEND; // set bit number 4 of address 0x40008001
}
send_uart函数的第一行代码可扩展为:
*(char *)0x40008000 = byte;
这一行代码是告诉编译器将值是0x40008000解释为一个指向char的指针,然后解除对该指针的定义(给出该指针所指向的值)(用最左边的*操作符),最后将字节值分配给该解除定义的指针。换句话说:把变量byte的值写到内存地址0x40008000。
将该函数的下一行代码扩展一下:
*(volatile char *)0x40008001 |= 0x08;
在这行代码中,我们对地址0x40008001和数值0x08(二进制的00001000,即第4位的1)进行了or位运算操作,并将结果存回地址0x40008001。换句话说:我们设置地址为0x40008001的字节的第4位。我们还声明地址为0x40008001的值是易失性的。这就告诉编译器,该值可能会被我们代码外部的进程所修改,所以编译器在写入该地址后不会对该地址的值做出任何假设。(在这种情况下,该字节在我们用软件设置后就被UART硬件取消了)。这些信息对于编译器的优化器来说是很重要的。例如,如果我们在for循环中这样做,而没有指定该值是易失性的,编译器可能会认为该值在被设置后永远不会改变,并在第一个循环后跳过执行该命令。
开发人员进行系统编程不能依赖的一个常见语言特性就是垃圾收集,甚至对一些嵌入式系统来说,只能进行动态分配。嵌入式应用程序在时间和内存资源方面非常有限。对于一些实时的嵌入系统,它们无法承受垃圾收集器的非确定性调用。如果因为内存不足而不能使用动态分配,那么拥有其他内存管理机制就显得尤为重要,比如将数据放在自定义地址中,就像C语言的指针所允许的那样。那些严重依赖动态分配和垃圾回收的语言不适用于资源紧张的系统。
C语言有一个非常小的运行时,其代码的内存占用要小于其它语言。例如与C++相比,一个由C语言生成的二进制文件,其体积大约是由类似的C++代码生成的二进制文件的一半。造成这种情况的主要原因之一是异常支持。
异常(Exceptions )机制是C++比C语言多出来的一个不错功能,如果异常不被触发和巧妙的实现,他们实际上是没有执行时间的开销,但代价便是增加代码体积。
下面让我们以C++代码为例:
// Class A declaration. Methods defined somewhere else;
class A
{
public:
A(); // Constructor
~A(); // Destructor (called when the object goes out of scope or is deleted)
void myMethod(); // Just a method
};
// Class B declaration. Methods defined somewhere else;
class B
{
public:
B(); // Constructor
~B(); // Destructor
void myMethod(); // Just a method
};
// Class C declaration. Methods defined somewhere else;
class C
{
public:
C(); // Constructor
~C(); // Destructor
void myMethod(); // Just a method
};
void myFunction()
{
A a; // Constructor a.A() called. (Checkpoint 1)
{
B b; // Constructor b.B() called. (Checkpoint 2)
b.myMethod(); // (Checkpoint 3)
} // b.~B() destructor called. (Checkpoint 4)
{
C c; // Constructor c.C() called. (Checkpoint 5)
c.myMethod(); // (Checkpoint 6)
} // c.~C() destructor called. (Checkpoint 7)
a.myMethod(); // (Checkpoint 8)
} // a.~A() destructor called. (Checkpoint 9)
该段代码中的A类、B类和C类中的方法都被定义在了外部(例如在其它文件中)。因此,编译器无法对它们进行解析,也不知道是否会抛出异常。所以程序必须准备处理从它们的任何构造函数、析构函数或其他方法调用中抛出的异常。解构器不应该抛出(做法非常糟糕),但用户还是可以抛出,或者他们可以通过调用一些抛出异常的函数或方法(显式或隐式)间接地抛出。
如果myFunction中的任何调用抛出了异常,堆栈解开机制必须能够调用所有已经构建的对象的析构器。堆栈解开机制的一个实现将使用这个函数的最后一次调用的返回地址来验证触发异常的调用的 "检查点编号"(这是简单的解释)。它是通过利用一个辅助的自动生成的函数(一种查找表)来实现的,当该函数的主体抛出异常时,该函数将被用于堆栈解绕,这将与此类似。
如果myFunction函数的任何一个调用抛出异常,C++的栈展开(stack unwinding)机制必须能够调用所有已构建对象的析构器。栈展开机制的一个实现是将使用这个函数的最后一次调用的返回地址来验证触发异常调用的 "检查点编号"(这是简单的解释)。它是通过利用一个辅助的自动生成函数(一种查找表)来实现,在该函数的主体抛出异常时,该函数将被用于堆栈解绕,与下面这段代码类似:
// Possible autogenerated function
void autogeneratedStackUnwindingFor_myFunction(int checkpoint)
{
switch (checkpoint)
{
// case 1 and 9: do nothing;
case 3: b.~B(); goto destroyA; // jumps to location of destroyA label
case 6: c.~C(); // also goes to destroyA as that is the next line
destroyA: // label
case 2: case 4: case 5: case 7: case 8: a.~A();
}
}
如果从case 1和9抛出异常,则没有对象需要销毁。对于case 3,则b和a必须被销毁。对于case 6,c和a必须被销毁。在所有情况下,销毁顺序必须得到尊重。对于检查点2、4、5、7和8,只有对象a需要被销毁。
这个辅助函数增加了代码的体积。这是C++添加到C语言中的空间开销的一部分。许多嵌入式应用无法负担这种额外的空间。因此,用于嵌入式系统的C++编译器通常有一个禁用异常的标志。在C++中禁用异常是不自由的,因为标准模板库严重依赖异常来告知错误。使用这种修改过的方案,没有异常,需要对C++开发人员进行更多的培训,以检测可能的问题或发现错误。
C++的一个原则就是“开发者无需为不使用的东西付费”。对于其他语言来说,二进制体积的增加会变得非常糟糕,通过其它功能来增加额外开销,虽然这些功能有用,但嵌入式系统却负担不起。虽然C语言不会给你提供这些额外功能,但他可以比其它语言拥有更紧凑的代码足迹(code footprint ),占用更小的磁盘空间。
C语言并不难学,作为一门老牌编程语言,有关它的教程跟学习资料非常多,那么学习C语言有哪些好处呢?
C语言是开发人员的通用语言,网上或者图书里面的不少算法都是基于C语言实现,这也为实现提供了最大的可移植性,开发者也会从中受益。
当我们与同事讨论代码的某些部分或其他语言的某些特征时,我们最终会 "用C语言说话":"这部分是向对象传递一个 "指针 "还是复制整个对象?这里会不会发生任何 "转换"?等等。
在分析高级语言的一部分代码的行为时,我们很少讨论(或思考)一部分代码正在执行的汇编指令。相反,在讨论机器在做什么时,我们可以用C语言描述(或想)得很清楚。
从大型数据库服务器或操作系统内核甚至是为了满足个人乐趣而制作的小型家用嵌入式应用,你都可以用C语言实现,并且还可以在网上找到相关Demo。Daniel呼吁大家,不要停止自己喜欢做的事情,比如学习C语言,它古老但小巧,并且是一门经过时间验证的编程语言。
当下许多编程语言在其预设的用途上都要优于C语言,但这并不意味着就能击败C,当考虑性能优先的时候,C依然是王者。世界正运行在C语言驱动的设备上,无论你是否意识到,你使用的诸多设备的的确确都用到了C语言。