首页> 软件教程> 教你如何优化C代码

教你如何优化C代码

来源：网络时间：2011-06-24 14:02:32

　　在性能优化方面永远注意80-20原则，即20%的程序消耗了80%的运行时间，因而我们要改进效率，最主要是考虑改进那20%的代码。不要优化程序中开销不大的那80%，这是劳而无功的。

　　第一招：以空间换时间

　　计算机程序中最大的矛盾是空间和时间的矛盾，那么，从这个角度出发逆向思维来考虑程序的效率问题，我们就有了解决问题的第1招--以空间换时间。比如说字符串的赋值：

　　方法A：通常的办法

　　#define LEN 32

　　char string1 [LEN];

　　memset (string1,0,LEN);

　　strcpy (string1,"This is a example!!"）;

　　方法B：

　　const char string2[LEN] ="This is a example!";

　　char * cp;

　　cp = string2 ;

　　使用的时候可以直接用指针来操作。

　　从上面的例子可以看出，A和B的效率是不能比的。在同样的存储空间下，B直接使用指针就可以操作了，而A需要调用两个字符函数才能完成。B的缺点在于灵活性没有A好。在需要频繁更改一个字符串内容的时候，A具有更好的灵活性；如果采用方法B，则需要预存许多字符串，虽然占用了大量的内存，但是获得了程序执行的高效率。

　　如果系统的实时性要求很高，内存还有一些，那我推荐你使用该招数。

　　第二招：使用宏而不是函数。

　　这也是第一招的变招。函数和宏的区别就在于，宏占用了大量的空间，而函数占用了时间。大家要知道的是，函数调用是要使用系统的栈来保存数据的，如果编译器里有栈检查选项，一般在函数的头会嵌入一些汇编语句对当前栈进行检查；同时，cpu也要在函数调用时保存和恢复当前的现场，进行压栈和弹栈操作，所以，函数调用需要一些CPU时间。而宏不存在这个问题。宏仅仅作为预先写好的代码嵌入到当前程序，不会产生函数调用，所以仅仅是占用了空间，在频繁调用同一个宏的时候，该现象尤其突出。

　　举例如下：

　　方法C：

　　#define bwMCDR2_ADDRESS 4

　　#define bsMCDR2_ADDRESS 17

　　int BIT_MASK(int __bf)

　　{

　　return ((1U << (bw ## __bf)) - 1)<< (bs ## __bf);

　　}

　　void SET_BITS(int __dst,

　　int __bf, int __val)

　　{

　　__dst = ((__dst) & ~(BIT_MASK(__bf))) |

　　(((__val) << (bs ## __bf))

　　& (BIT_MASK(__bf))))

　　}

　　SET_BITS(MCDR2, MCDR2_ADDRESS,ReGISterNumber);

　　方法D：

　　#define bwMCDR2_ADDRESS 4

　　#define bsMCDR2_ADDRESS 17

　　#define bmMCDR2_ADDRESS BIT_MASK(MCDR2_ADDRESS)

　　#define BIT_MASK(__bf)

　　(((1U << (bw ## __bf)) - 1)

　　<< (bs ## __bf))

　　#define SET_BITS(__dst, __bf, __val)

　　((__dst) = ((__dst) & ~(BIT_MASK(__bf)))

　　(((__val) << (bs ## __bf))

　　& (BIT_MASK(__bf))))

　　SET_BITS(MCDR2, MCDR2_ADDRESS,

　　RegisterNumber);

　　D方法是我看到的最好的置位操作函数，是arm公司源码的一部分，在短短的三行内实现了很多功能，几乎涵盖了所有的位操作功能。C方法是其变体，其中滋味还需大家仔细体会。

第三招：数学方法解决问题

　　现在我们演绎高效c语言编写的第二招--采用数学方法来解决问题。数学是计算机之母，没有数学的依据和基础，就没有计算机的发展，所以在编写程序的时候，采用一些数学方法会对程序的执行效率有数量级的提高。举例如下，求 1~100的和。

　　方法E：

　　int I , j;

　　for (I = 1 ;I<=100; I ++）

　　{

　　j += I;

　　}

　　方法F

　　int I;

　　I = (100 * (1+100)) / 2

　　这个例子是我印象最深的一个数学用例，是我的计算机启蒙老师考我的。当时我只有小学三年级，可惜我当时不知道用公式 N×（N+1）/ 2 来解决这个问题。方法E循环了100次才解决问题，也就是说最少用了100个赋值，100个判断，200个加法（I和j）；而方法F仅仅用了1个加法，1 次乘法，1次除法。效果自然不言而喻。所以，现在我在编程序的时候，更多的是动脑筋找规律，最大限度地发挥数学的威力来提高程序运行的效率。

　　第四招：使用位操作

　　使用位操作。减少除法和取模的运算。在计算机程序中数据的位是可以操作的最小数据单位，理论上可以用"位运算"来完成所有的运算和操作。一般的位操作是用来控制硬件的，或者做数据变换使用，但是，灵活的位操作可以有效地提高程序运行的效率。举例如下：

　　方法G

　　int I,J;

　　I = 257 /8;

　　J = 456 % 32;

　　方法H

　　int I,J;

　　I = 257 >>3;

　　J = 456 - (456 >> 4 << 4);

　　在字面上好像H比G麻烦了好多，但是，仔细查看产生的汇编代码就会明白，方法G调用了基本的取模函数和除法函数，既有函数调用，还有很多汇编代码和寄存器参与运算；而方法H则仅仅是几句相关的汇编，代码更简洁，效率更高。当然，由于编译器的不同，可能效率的差距不大，但是，以我目前遇到的MS C ,arm C 来看，效率的差距还是不小。

　　对于以2的指数次方为"*"、"/"或"%"因子的数学运算，转化为移位运算"<< >>"通常可以提高算法效率。因为乘除运算指令周期通常比移位运算大。

　　C语言位运算除了可以提高运算效率外，在嵌入式系统的编程中，它的另一个最典型的应用，而且十分广泛地正在被使用着的是位间的与（&）、或（|）、非（~）操作，这跟嵌入式系统的编程特点有很大关系。我们通常要对硬件寄存器进行位设置，譬如，我们通过将AM186ER型80186处理器的中断屏蔽控制寄存器的第低6位设置为0（开中断2），最通用的做法是：

　　#define INT_I2_MASK 0x0040

　　wTemp = inword(INT_MASK);

　　outword(INT_MASK, wTemp &~INT_I2_MASK);

　　而将该位设置为1的做法是：

　　#define INT_I2_MASK 0x0040

　　wTemp = inword(INT_MASK);

　　outword(INT_MASK, wTemp | INT_I2_MASK);

　　判断该位是否为1的做法是：

　　#define INT_I2_MASK 0x0040

　　wTemp = inword(INT_MASK);

　　if(wTemp & INT_I2_MASK)

　　{

　　… /* 该位为1 */

　　}

　　运用这招需要注意的是，因为CPU的不同而产生的问题。比如说，在PC上用这招编写的程序，并在PC上调试通过，在移植到一个16位机平台上的时候，可能会产生代码隐患。所以只有在一定技术进阶的基础下才可以使用这招。

第五招：汇编嵌入

　　在熟悉汇编语言的人眼里，C语言编写的程序都是垃圾"。这种说法虽然偏激了一些，但是却有它的道理。汇编语言是效率最高的计算机语言，但是，不可能靠着它来写一个操作系统吧?所以，为了获得程序的高效率，我们只好采用变通的方法--嵌入汇编，混合编程。嵌入式C程序中主要使用在线汇编，即在C程序中直接插入_asm{ }内嵌汇编语句。

　　举例如下，将数组一赋值给数组二,要求每一字节都相符。

　　char string1[1024],string2[1024];

　　方法I

　　int I;

　　for (I =0 ;I<1024;I++)

　　*(string2 + I) = *(string1 + I)

　　方法J

　　#ifdef _PC_

　　int I;

　　for (I =0 ;I<1024;I++)

　　*(string2 + I) = *(string1 + I);

　　#else