Linux系统性能优化思路和优化方法及Linux性能调优经验总结.docx
Linux系统性能优化思路和优化方法及Linux性能调优经验总结一、影响LinUX性能的各种因素1、系统硬件资源(1)CPU如何判断多核CPU与超线程消耗CPU的业务:动态Web服务、mail服务(2)内存物理内存与swap的取舍选择64位LinUX操作系统消耗内存的业务:内存数据库(redis/hbase/mongodb)(3)磁盘IORAID技术(RAID0/1/5/01/10)SSD磁盘消耗磁盘的业务:数据库服务器(4)网络带宽网卡/交换机的选择操作系统双网卡绑定消耗带宽的业务:hadoop平台、视频业务平台2、操作系统相关资源(1)系统安装优化磁盘分区、RAlD设置、SWaP设置(2)内核参数优化ulimit-n(最大打开文件数)ulimit-u(最大用户数)(3)文件系统优化ext2:LinUX下标准文件系统,无日志记录(inode)功能。ext3:在ext2基础上增加了日志记录功能(inode),仅支持32000个子目录。ex4:ext3的后续版本,LinUX2.6.28内核开始支持。无限子目录支持,快速fsckoxfs:高性能文件系统,LinUX3.10内核开始默认支持。建议:读操作频繁,同时小文件众多的应用:首选ext4文件系统,接下来依次是xfs>ext3写操作频繁的应用,首选是Xfs,接下来依次是ext4和ext3对性能要求开高、数据安全要求开高的业务,ext3是比较好的选择。3、程序问题此类问题需要开发人员查看代码,介入处理。但作为运维人员需要给出程序问题的有力证据。二、LinUX性能优化工具1、CPU性能评估工具(1)VmStat(系统默认自带)利用VmStat命令可以对操作系统的内存信息、进程状态、CPU活励等进行监视。常用方式:Vmstat23表示每3秒更新一次输出信息,统计5次后停止输出。下面是vmstat命令在某个系统的输出结果:rootnodelvraslat23procsmemoryswapiosystem-cpu_rbSWPdfreebuffcachesiSObiboinCSussyidwast000162240830467032001321100723019800000162240830467032001010102001100000001622408304670320011100918019900对上面每项的输出解释如下:procsr列表示运行和等待cpu时间片的进程数,这个值如果长期大于系统CPU的个数,说明CPU不足,需要增加CPU。b列表示在等待资源的进程数,比如正在等待I/O、或者内存交换等。memorySWPd列表示切换到内存交换区的内存数量(以k为单位)。如果SWPd的值不为0,或者比较大,只要si、SO的值长期为0,这种情况下一般不用担心,不会影响系统性能。free列表示当前空闲的物理内存数量(以k为单位)buff列表示bufferscache的内存数量,一般对块设备的读写才需要缓冲。CaChe列表示PageCaChed的内存数量,一般作为文件系统CaChed,频繁访问的文件都会被Caehed,如果CaChe值较大,说明CaChed的文件数较多,如果此时IO中bi比较小,说明文件系统效率比较好。swapSi列表示由磁盘调入内存,也就是内存进入内存交换区的数量。SO列表示由内存调入磁盘,也就是内存交换区进入内存的数量。一般情况下,si、SO的值都为0,如果si、SO的值长期不为0,则表示系统内存不足。需要增加系统内存。IO项显示磁盘读写状况Bi列表示从块设备读入数据的总量(即读磁盘)(每秒kb)。B。列表示写入到块设备的数据总量(即写磁盘)(每秒kb)。这里我们设置的bi+bo参考值为1000,如果超过1000,而且Wa值较大,则表示系统磁盘IO有问题,应该考虑提高磁盘的读写性能。SyStem显示采集间隔内发生的中断数in列表示在某一时间间隔中观测到的每秒设备中断数。CS列表示每秒产生的上下文切换次数。上面这2个值越大,会看到由内核消耗的CPU时间会越多。CPU项显示了CPU的使用状态,此列是我们关注的重点。US列显示了用户进程消耗的CPU时间百分比。US的值比较高时,说明用户进程消耗的印U时间多,但是如果长期大于50%,就需要考虑优化程序或算法。Sy列显示了内核进程消耗的CPU时间百分比。Sy的值较高时,说明内核消耗的CPU资源很多。根据经验,us+sy的参考值为80%,如果us+sy大于80%说明可能存在CPU资源不足。id列显示了CPU处在空闲状态的时间百分比。Wa列显示了10等待所占用的CPU时间百分比。Wa值越高,说明IO等待越严重,根据经验,Wa的参考值为20%,如果Wa超过20%,说明IO等待严重,引起IO等待的原因可能是磁盘大量随机读写造成的,也可能是磁盘或者磁盘控制器的带宽瓶颈造成的(主要是块操作)。综上所述,在对CPU的评估中,需要重点注意的是procs项r列的值和CPU项中us、Sy和id列的值。(2) iostat(需要安装SySStat工具包)iostat是I/OStatiStiCS(输入/输出统计)的缩写,主要的功能是对系统的磁盘I/O操作进行监视。常用方式:iostat-c35其中,-C表示显示CPU的使用情况,-d:显示磁盘的使用情况。(3) uptime命令uptime是监控系统性能最常用的一个命令,主要用来统计系统当前的运行状况,输出的信息依次为:系统现在的时间、系统从上次开机到现在运行了多长时间、系统目前有多少登陆用户、系统在一分钟内、五分钟内、十五分钟内的平均负载。2、内存性能评估(1) free命令free命令是监控Iinux内存使用状况最常用的指令常见用法:free-m看下面的一个输出:root*ebserverfree-mtotalusedfreesharedbufferscachedMera:8111718592502436299-/+buffers/cache:6437468Swap:818908189“free-m”表示以M为单位查看内存使用情况,在这个输出中,我们重点关注的应该是free列与CaChed列的输出值,由输出可知,此系统共8G内存,系统空闲内存还有925M,其中,BufferCache占用了243M,PageCache占用了6299M,由此可知系统缓存了很多的文件和目录,而对于应用程序来说,可以使用的内存还有7468M,当然这个7468M包含了BUffelCaChe和PageCaChe的值。在SW叩项可以看出,交换分区还未使用。所以从应用的角度来说,此系统内存资源还非常充足。一般有这样一个经验公式:应用程序可用内存/系统物理内存70%时,表示系统内存资源非常充足,不影响系统性能,应用程序可用内存/系统物理内存<20%时,表示系统内存资源紧缺,需要增加系统内存,20%<应用程序可用内存/系统物理内存70%时,表示系统内存资源基本能满足应用需求,暂时不影响系统性能。(2) sar/pidstat此两个命令主要用于监控全部或指定进程占用系统资源的情况,如CPU,内存、设备IOo三个公用参数:-U(获取CPU状态)、(获取内存状态)、-d(获取磁盘)常用组合:sar-u3获取cpu3秒内的状态pidstat-r-pl3获取内存3秒内的状态看看以上两个命令的差别?请看下面的一个输出:rootwebserversar-r231.inux2.6.9-42.ELsap(webserver)11/30/2008_i686_(8CPU)09:57:33PMkbmcmfreckbmemused%mef11usodkbbufferskbcachedkbconit%commit09:57:35PM897988740855689.192494286496532786三4.7109:57:37PM898564740798089.1824942864965327842764.7009:57:39PM899196740734889.1724944064965207821324.69Average:898583740796189.1824943264965287843214.70其中:Kbmemfree表示空闲物理内存大小,kbmemused表示已使用的物理内存空间大小,memused表示已使用内存占总内存大小的百分比,kbbuffers和kbcached分别表示BufferCache和PageCache的大小,kbcommit和commit分别表示应用程序当前使用的内存大小和使用百分比。可以看出sar的输出其实与free的输出完全对应,不过sar更加人性化,不但给出了内存使用量,还给出了内存使用的百分比以及统计的平均值。从commit项可知,此系统目前内存资源充足。3、磁盘性能评估(1) )iostat-d组合iostat-d23通过“iostat-d”命令组合也可以查看系统磁盘的使用状况,请看如下输出:rootrebserver#iostat-d23i686_(8CPU)Linux2.6.9-42.ELsmp(webserver)12/01/2008Device:tpsBlk_read/sBIk_WrtnZSBlhreadBIkJrrInsda1.872.58114.126479462286537372Device:tpsBlk_read/sBlkJrtn/sBlk.readBlk_wrtnsda0.000.000.0000Device:tpsBlk_read/sBIhWrtn/sBlkreadBIkJTlnsda1.000.0012.00024对上面每项的输出解释如下:Blk-reads表示每秒读取的数据块数。Blk_wrtn/s表示每秒写入的数据块数。Blk.read表示读取的所有块数。Blk_wrtn表示写入的所有块数。(2) pidstat-d-p318873(3) sar-d23通过“sar-d”组合,可以对系统的磁盘IO做一个基本的统计,请看下面的一个输出:rootftrebserversar-d23Linux2.6.9-42.ELsmp(WebSerVer)11/30/2008i686(8CPU)11:09:33PMDEVtpsrd_sec/swr_scc/savgrq-szavgqu-szavaitsvct>%util11:09:35PMdev8-00.000.000.000.000.000.000.000.0011:09:35PMDEVtpsrd_sec/swr_sec/sav