前几天 纯上 同学问了一个问题:
我ps aux看到的RSS内存只有不到30M,但是free看到内存却已经使用了7,8G了,已经开始swap了,请问ps aux的实际物理内存统计是不是漏了哪些内存没算?我有什么办法确定free中used的内存都去哪儿了呢?
这个问题不止一个同学遇到过了,之前子嘉同学也遇到这个问题,内存的计算总是一个迷糊账。 我们今天来把它算个清楚下!
通常我们是这样看内存的剩余情况的:
total used free shared buffers cached
|
Mem: 48262 7913 40349 0 14 267 |
-/+ buffers/cache: 7631 40631 |
那么这个信息是如何解读的呢,以下这个图解释的挺清楚的!
补充(不少人反映图不清晰,请参考:http://www.redbooks.ibm.com/redpapers/pdfs/redp4285.pdf P46-47)
上面的情况下我们总的内存有48262M,用掉了7913M。 其中buffer+cache总共14+267=281M, 由于这种类型的内存是可以回收的,虽然我们用掉了7913M,但是实际上我们如果实在需要的话,这部分buffer/cache内存是可以放出来的。
我们来演示下:
$ sudo sysctl vm.drop_caches=3
|
total used free shared buffers cached
|
Mem: 48262 7676 40586 0 3 41 |
-/+ buffers/cache: 7631 40631 |
我们把buffer/cache大部分都清除干净了,只用了44M,所以我们这次used的空间是7676M。
到现在我们比较清楚几个概念:
1. 总的内存多少
2. buffer/cache内存可以释放的。
3. used的内存的概率。
即使是这样我们还是要继续追查下used的空间(7637M)到底用到哪里去了?
这里首先我们来介绍下nmon这个工具,它对内存的使用显示比较直观。
使用的内存的去向我们很自然的就想到操作系统系统上的各种进程需要消耗各种内存,我们透过top工具来看下:
通常我们会看进程的RES这一项,这项到底是什么意思呢?这个数字从哪里出来的呢? 通过strace对top和nmon的追踪和结合源码,我们确定这个值是从/proc/PID/statm的第二个字段读取出来的.
那这个字段什么意思呢?
man proc或者http://www.kernel.org/doc/man-pages/online/pages/man5/proc.5.html 会详细的解释/proc/下的文件的具体意思,我们摘抄下:
/proc/[pid]/statm
Provides information about memory usage, measured in pages. The
columns are:
size total program size
(same as VmSize in /proc/[pid]/status)
resident resident set size
(same as VmRSS in /proc/[pid]/status)
share shared pages (from shared mappings)
text text (code)
lib library (unused in Linux 2.6)
data data + stack
dt dirty pages (unused in Linux 2.6)
resident set size 也就是每个进程用了具体的多少页的内存。由于linux系统采用的是虚拟内存,进程的代码,库,堆和栈使用的内存都会消耗内存,但是申请出来的内存,只要没真正touch过,是不算的,因为没有真正为之分配物理页面。
我们实际进程使用的物理页面应该用resident set size来算的,遍历所有的进程,就可以知道所有的所有的进程使用的内存。
我们来实验下RSS的使用情况:
for PROC in ` ls /proc/| grep "^[0-9]" `
|
if [ -f /proc/$PROC/statm ]; then
|
TEP=` cat /proc/$PROC/statm | awk '{print ($2)}' `
|
从数字来看,我们的进程使用了大概7024M内存,距离7637M还有几百M内存哪里去了? 哪里去了? 猫吃掉了?
我们再回头来仔细看下nmon的内存统计表。
那个该死的slab是什么呢? 那个PageTables又是什么呢?
简单的说内核为了高性能每个需要重复使用的对象都会有个池,这个slab池会cache大量常用的对象,所以会消耗大量的内存。运行命令:
$ slabtop
我们可以看到:
从图我们可以看出各种对象的大小和数目,遗憾的是没有告诉我们slab消耗了多少内存。
我们自己来算下好了:
$ echo ` cat /proc/slabinfo | awk 'BEGIN{sum=0;}{sum=sum+$3*$4;}END{print sum/1024/1024}' ` MB
|
好吧,把每个对象的数目*大小,再累加,我们就得到了总的内存消耗量:904M
那么PageTables呢? 我们万能的内核组的同学现身了:
伯瑜:
你还没有计算page tables的大小,还有struct page也有一定的大小(每个页一个,64bytes),如果是2.6.32的话,每个页还有一个page_cgroup(32bytes),也就是说内存大小的2.3%(96/4096)会被内核固定使用的
含黛:
struct page是系统boot的时候就会根据内存大小算出来分配出去的,18内核是1.56%左右,32内核由于cgroup的原因会在2.3%
好吧,知道是干嘛的啦,管理这些物理页面的硬开销,那么具体是多少呢?
$ echo ` grep PageTables /proc/meminfo | awk '{print $2}' ` KB
|
好吧,小结下!内存的去向主要有3个:1. 进程消耗。 2. slab消耗 3.pagetable消耗。
我把三种消耗汇总下和free出的结果比对下,这个脚本的各种计算项仲同学帮忙搞定的:
for PROC in ` ls /proc/| grep "^[0-9]" `
|
if [ -f /proc/$PROC/statm ]; then
|
TEP=` cat /proc/$PROC/statm | awk '{print ($2)}' `
|
PageTable=` grep PageTables /proc/meminfo | awk '{print $2}' `
|
SlabInfo=` cat /proc/slabinfo | awk 'BEGIN{sum=0;}{sum=sum+$3*$4;}END{print sum/1024/1024}' `
|
echo $RSS "KB" , $PageTable "KB" , $SlabInfo "MB"
|
printf "rss+pagetable+slabinfo=%sMB\n" ` echo $RSS/1024 + $PageTable/1024 + $SlabInfo| bc `
|
7003756KB, 59272KB, 904.334MB
|
rss+pagetable+slabinfo=7800.334MB
|
total used free shared buffers cached
|
Mem: 48262 8050 40211 0 17 404 |
-/+ buffers/cache: 7629 40633 |
free报告说7629M, 我们的cm脚本报告说7800.3M, 我们的CM多报了171M。
damn,这又怎么回事呢?
我们重新校对下我们的计算。 我们和nmon来比对下,slab和pagetable的值是吻合的。 那最大的问题可能在进程的消耗计算上。
resident resident set size 包括我们使用的各种库和so等共享的模块,在前面的计算中我们重复计算了。
0000000000400000 848K r-x-- /bin/ bash
|
00000000006d3000 40K rw--- /bin/ bash
|
00000000006dd000 20K rw--- [ anon ] |
00000000008dc000 36K rw--- /bin/ bash
|
00000000013c8000 592K rw--- [ anon ] |
000000335c400000 116K r-x-- /lib64/libtinfo.so.5.7 |
0000003ec5220000 4K rw--- /lib64/ld-2.12.so |
0000003ec5221000 4K rw--- [ anon ] |
0000003ec5800000 1628K r-x-- /lib64/libc-2.12.so |
0000003ec5b9c000 20K rw--- [ anon ] |
00007f331b910000 96836K r---- /usr/lib/locale/locale-archive |
00007f33217a1000 48K r-x-- /lib64/libnss_files-2.12.so |
00007f33219af000 12K rw--- [ anon ] |
00007f33219bf000 8K rw--- [ anon ] |
00007f33219c1000 28K r--s- /usr/lib64/gconv/gconv-modules.cache |
00007f33219c8000 4K rw--- [ anon ] |
00007fff5e553000 84K rw--- [ stack ] |
00007fff5e5e4000 4K r-x-- [ anon ] |
ffffffffff600000 4K r-x-- [ anon ] |
多出的171M正是共享库重复计算的部分。
但是由于每个进程共享的东西都不一样,我们也没法知道每个进程是如何共享的,没法做到准确的区分。
所以只能留点小遗憾,欢迎大家来探讨。
总结:内存方面的概念很多,需要深入挖掘!
祝玩的开心!
相关推荐
提高内存使用率的脚本
Linux “free”命令可以给出类Linux/Unix操作系统中物理内存和交换内存的总使用量、可用量及内核使用的缓冲区情况。 这篇文章提供一些各种参数选项的“free”命令,这些命令对于你更好地利用你的内存会有...
Linux下看内存和CPU使用率一般都用top命令,但是实际在用的时候,用top查看出来的内存占用率都非常高,如: Mem: 4086496k total, 4034428k used, 52068k free, 112620k buffers Swap: 4192956k total,...
本文讲解如何在 Linux 中使用不同的几个命令来检查 RAM 内存使用率。 一、free 命令 free命令是检查一个 Linux 系统中内存使用率最常用的命令。它显示关于内存总量,已经使用的内存以及空闲内存的相关信息。 通常, ...
实验环境 CentOS Linux release 7.3.1611 (Core) 3.10.0-514.6.1.el7.x86_64 一、概念介绍 ... used:已使用的内存(total – free – buffers – cache) free:未使用的内存 shared:通常情况下是t
您甚至不必费心思去弄明白它有多少内存,因为每一台机器的内存数量都相同。所以,如果内存需要非常固定,那么您只需要选择一个内存范围并使用它即可。 不过,即使是在这样一个简单的计算机中,您也会有问题,尤其...
设计一个虚拟存储区和内存工作区,并使用下述算法计算访问命中率。 1) 最佳置换算法(Optimal) 2) 先进先出法(Fisrt In First Out) 3) 最近最久未使用(Least Recently Used) 4) 最不经常使用法(Least ...
文将对 Linux™ 程序员可以使用的内存管理技术进行概述,虽然关注的重点是 C 语言,但同样也适用于其他语言。文中将为您提供如何管理内存的细节,然后将进一步展示如何手工管理内存,如何使用引用计数或者内存池来半...
获取OSX和Linux中的操作系统内存统计信息。 与安装 npm install node-free 用法 var memory = require ( 'node-free' ) ; memory . total ( ) ; // total memory in bytes memory . used ( ) ; // used memory in ...
= 0), nothing is done and the given device is used. ! Otherwise, either /dev/PS0 (2,28) or /dev/at0 (2,8), depending ! on the number of sectors that the BIOS reports currently. ! 此后,我们检查要使用...
Linux is developed with a strong practical emphasis more than a theoretical one. When new algorithms are suggested or existing implementations questioned, it is ...很经典详解linux的虚拟内存管理
linux提供了很多命令来协助我们快速定位到错误,free命令是Linux最常用的命令之一:它可以查看系统的内存状况,包括服务器的总内存,已经使用的内存和剩下未被使用的内存,以及缓冲区和缓存各自占用的内存情况。...
0.0% hi 0.0% si 第五行以后物理使用的物理空闲内存总量 377544k buffers Swap: 18481144k total 320k used 18480824k free 7835708k cached 用作交换区总量 使用的交换区总量 空闲交换区总量 缓冲的交换区总量。...
脚本调用: ./tomcat_monitor -u admin -p admin -h 127.0.0.1 -P 8080 返回信息: { "static_tomcat_version":8, "tomcat_server_status":1, "application0":{ ... "percent_used_memory":58.3413337765,
(1) 查看Linux系统的内存大小 [agssvrYX@inmshgis04 ~]$ grep MemTotal /proc/meminfo MemTotal: 49426728 kB (2) 显示Linux系统上的文件系统的磁盘使用情况 [agssvrYX@inmshgis04 ~]$ df -h Filesystem Size Used ...
要明白docker容器内存是如何计算的,首先要明白linux中内存的相关概念。 使用free命令可以查看当前内存使用情况。 [root@localhost ~]$ free total used free shared buffers cached Mem: 264420684 213853512 ...
复制代码 代码如下:function get_used_status(){ $fp = popen(‘top -b -n 2 | grep -E “^(Cpu|Mem|Tasks)”‘,”r”);//获取某一时刻系统cpu和内存使用情况 $rs = “”; while(!feof($fp)){ $rs .= fread($fp,...
Stressful Application Test试图让来自处理器和I/O到内存的数据尽量随机化,以创造出模拟现实的环境来测试现在的硬件设备是否稳定,Google在使用它.其大概如下: stressapptest may be used for various ...
解释一下Linux上free命令的输出。 下面是free的运行结果,一共有4行。为了方便说明,我加上了列号。这样可以把free的输出看成一个二维数组FO(Free Output)。例如: FO[2][1] = 24677460 FO[3][2] = ...