当前位置:首页 > 公众号精选 > 程序喵大人
[导读]今天我们来思考一个简单的问题。在Linux下你用touch命令新建一个空文件: touch empty_file.txt 当操作完成后,是否要消耗掉我们的一些磁盘空间?需要的话,大概能消耗多少?嗯,是的,这个问题简单的超乎你的想象,但是不知道你否能给你自己一个满意的答案。

今天我们来思考一个简单的问题。在Linux下你用touch命令新建一个空文件:

touch empty_file.txt

操作完成后,是否要消耗掉我们的一些磁盘空间?需要的话,大概能消耗多少?嗯,是的,这个问题简单的超乎你的想象,但是不知道你否能给你自己一个满意的答案。

我前面的几篇文章都是介绍的磁盘物理层面的构成,但这对于理解文件相关的问题帮助可能还不够。从今天开始让我们从物理层往上走,到Linux文件系统原理里去寻找答案。

1
实践出真知

我觉得可能先丢开内核原理,直接动手操作来实验更有意思一些。你一定知道ls这个命令你可以查看文件大小,那么让我们就用它来看一下。

# touch abcdefghigklmn.txt  
# ls -l  
total 0  
-rw-r--r-- 1 root root 0 Aug 17 17:49 empty.file

额,ls命令告诉我这个空文件占用的是0。文件的大小确实是0,因为我们还没有为该文件写入任何内容。但是我们现在要思考的是,一个空文件是否占用磁盘空间。所以直觉告诉我们这绝对不可能,磁盘上多出来一个文件,怎么可能一点空间开销都没有!

为了解开这个谜底,还需要借助df命令。输入df –i

# df -i
Filesystem            Inodes   IUsed   IFree IUse% Mounted on
......
/dev/sdb1            2147361984 12785019 2134576965    1% /search

这个输出帮我们展示了我们文件系统中inode的使用情况。注意IUsed是12785019。我们继续新建一个空文件:

# touch empty_file2.txt
df -i
Filesystem            Inodes   IUsed   IFree IUse% Mounted on
......
/dev/sdb1            2147361984 12785020 2134576964    1% /search

这下注意IUsed变成了12785020。

哈哈,我们的一个结论就出来了。新建一个空文件会占用一个Inode

2
细说Inode

那么inode里都存了哪些和文件相关的信息呢?我们再稍微看一下内核的源代码。大家可以下载一份linux的源代码。以ext2文件系统为例,在我下载的linux-2.6里的文件fs/ext2/ext2.h中,可以找到内核对于inode结构体的定义。该结构体较为复杂,主要存储除了文件内容以外的一些其他数据,我们选一些比较关键的截取出来:

struct ext2_inode {
       __le16  i_mode;         # 文件权限
       __le16  i_uid;          # 文件所有者ID
       __le32  i_size;         # 文件字节数大小
       __le32  i_atime;        # 文件上次被访问的时间
       __le32  i_ctime;        # 文件创建时间
       __le32  i_mtime;        # 文件被修改的时间
       __le32  i_dtime;        # 文件被删除的时间
       __le16  i_gid;          # 文件所属组ID
       __le16  i_links_count;  # 此文件的inode被连接的次数
       __le32  i_blocks;       # 文件的block数量
       ......
       __le32  i_block[EXT2_N_BLOCKS]; # 指向存储文件数据的块的数组
       ......

可以看到和文件相关的所属用户、访问时间等都是存在inode中的。另外在include/linux/fs.h中,还有个VFS层面的inode的定义,这里咱就不发散了。使用stat命令就可以直接看到文件inode中数据。

# stat test
 File: `test'
 Size: 0               Blocks: 0          IO Block: 1024   regular empty file
Device: 801h/2049d      Inode: 26          Links: 1
Access: (0644/-rw-r--r--)  Uid: (    0/    root)   Gid: (    0/    root)
Access: 2020-03-01 12:14:31.000000000 +0800
Modify: 2020-03-01 12:14:31.000000000 +0800
Change: 2020-03-01 12:14:31.000000000 +0800

每个inode到底是多大呢?dumpe2fs可以告诉你(XFS的话使用xfs_info)。

# dumpe2fs -h /dev/mapper/vgroot-lvroot
dumpe2fs 1.41.12 (17-May-2010)
......
Inode size:               256

Inode size表示每个Inode的大小。我的这台机器上,每个inode都是256字节。两个inode的大小正好对齐到磁盘扇区的512字节。

3
文件名存到哪里了

Inode结构体都看完了,搞了半天不知道有没有发现一个问题,inode里并没有存储文件名!!那么,文件名到底跑哪儿去了?

fs/ext2/ext2.h中,我找到了如下文件夹相关的结构体

struct ext2_dir_entry {
        __le32  inode;                  /* Inode number */
        __le16  rec_len;                /* Directory entry length */
        __le16  name_len;               /* Name length */
        char    name[];                 /* File name, up to EXT2_NAME_LEN */
};

这个结构体就是我们司空见惯的文件夹所使用的数据结构。没错,文件名是存在其所属的文件夹中的,就是其中的char name[]字段。和文件名一起,文件夹里还记录了该文件的inode号等信息。

4
结论
  • 1. 新建一个空文件需要消耗掉一个inode,用来保存用户、创建时间等元数据。

  • 2. 新建一个空文件还需要消耗掉其所在目录的block中一定的空间,这些空间用来保存文件名,inode号等信息。

所以,看起来新建一个空文件而已,只要你想挖,真的能挖出很多知识的。最后分享一个我们团队里同学遇到的一个故障。我们的一台离线任务机直接歇菜了,重启后排查原因是inode被消耗光了。再追查发现一个进程创建了太多的空日志文件。虽然文件都是空文件,但是inode却被浪费光了。后来让负责的同学修改了创建日志文件的逻辑,删掉了多出来的空文件,该机器恢复正常。

往期推荐




免责声明:本文内容由21ic获得授权后发布,版权归原作者所有,本平台仅提供信息存储服务。文章仅代表作者个人观点,不代表本平台立场,如有问题,请联系我们,谢谢!

本站声明: 本文章由作者或相关机构授权发布,目的在于传递更多信息,并不代表本站赞同其观点,本站亦不保证或承诺内容真实性等。需要转载请联系该专栏作者,如若文章内容侵犯您的权益,请及时联系本站删除。
换一批
延伸阅读

9月2日消息,不造车的华为或将催生出更大的独角兽公司,随着阿维塔和赛力斯的入局,华为引望愈发显得引人瞩目。

关键字: 阿维塔 塞力斯 华为

加利福尼亚州圣克拉拉县2024年8月30日 /美通社/ -- 数字化转型技术解决方案公司Trianz今天宣布,该公司与Amazon Web Services (AWS)签订了...

关键字: AWS AN BSP 数字化

伦敦2024年8月29日 /美通社/ -- 英国汽车技术公司SODA.Auto推出其旗舰产品SODA V,这是全球首款涵盖汽车工程师从创意到认证的所有需求的工具,可用于创建软件定义汽车。 SODA V工具的开发耗时1.5...

关键字: 汽车 人工智能 智能驱动 BSP

北京2024年8月28日 /美通社/ -- 越来越多用户希望企业业务能7×24不间断运行,同时企业却面临越来越多业务中断的风险,如企业系统复杂性的增加,频繁的功能更新和发布等。如何确保业务连续性,提升韧性,成...

关键字: 亚马逊 解密 控制平面 BSP

8月30日消息,据媒体报道,腾讯和网易近期正在缩减他们对日本游戏市场的投资。

关键字: 腾讯 编码器 CPU

8月28日消息,今天上午,2024中国国际大数据产业博览会开幕式在贵阳举行,华为董事、质量流程IT总裁陶景文发表了演讲。

关键字: 华为 12nm EDA 半导体

8月28日消息,在2024中国国际大数据产业博览会上,华为常务董事、华为云CEO张平安发表演讲称,数字世界的话语权最终是由生态的繁荣决定的。

关键字: 华为 12nm 手机 卫星通信

要点: 有效应对环境变化,经营业绩稳中有升 落实提质增效举措,毛利润率延续升势 战略布局成效显著,战新业务引领增长 以科技创新为引领,提升企业核心竞争力 坚持高质量发展策略,塑强核心竞争优势...

关键字: 通信 BSP 电信运营商 数字经济

北京2024年8月27日 /美通社/ -- 8月21日,由中央广播电视总台与中国电影电视技术学会联合牵头组建的NVI技术创新联盟在BIRTV2024超高清全产业链发展研讨会上宣布正式成立。 活动现场 NVI技术创新联...

关键字: VI 传输协议 音频 BSP

北京2024年8月27日 /美通社/ -- 在8月23日举办的2024年长三角生态绿色一体化发展示范区联合招商会上,软通动力信息技术(集团)股份有限公司(以下简称"软通动力")与长三角投资(上海)有限...

关键字: BSP 信息技术
关闭
关闭