Important

Linux(生信) 中几乎所有文件都是文本,因此本内容相当重要

cut 命令

Tips

cut 意为截取,而不是剪切

-f 选项

-f 选项用于指定截取的

其中,由三个具体的用法

  • -f 2:截取第 2列
  • -f 2,4:截取第 2 第 4 列
  • -f 2-4:截取第 2 第 4 列

-c 选项

-c 选项用于指定截取的字符,即输出第 n 至第 N 个字符

用法和 -f 相同

注意隐藏字符: txt 文件使用 tab 进行分隔

-d 选项

-d 选项用于指定分隔符(divider)

-dcsv 格式的文件中很重要

cut -d, -f 2 test.txt
#先告诉电脑分隔符是“,” 在指定列截取

Warning

使用 excel 导出的 txt 文件在截取时不用指定换行符,这是因为 cut 自动设定了适用于 txt 的分隔符

管道符联用

管道符cut 中尤为重要,联用多个 cut 或其他命令可以大大提高文本截取的灵活性

例如,对于如下 csv 文件,用一行命令输出

  • 第 2,3 列的第 3-7 字符(bei, n)
  • 第 2,3 行
1,xibei,1,8
2,xibei,2,8
3,xibei,3,8
4,xibei,4,8
5,xibei,5,8
6,xibei,6,8
7,xibei,7,8
8,xibei,8,8
9,xibei,9,8
10,xibei,10,8

使用管道符输出如下

cut -d, -f 2,3 xb.test.csv |cut -c 3-7|head -3|tail -2

即可得到

bei,2
bei,3