Linux 命令总结之 tr

2016/03/07 Linux命令

Linux tr 命令用于转换或删除文件中的字符。

tr 指令从标准输入设备读取数据,经过字符串转译后,将结果输出到标准输出设备

tr用来从标准输入中通过替换或删除操作进行字符转换。tr主要用于删除文件中控制字符或进行字符转换。使用tr时要转换两个字符串:字符串1用于查询,字符串2用于处理各种转换。tr刚执行时,字符串1中的字符被映射到字符串2中的字符,然后转换操作开始。

通过使用 tr,您可以非常容易地实现 sed 的许多最基本功能。您可以将 tr 看作为 sed 的(极其)简化的变体:它可以用一个字符来替换另一个字符,或者可以完全除去一些字符。您也可以用它来除去重复字符。这就是所有 tr 所能够做的。

语法

tr [-cdst][--help][--version][第一字符集][第二字符集]  
tr [OPTION]…SET1[SET2] 

查看参数

$ tr --help
Usage: tr [OPTION]... SET1 [SET2]
Translate, squeeze, and/or delete characters from standard input,
writing to standard output.

  -c, -C, --complement    use the complement of SET1
  -d, --delete            delete characters in SET1, do not translate
  -s, --squeeze-repeats   replace each input sequence of a repeated character
                            that is listed in SET1 with a single occurrence
                            of that character
  -t, --truncate-set1     first truncate SET1 to length of SET2
      --help     display this help and exit
      --version  output version information and exit

SETs are specified as strings of characters.  Most represent themselves.
Interpreted sequences are:

  \NNN            character with octal value NNN (1 to 3 octal digits)
  \\              backslash
  \a              audible BEL
  \b              backspace
  \f              form feed
  \n              new line
  \r              return
  \t              horizontal tab
  \v              vertical tab
  CHAR1-CHAR2     all characters from CHAR1 to CHAR2 in ascending order
  [CHAR*]         in SET2, copies of CHAR until length of SET1
  [CHAR*REPEAT]   REPEAT copies of CHAR, REPEAT octal if starting with 0
  [:alnum:]       all letters and digits
  [:alpha:]       all letters
  [:blank:]       all horizontal whitespace
  [:cntrl:]       all control characters
  [:digit:]       all digits
  [:graph:]       all printable characters, not including space
  [:lower:]       all lower case letters
  [:print:]       all printable characters, including space
  [:punct:]       all punctuation characters
  [:space:]       all horizontal or vertical whitespace
  [:upper:]       all upper case letters
  [:xdigit:]      all hexadecimal digits
  [=CHAR=]        all characters which are equivalent to CHAR

参数说明

-c, --complement:反选设定字符。也就是符合 SET1 的部份不做处理,不符合的剩余部份才进行转换
-d, --delete:删除指令字符
-s, --squeeze-repeats:缩减连续重复的字符成指定的单个字符
-t, --truncate-set1:削减 SET1 指定范围,使之与 SET2 设定长度相等
--help:显示程序用法信息
--version:显示程序本身的版本信息
字符集合的范围:

\NNN 八进制值的字符 NNN (1 to 3 为八进制值的字符)
\\ 反斜杠
\a Ctrl-G 铃声
\b Ctrl-H 退格符
\f Ctrl-L 走行换页
\n Ctrl-J 新行
\r Ctrl-M 回车
\t Ctrl-I tab键
\v Ctrl-X 水平制表符
CHAR1-CHAR2 :字符范围从 CHAR1 到 CHAR2 的指定,范围的指定以 ASCII 码的次序为基础,只能由小到大,不能由大到小。
[CHAR*] :这是 SET2 专用的设定,功能是重复指定的字符到与 SET1 相同长度为止
[CHAR*REPEAT] :这也是 SET2 专用的设定,功能是重复指定的字符到设定的 REPEAT 次数为止(REPEAT 的数字采 8 进位制计算,以 0 为开始)
[:alnum:] :所有字母字符与数字
[:alpha:] :所有字母字符
[:blank:] :所有水平空格
[:cntrl:] :所有控制字符
[:digit:] :所有数字
[:graph:] :所有可打印的字符(不包含空格符)
[:lower:] :所有小写字母
[:print:] :所有可打印的字符(包含空格符)
[:punct:] :所有标点字符
[:space:] :所有水平与垂直空格符
[:upper:] :所有大写字母
[:xdigit:] :所有 16 进位制的数字
[=CHAR=] :所有符合指定的字符(等号里的 CHAR,代表你可自订的字符)

tr常用实例

tr -c -d -s ["string1_to_translate_from"] ["string2_to_translate_to"] < input-file

解释:

  • -c 用字符串1中字符集的补集替换此字符集,要求字符集为ASCII。
  • -d 删除字符串1中所有输入字符。
  • -s 删除所有重复出现字符序列,只保留第一个;即将重复出现字符串压缩为一个字符串。
  • input-file是转换文件名。虽然可以使用其他格式输入,但这种格式最常用。
  1. 将文件file中出现的”abc”替换为”xyz”

     [root@Gin scripts]# cat t.txt
     abc
     [root@Gin scripts]# cat t.txt |tr "abc" "xyz"
     xyz
     [root@Gin scripts]# cat t.txt
     abc
    

    这里,凡是在t.txt文件中出现的”a”字母,都替换成”x”字母,”b”字母替换为”y”字母,”c”字母替换为”z”字母。而不是将字符串”abc”替换为字符串”xyz”。这里的替换不修改源文件

  2. 使用tr命令“统一”字母大小写

     [root@Gin scripts]# cat file
     abc
     [root@Gin scripts]# cat file|tr [a-z] [A-Z]
     ABC
    

    大写转小写只需要把tr后面的参数换个位置即可!

  3. 把文件中的数字0-9替换为a-j

     [root@Gin scripts]# cat file|tr [0-9] [a-j]
     abcdefghij
    
  4. 删除文件file中出现的”Snail”字符

     [root@Gin scripts]# cat file
     what is Snail
     [root@Gin scripts]# cat file|tr -d "Snail"
     wht s
     [root@Gin scripts]# cat file
     what is Snail
    

    这里,凡是在file文件中出现的’S’,’n’,’a’,’i’,’l’字符都会被删除!而不是紧紧删除出现的”Snail”字符串。

  5. 删除文件file中出现的换行’\n’、制表’\t’字符

     cat file | tr -d "\n\t"
    

    不可见字符都得用转义字符来表示的,这个都是统一的。

  6. 删除空行

     cat file | tr -s "\n" > new_file
    
  7. 删除Windows文件“造成”的’^M’字符

     # cat file | tr -d "\r"
     或者
     # cat file | tr -s "\r" "\n"
    

    这里-s后面是两个参数”\r”和”\n”,用后者替换前者

  8. 用空格符\040替换制表符\011

     cat file | tr -s "\011" "\040"
    
  9. 把路径变量中的冒号”:”,替换成换行符”\n”

     echo $PATH | tr -s ":" "\n"
    
  10. 加密解密

    [root@Gin scripts]# echo 12345|tr '0-9' '987654321'  ## 加密
    87654
    [root@Gin scripts]# echo 87654|tr '987654321' '0-9'  ## 解密
    12345
    

    上面是一个非常有趣的小例子,通过映射来实现简单的加密解密,看懂这个例子,可以接着往下看古罗马时期发明的凯撒加密的一种变体ROT13

    [root@Gin scripts]# echo "hi,this is amosli" | tr 'ABCDEFGHIJKLMNOPQRSTUVWXYZabcdefghijklmnopqrstuvwxyz' 'NOPQRSTUVWXYZABCDEFGHIJKLMnopqrstuvwxyzabcdefghijklm'
    uv,guvf vf nzbfyv
    [root@Gin scripts]# echo "uv,guvf vf nzbfyv" | tr 'ABCDEFGHIJKLMNOPQRSTUVWXYZabcdefghijklmnopqrstuvwxyz' 'NOPQRSTUVWXYZABCDEFGHIJKLMnopqrstuvwxyzabcdefghijklm'
    hi,this is amosli
    

    ROT13是它自己本身的逆反;也就是说,要还原ROT13,套用加密同样的算法即可得,故同样的操作可用再加密与解密。非常神奇!

  11. 字符集补集

    tr -c [set1] [set2]
    

    set1的补集意味着从这个集合中包含set1中没有的所有字符。最典型的用法就是从输入文本中将不在补集中的所有字符全部删除。例如:

    [root@Gin scripts]# echo "hello 123 world " | tr -d -c '0-9 \n'
     123
    

    在这里,补集中包含了除数字、空格字符和换行符之外的所有字符,因为指定了-d,所以这些字符全部都会被删除。

  12. 用tr压缩字符

    [root@Gin scripts]# echo "GNU is  not          UNIX . Recursicve right?" | tr -s  ' '
    GNU is not UNIX . Recursicve right?
    

    使用-s参数可以压缩字符串中重复的字符。看另一个例子:

    [root@Gin scripts]# cat sum.txt
    5
    4
    3
    5
    4
    3
    [root@Gin scripts]# cat sum.txt|echo $[ $(tr '\n' '+') 0 ]
    24
    [root@Gin scripts]# cat sum.txt|echo $[ $(tr '\n' '+') ] 
    -bash: 5+4+3+5+4+3+ : syntax error: operand expected (error token is "+ ")
    

    这里,运用tr实现了加法运算, tr ‘\n’ ‘+’使用换行符来替换为’+’然后连接起来,最后多出来一个’+’再接上数字0即实现了加法。

Search

    Table of Contents