linux的tr命令
tr(translate缩写)主要用于删除文件中的控制字符,或进行字符转换。
语法C1-C2指定了 C1 所指定的字符和 C2 所指定的字符之间(包括 C1 和 C2)进行整理的字符串。C1 所指定的字符必须整理放在由C2 所指定的字符之前。注:在使用本方法指定子范围时,当前语言环境对结果有重要影响。如果需要用命令来产生与语言环境无关的一致结果,则应该避免使用子范围。[C*Number]Number 是一个整数,它指定了由 C 所指定的字符的重复次数。除非其首位数字是 0,否则Number 一律视为是十进制整数;如果首位数字是 0,则视为八进制整数。[C*]用 C 指定的字符填写字符串。该选项只用于包含在 String2 中的字符串末尾,它强制String2 中的字符串具有与由 String1 变量所指定的字符串一样的字符数。*(星号)后面指定的任何字符都被忽略。[ :ClassName: ]指定由当前语言环境中的 ClassName 所命名的字符类中的所有字符。类名可以是下述名称中的任何一种:
alnum loweralpha printblank punctcntrl spacedigit uppergraph xdigit
除 [:lower:] 和[:upper:] 转换字符类之外,其它字符类指定的字符都按未指定的顺序放入数组中。由于未定义字符类指定的字符的顺序,仅当目的为将多个字符映射为一个时才使用这些字符。转换字符类除外。
有关字符类的详细情况,请参阅 ctype 子例程。
[ =C= ]指定所有的字符具有与 C 所指定的字符相同的等价类。\Octal指定字符,其编码由 Octal 所指定的八进制值表示。Octal 可以是 1 位、2 位 或 3 位八进制整数。空字符可以用'\0' 表示,并可以像任何其它的字符那样进行处理。\ControlCharacter指定与 ControlCharacter 所指定的值相应的控制字符。可以表示以下值:退出状态
该命令返回以下出口值:0,输入处理成功;>0 处理产生错误。
示例
这便将每个 {(左大括号)转换成((左小括号),并将每个 }(右大括号)转换成)(右小括号)。所有其它的字符都保持不变。
若要将大括号转换成方括号,请输入:tr '{}' '\[]' < textfile > newfile这便将每个 {(左大括号)转换成[(左方括号),并将每个 }(右大括号)转换成](右方括号)。左方括号必须与一个 "\"(反斜扛)转义字符一起输入。
若要将小写字符转换成大写,请输入:tr 'a-z' 'A-Z' < textfile > newfile若要创建一个文件中的单词列表,请输入:tr -cs '[:lower:][:upper:]' '[\n*]' < textfile > newfile
这便将每一序列的字符(除大、小写字母外)都转换成单个换行符。*(星号)可以使tr 命令重复换行符足够多次以使第二个字符串与第一个字符串一样长。
若要从某个文件中删除所有空字符,请输入:tr -d '\0' < textfile > newfile若要用单独的换行替换每一序列的一个或多个换行,请输入:
tr -s '\n' < textfile > newfile
或
tr -s '\012' < textfile > newfile若要以“?”(问号)替换每个非打印字符(有效控制字符除外),请输入:
tr -c '[:print:][:cntrl:]' '[?*]' < textfile > newfile
这便对不同语言环境中创建的文件进行扫描,以查找当前语言环境下不能打印的字符。
要以单个“#”字符替换 <space> 字符类中的每个字符序列,请输入:tr -s '[:space:]' '[#*]'
一些不错的小例子
1、去除重复的字符
#将连续的几个相同字符压缩为一个字符
$ echo aaacccddd | tr -s [a-z]
acd
$ echo aaacccddd | tr -s [abc]
acddd
2、删除空白行
#删除空白行就是删除换行符/n
#注意:这些空白行上只有回车符,没有空格符,这里用换行符的转义字符\n
#注意:此处用-s删除了多余的换行符,如果用-d,则会删除所有的换行符
$ cat test.txt | tr -s ["\n"]
#也可以用八进制符\012,\012与\n都是换行符
$ cat test.txt | tr -s "[\012]"
3、大小写相互转换
#将语句中所有的小写字母变成大写字母,其中-t可省略
$ echo "Hello World I Love You" |tr -t [a-z] [A-Z]
HELLO WORLD I LOVE YOU
#将语句中所有的大写字母变成小写字母
$ echo "Hello World I Love You" |tr [A-Z] [a-z]
hello world i love you
#也可以利用字符类进行转换
#[:lower:]代表小写字母,[:upper:]代表大写字母
$ echo "Hello World I Love You" |tr [:lower:] [:upper:]
HELLO WORLD I LOVE YOU
4、删除指定的字符
$ cat test.txt
Monday 09:00
Tuesday 09:10
Wednesday 10:11
Thursday 11:30
Friday 08:00
Saturday 07:40
Sunday 10:00
#现在要删除处理星期之外的所有字符
#-d代表删除,[0-9]代表所有的数字,[: ]代表冒号和空格
$ cat test.txt | tr -d "[0-9][: ]"
Monday
Tuesday
Wednesday
Thursday
Friday
Saturday
Sunday
5、利用-c进行补集的替换
#有时候在文本中我们只知道要保留的一些字符,其他字符种类繁多,就可以使用补集的替换
$ cat test.txt
Monday 09:00
Tuesday 09:10
Wednesday 10:11
Thursday 11:30
Friday 08:00
Saturday 07:40
Sunday 10:00
#我们只需要星期,则思路就是除了字母,其他统统替换掉
#这里,-c:用换行符替换掉除了字母外的所有字符;-s:删除多余的换行符
cat test.txt|tr -cs "[a-z][A-Z]" "\n"
Monday
Tuesday
Wednesday
Thursday
Friday
Saturday
Sunday