shell编程及linux常用命令札记 - 1

2012-07-03

shell编程及linux常用命令笔记 - 1?Much thanks to Classic Shell Scripting??#chapter 2 shell basic1.

shell编程及linux常用命令笔记 - 1

Much thanks to Classic Shell Scripting

#chapter 2 shell basic

1. 访问脚本从命令行接收到的参数：$n
在脚本中使用 $1 访问第一个参数，$2访问第二个，当超过9时，用大括号引起来，如 ${10}。

2. 在shell脚本执行时，使用-x打开脚本执行跟踪功能。如: $ sh -x nusers.sh

3. 列出系统所支持的所有语言: locale -a

#chapter 3 search and substitution

4. shell BRE(Basic RE) and ERE(Extended RE)正则表达式简记：
\? 关闭或者打开后续字符的特殊意义
.? 匹配任何单个字符，初NUL外
*? 匹配在它之前的任何数目的单个字符
+? 1个或多个(ERE only)
?? 0个或多个(ERE only)
^? 表示一行的开始，在[^...]里面表示取反
$? 表示一行的结尾
[...]? 匹配方括号内的任一单个字符
{n}? 匹配前面单个字符出现n次(ERE，在BRE中需要使用转义\{n\})
{n,m}? 出现至少n次，最多m次
()? 表示一个实例(ERE only)
|? 匹配之前或之后的正则表达式(ERE only)

注意：在BRE下，^$只在起始和结束处具有特殊意义，在其他位置如39.8$killo就表示$本身。

5. 向后引用: backreferences
如，$ab$$cd$[def]*\2\1 可以匹配abcdcdab, abcdeeecdab, abcdffcdab, ...向后引用最多可以有9个

6. POSIX字符集: [:alpha:]
[:alnum:]? 数字字符，如123
[:alpha:]? 字母字符，如abcDEF
[:lower:]? 小写字母字符，如abc
[:upper:]? 大写字母字符，如DEF
[:blank:]? 空格space于定位tab字符
……更多
$ grep -E ^[[:alpha:]]\{3\} data.txt
hello, world.
abcDEFdefABC

7. ERE(Extended RE)
没有向后引用。
区间表达不需要\{\}，直接使用abc{3,5}，表示c出现3到5次
?? 表示0个或一个前置RE
+? 1个或多个
*? 与BRE相同，0个或多个
|? 交替，匹配这个序列或那个序列或... read|write｜listen
() 分组，(abc){3,5}表示abc出现3到5次，但不包括括号()本身，

8. 额外的GNU正则表达式运算符: \w
\w? 匹配任何单词组成的字符
\W? 匹配任何非单词组成的字符，^\w

9. 进行文本查找替换: sed(steam editor)
sed s/regexp/replacement/
$ sed 's/:.*/:******/' data.txt
hello, world.
abcDEFdefABC
password:******
another password:******
上面命令把冒号(:)后面的所有内容替换成6个星号(*)，sed s/regexp/replacement/中的/作为一个定界符，任何可以显示的字符都可以，如
sed s;regexp;replacement;
sed s:regexp:replacement:
sed s,regexp,replacement,
……等
$ find /home/owen/test/todelete/ -type d -print |
sed 's;/home/owen/test/todelete;/home/owen/test/todel;' |
sed 's/^/mkdir /' |
sh -x
+ mkdir /home/owen/test/todel/
+ mkdir /home/owen/test/todel/xyz
该命令首先找出/home/owen/test/todelete/这个目录下的所有目录，包括这个目录自身，然后把todelete替换成todel，得到如下结果：
/home/owen/test/todel/
/home/owen/test/todel/xyz
然后在每行前面加上"mkdir "命令创建新的目录。所实现的功能类似cp。

10. 查看系统的密码信息: /etc/passwd
$ more /etc/passwd
owen:x:1000:1000:owen,,,:/home/owen:/bin/bash
每行都是以:分隔的7个字段，分别表示
owen 用户名称
x? 加密后的密码
1000? 用户ID编号
1000? 用户组ID编号
owen,,,? 用户姓名，附加其他信息，如联系方式等
/home/owen? 用户的根目录
/bin/bash? 登录的shell类型

11. 从文本中剪贴部分内容: cut
$ cut -d : -f 1,5 /etc/passwd | grep -E ^m
man:man
mail:mail
messagebus:
mysql:MySQL Server,,,
-d 表示分割符，-f 表示field

12. 连接2个文件，基于字段：join
join quotas.sorted sales.sorted
使用两个文件中第一个字段进行连接，如
quotas.sorted
a b
sales.sorted
a c
连接之后，为a b c
当然可以指定连接的key， -1 2 -2 5，参考manual

13. 重新编排字段: awk
$ ls -l | awk '{ print $8, $5, $1}' | sort
data.txt 67 -rw-r--r--
finduser 88 -rwxr-xr-x
merge-sales.sh 363 -rwxr-xr-x
note.sh 36 -rwxr-xr-x
nusers 60 -rwxr-xr-x
quotas 58 -rw-r--r--
sales 71 -rw-r--r--
? total
这里先列出当前目录下的文件，然后使用awk显示文件名，大小，权限，最后进行排序显示。
awk默认使用空格作为分隔字符。
$ ls -l | awk '{ printf "%s %s\t %s\n", $1, $5, $8}' | sort
其基本模式如下：

#chapter 4 text process tools

14. 文本排序: sort
$ sort -t : -k 3,3 /etc/passwd
-t指定分隔符，-k指定从哪个字段到哪个字段作为key进行排序

15. 去除重复: uniq
$ sort uniq-data | uniq -c
????? 2 duo
????? 3 tres
????? 1 unus
消除重复，可以控制显示重复的或是未重复的记录

16. 简单的文本格式化命令: fmt
$ more data.txt | fmt -w 50
hello, world.? abcDEFdefABC password:123456
another password:666888

string sort\nbased on lines delimilated by new
line sign
格式化成每行最多50个字符

17. 计算行数、字数和字符数: wc
/usr/share/dict$ more words | grep ^herb | wc -lwc
???? 17????? 17???? 165

18. 查看标准输入的前n条记录，或是文件列表中的前n条，或后n条: head, tail
head -n 5 /etc/passwd
sed -e 5q /etc/passwd
显示倒数n条，一般用来查看最近的日志记录
tail -n 5 /etc/passwd

#chapter 5 the magic power of pipe

19. 文字解谜好帮手puzzle-help.sh文件: example
FILES="
??????? /usr/dict/words
??????? /usr/share/dict/words
????? "
pattern="$1"
egrep -h -i "$pattern" $FILES 2> /dev/null | sort -u -f
使用这个脚本来进行查找具有10个字母的单词，以b开头，第7位不是x就是y：
$ sh puzzle-help.sh '^b.{5}[xy].{3}$' | fmt
beatifying Birdseye's blarneying Brooklyn's Bulawayo's
等价于使用命令：
/usr/share/dict$ more words | egrep -i? '^b.{5}[xy].{3}$'| sort
beatifying
Birdseye's
blarneying
Brooklyn's
Bulawayo's

20. 转换或者删除字符：tr
tr [ options ] source-char-list replace-char-list
-c 取source-char-list的反义，即对没有出现在source-char-list中的字符进行转换或删除
-d 删除source-char-list里出现的字符，如删除所有元音字母：
echo hello world | tr -d [aeiou]
hll wrld
-s 浓缩重复的字符，如：
echo hello world | tr -s l
helo world
一般会组合来使用，如全部转换成小写字符，所有非字母字符转换成换行符号
echo heLLo WorLd? 123 End | tr A-Z a-z | tr -cs A-Za-z '\n'
hello
world
end
这里没有包括数字，如果需要包括，则添加A-Za-z0-9就可以了

21. 统计一篇文章中单词出现频率: wf
tr -cs A-Za-z0-9 '\n' |???? 将非字母字符转换成换行符号，-cs参考第20条笔记
? tr A-Z a-z |????????????? 全部转换成小写字母
??? sort |????????????????? 排序
????? uniq -c |???????????? 统计频率，结果： 13 the等
??????? sort -k1,1nr -k2 |? 首先只取第一个field即数字，按照数字顺序-n逆序-r排序，再对单词以字典顺序排序
????????? sed ${1:-25}q???? ${1}获取命令行的第一个参数，如果没有默认为25，后面q表示退出程序

${1:-25}是shell里面的一个参数展开形式，具体如下:
${var:-default-var}
展开方式是：首先查找${var}，如果找到，值就为${var}，如果没有找到，值就等于default-var

使用(需要chmod +x wf，然后把wf放到$PATH路径下)，使用频率最高的：
man awk | wf | pr -c4 -t -w80
??? 292 the??? ??? ??? ?69 are??? ??? ???? 50 0??? ??? ??? ?40 mawk
??? 169 and??? ??? ??? ?69 string??? ?? 49 s??? ??? ??? ?40 n
??? 168 is??? ??? ??? ?65 1??? ??? ?????? 48 expr??? ?? 39 be
??? 155 a??? ??? ??? ?? 64 if??? ??? ???? 45 as??? ???? 38 awk
??? 124 of??? ??? ??? ?52 for??? ??? ???? 45 or??? ???? 38 file
??? 118 to??? ??? ??? ?52 with??? ???? 40 an??? ???? 38 i
???? 80 in
pr命令，打印格式化，page column for printing
-c4 表示column4，相当于word的分栏操作，这里设置为4栏
-t? 表示不显示页头和页尾，如果没有这个，就是一张打印纸那么大
-w80? 设置页面宽度，这里是80个字符

最低的呢：
$ man awk | wf 99999 | tail -n 25 | pr -c4 -t -w80
????? 1 typically?? ??? ? 1 under??? ????? 1 values??? ??? ??? ? 1 wc
????? 1 u??? ??? ??? ??????? 1 underscores 1 variations? ??? ? 1 we
????? 1 unaltered?? ??? ? 1 unlike??? ??? 1 variety??? ??? ??? ? 1 whidbey
????? 1 unambiguous ??? ? 1 unnecessary 1 vdiesp??? ??? ??? ? 1 writing
????? 1 unbuffered? ??? ? 1 unsafe??? ??? 1 vertical??? ??? ? 1 xaxbxcx
????? 1 unchanged?? ??? ? 1 usually??? ??? 1 via??? ??? ??? ????? 1 xhh
????? 1 undefined
我的path
echo $PATH
/home/owen/bin:/usr/local/sbin:/usr/local/bin:/usr/sbin:/usr/bin:/sbin:/bin

这个程序比较有意思，我们可以算出awk手册里使用了多少个不重复的单词，才1014个，99999这个数没有实际意义，只是很大而已
$ man awk | wf 99999 | wc -l
1014

高频词汇（频率在5次以上，包括5次）个数，尽然是这么得少！
$ man awk | wf 99999 | awk '$1 >= 5' | wc -l
220

22. 学以致用: 标记和自动目录生成
$ more shell笔记.txt | grep -E '#'

#chapter 2 shell basic
#chapter 3 search and substitution
#chapter 4 text process tools
#chapter 5 the magic power of pipe

more shell笔记.txt | grep -E '^[0-9]+\.' | sed 's/^/@-/'
@-1. 访问脚本从命令行接收到的参数：$n
@-2. 在shell脚本执行时，使用-x打开脚本执行跟踪功能。如: $ sh -x nusers.sh
@-3. 列出系统所支持的所有语言: locale -a
@-4. shell BRE(Basic RE) and ERE(Extended RE)正则表达式简记：
@-5. 向后引用: backreferences
@-6. POSIX字符集: [:alpha:]
@-7. ERE(Extended RE)
@-8. 额外的GNU正则表达式运算符: \w
@-9. 进行文本查找替换: sed(steam editor)
@-10. 查看系统的密码信息: /etc/passwd
@-11. 从文本中剪贴部分内容: cut
@-12. 连接2个文件，基于字段：join
@-13. 重新编排字段: awk
@-14. 文本排序: sort
@-15. 去除重复: uniq
@-16. 简单的文本格式化命令: fmt
@-17. 计算行数、字数和字符数: wc
@-18. 查看标准输入的前n条记录，或是文件列表中的前n条，或后n条: head, tail
@-19. 文字解谜好帮手puzzle-help.sh文件: example
@-20. 转换或者删除字符：tr
@-21. 统计一篇文章中单词出现频率: wf
@-22. 学以致用: 标记和自动目录生成

使用sed命令给每条数据添加一个@-前缀，以便与真正的目录混淆。

#chapter 6 variables, repetitions

23. 设置或修改环境变量: export
PATH=$PATH:/home/owen/bin
export PATH
打印环境变量export -p

24. 从shell中删除变量于函数: unset
$ foo=123
$ echo $foo
123
$ unset foo
$ echo $foo
使用unset -f function_name删除函数，默认为-v即删除变量

25. 参数展开: ${varname:-word}
替换运算：
${varname:-word}? 如果varname存在且非Null,则返回其值；否则返回word。用途: 如果变量未定义，则使用默认值

${varname:=word}? 如果varname存在且非Null,则返回其值；否则设置它的值为word，并返回其值。用途: 如果变量未定义，则设置变量为默认值

${varname:+word}? 如果varname存在且非Null,则返回word；否则返回null。用途: 为测试变量的存在。

${varname:?message}? 如果varname存在且非Null,则返回其值；否则显示varname:message，并退出当前命令或脚本。用途: 捕捉由于变量未定义所导致的错误
$ echo ${vars:?"undefined, pls check it"}
bash: vars: undefined, pls check it

注意上面的${varname:-word}每个冒号(:)都是可选的，如果没有冒号，条件变为“如果varname存在”，也就是可以为空

更多模式匹配
$ p=/home/jwu/cases/long.file.name
$ echo $p
/home/jwu/cases/long.file.name

${variable#pattern}? 如果模式匹配于变量的开头处，则删除匹配的最短部分，返回剩下的部分
$ echo ${p#/*/}
jwu/cases/long.file.name

${variable##pattern}? 如果模式匹配于变量的开头处，则删除匹配的最长部分，返回剩下的部分
$ echo ${p##/*/}
long.file.name

${variable%pattern}? 如果模式匹配于变量的结尾处，则删除匹配的最短部分，返回剩下的部分
$ echo ${p%.*}
/home/jwu/cases/long.file

${variable%%pattern}? 如果模式匹配于变量的结尾处，则删除匹配的最长部分，返回剩下的部分
$ echo ${p%%.*}
/home/jwu/cases/long

注意，这里使用的pattern，以及shell里其他的地方，如case语句等，不同于前面正则表达式的模式匹配。如上，这里*代表任何一个符号，而.只代表点号本身。

26. POSIX标准化字符从长度运算符: ${#variable}返回$variable值的长度
$ d=diversification
$ echo $d
diversification
$ echo ${#d}
15

27. shell特殊变量，访问参数: $#, $@, $*
设置参数:　$ set -- hello "hi there" greeting
$#? 传递到shell脚本或函数的参数总数
$@? 传递进来的命令行参数，置于双引号("")内，会展开为个别的参数
$ for i in $@
> do echo i is $i
> done
i is hello
i is hi
i is there
i is greeting
注意上面的hi there之间的空格丢失了
$ for i in "$@"
> do echo i is $i
> done
i is hello
i is hi there
i is greeting
加上""会得到每个参数
$*? 传递进来的命令行参数，置于双引号("")内，会展开为一个单独的参数

28. shell运算符与C语言类似: + - * /
运算置于$((...))之内，注意是圆括号
具体参考运算表
例:
$((3 && 2))
1
$ echo $((3 > 2))
1
$ echo $((3 > 4))
0
$ echo $(( (3 > 2) || (3 > 4) ))
1
与C及其衍生语言C++, Java, and awk等相同，非0值表示true。

29. 退出状态: $?
$ echo hello
hello
$ echo $?
0
$ e s
e: command not found
$ echo $?
127
POSIX的结束状态
0??? 命令成功退出
其他状态都是失败退出，如
127? 命令找不到

可以在shell脚本中传递一个退出值给它的调用者，如exit 42

30. 判断语句: if-elif-else-fi
if pipeline
then ...
elif pipeline
then ...
else ...
fi

31. 逻辑判断: NOT, AND, OR
NOT? if ! (...)
AND? (...) && (...)
OR?? (...) || (...)

32. test命令: if...
if [ $# -ne 1 ]
then
? echo Usage: finduser username >&2
? exit 1
fi
主要的数字比较有
-eq? equal
-ne? not equal
-lt? less than
-gt? great than
-le? less or equal
-ge? great or equal

#chapter 7 input/output, file, and commands execute

??? to be continue...

热点排行