首页 诗词 字典 板报 句子 名言 友答 励志 学校 网站地图
当前位置: 首页 > 教程频道 > 开发语言 > 编程 >

《Linux命令行与shell脚本编程大全》 第十九章 学习札记

2013-09-12 
《Linux命令行与shell脚本编程大全》 第十九章 学习笔记第十九章:正则表达式 由于之前我已经写过比较详尽的

《Linux命令行与shell脚本编程大全》 第十九章 学习笔记

第十九章:正则表达式

 

由于之前我已经写过比较详尽的正则教程

深入入门正则表达式(java) - 引言

深入入门正则表达式(java) - 1 - 入门基础 
深入入门正则表达式(java) - 2 - 基本实例

深入入门正则表达式(java) - 3 - 正则在java中的使用

深入入门正则表达式(java) - 匹配原理 - 1 - 引擎分类与普适原则

深入入门正则表达式(java) - 匹配原理 - 2 - 回溯

并且在Unix & Linux 大学教程中的第20章也有笔记,所以这里笔记较为简略,一些简单的示例在这里就不在演示了。

 

什么是正则表达式

定义

正则表达式类型

Linux中,有两种流行的正则表达式引擎:

1.POSIX基本正则表达式(BRE)引擎

2.POSIX扩展正则表达式(ERE)引擎

大多数Linux工具至少符合BRE引擎规范,能够识别所有模式和符号。

一些工具,比如sed只实现了BRE引擎规范的子集。gawk实现了ERE引擎。

 

定义BRE模式

纯文本

特殊字符

斜线(/)不是正则的元字符,但是在sed和gawk中使用,也需要转义

锚字符

下面利用锚点来删除空白行

点字符

字符组

排除字符组

使用区间

特殊字符组

BRE特殊字符组

含义类似于[[:lower:]]小写字母a-z[[:upper:]]大写字母A-Z[[:alpha:]]大小写字母a-zA-Z[[:alnum:]]大小写字母、数字a-zA-Z0-9[[:digit:]]数字0-9[[:punct:]]标点符号-- [[:print:]]匹配任意可打印字符--[[:blank:]]空格或制表符(空白符)--[[:space:]]匹配任意空白字符空格、制表符、NL、FF、VT和CR

一个简单的示例:

这里使用\d是无效的

星号

 

扩展正则表达式

问号

加号

花括号

警告:默认情况下,gawk不识别表达式区间,必须指定--re-interval选项

注意:gawk只支持下面几种形式

{m},{m,n},{m,}

并不支持{,m}

管道符号

聚合表达式

 

实用中的正则表达式

目录文件计数

也和书中一样,我们统计$PATH中的目录含有的文件数目。

其实这里关键的就是把$PATH里的目录变成数组参数而已。

下面是书中的例子,不过这个例子是有问题的:

代码很容易理解。环境变量PATH中的目录是用冒号分割的,现在利用sed,改为空格分割路径,这样就可以直接对此使用循环了。

但是,PATH中的目录是允许重复的!也就是说,你可以把同一个目录多次的加入到这个变量中(虽然这么做没有半点好处),当然,很有可能是其他软件设置的PATH与你自己设置的重复了。不管怎样,我们是不需要重复统计的。

下面是修正后的代码:

这里用换行替换冒号,这样也能直接对此结果使用循环。这么做的好处就是,我们可以使用sort然后使用uniq去重复

验证电话号码

解析邮件地址

 

关于正则更多内容,可以参考我之前的写的教程,里面有详尽的正则基础讲解以及示例。

深入入门正则表达式(java) - 引言

深入入门正则表达式(java) - 1 - 入门基础 
深入入门正则表达式(java) - 2 - 基本实例

深入入门正则表达式(java) - 3 - 正则在java中的使用

深入入门正则表达式(java) - 匹配原理 - 1 - 引擎分类与普适原则

深入入门正则表达式(java) - 匹配原理 - 2 - 回溯

《Unix & Linux 大学教程》 - 第二十章 正则表达式

 

 

转贴请保留以下链接

本人blog地址

http://su1216.iteye.com/

http://blog.csdn.net/su1216/

热点排行