Java正则表达式(三)、代码量统计工具(统计java源文件中注释、代码、空白行数量)
比如想统计一个Java程序员一天写代码的工作量(如:有效代码多少行、空行多少、注释多少行等),这个小工具也许能做为一个参考的依据。
思路:因为每个java源文件的内容基本包括java语句、空白行、注释三部份组成(不包括注解),所以要统计某个文件这三部份的内容各占多少时,只需写三个匹配这几部份内容的正则表达式即可。然后通过IO流读取文件中的每一行,并根据正则匹配的结果,累加每部份匹配的数量即可。
注释行:单行注释(//)、多行注释、文档注释。正则:((//)|(/\\*+)|((^\\s)*\\*)|((^\\s)*\\*+/))+
空白行:一行内只有空格、\t、\n等非可视字符表示空白行。正则:^\\s*$
代码行:以分号“;“结束为一行有效的代码。正则:(?!import|package).+;\\s*(((//)|(/\\*+)).*)*
实现方式:
1、用户在控制台输入要统计的java文件路径或目录
2、根据路径创建一个File对象,判断文件是否有效,并给出提示。最后将文件和IO流绑定
3、循环读取文件中的某一行,并根据正则匹配的结果累记每部份匹配的数量