请问一个正则表达式的问题
我有这样一个文章,内容有100 多M,格式如下
.T 1
testatea
teate
.A
小越,小东
.Context
这是一个小文章
这是
这是
这是
这是
.T 2
哈哈
teate.
。。。。。。。。。
一直重复
.T 1 表示文章1 ,然后第二行开始就是标题
.A 表示作者,
.Context 表示内容
这三个的内容都不知道有多少行, 一直到遇到下一个 . 什么的
这个文件里有几万个文章
请问怎样才能高效的把这一个文件, 按格式(标题,作者,内容) 分成 几万个 单独的文章
我现在的做法是 一行一行的读,然后遇到 . 开始的标识, 就记下来,然后用 StringBuilder 记内容
然后直到遇到下一个 . ....
总感觉效率不好,请问大家有什么好的做法
谢谢了
[解决办法]
Scanner 的 public String next(Pattern pattern) 使用正则 一次 读 一篇文章、、不知道这样可否