首页 诗词 字典 板报 句子 名言 友答 励志 学校 网站地图
当前位置: 首页 > 教程频道 > 开发语言 > perl python >

python提取txt文本里的文件

2012-09-17 
python提取txt文本里的资料ss.txt文本有下面一些内容:(1:2:3:代表的是行数)从第6行开始为我们所要的资料--

python提取txt文本里的资料
ss.txt文本有下面一些内容:(1:2:3:代表的是行数)从第6行开始为我们所要的资料---->表示间隔空格
1:Name of Building Year Built
2: Address
3:樓宇名稱 地址 落成年份
4:
5:
6:A. Sun Plaza------->3 San Hop Lane,---->屯門新合里 3 號----->1997
7:*愛善中心------->Tuen Mun
8:
9:A.D. & F.D. of Pok Oi Hospital------->111 So Kwun Wat Rd.,------->屯門------->-
10:Mrs. Cheng Yam On------->Tuen Mun------->掃管笏路 111 號
11:Millennium School
12:博愛醫院歷屆總理聯誼會
13:鄭任安夫人千禧小學
14:
15:Abbey Court------->19-21 On King St.,------->沙田------->1991
16:雅碧閣------->Pictorial Garden Phase 1,------->碧濤花園第 1 期
17: ------->Sha Tin ------->安景街 19-21 號

Abiding School (Nam Pin Wai) DD 115 Nam Pin Wai 元朗十八鄉 -
  遵道學校(南邊圍) House Lot 239, 南邊圍第一巷第 115 約
  1st Lane Nam Pin Wai, 南邊圍屋宇地段
  Shap Pat Heung, Yuen Long 第 239 號

Acacia Villa 60 Cheung Sha Sheung 大嶼山 1997
  Tsuen, Lantau Island 長沙上村 60 號

Admiralty Heights 52 Tai Chung Kiu Rd., 沙田富豪花園 1982
  愛都閣 Belair Gardens, Sha Tin 大涌橋路 52 號


现在要将里面的中英文建筑名称及地址分别提取出来输出到csvfile(2列为Name of Building,address)
例如:英文:
Name of Building address
A. Sun Plaza 3 San Hop Lane,Tuen Mun
A.D. & F.D. of Pok Oi Hospital Mrs. Cheng Yam On Millennium School 111 So Kwun Wat Rd.,
Abbey Court 19-21 On King St., Pictorial Garden Phase 1,Sha Tin  

中文csvfile(2列为大厦名,地址)
大厦名 地址
*愛善中心 屯門新合里 3 號
博愛醫院歷屆總理聯誼會鄭任安夫人千禧小學 屯門掃管笏路 111 號
雅碧閣 沙田碧濤花園第 1 期安景街 19-21 號

由于文本都上传不上来,所以只好自己敲上去
备注:每两条记录之间会有一行空白作为分隔符,特别要注意的是有些建筑物名称或者地址是分在其下方的另一行中(中英文状态下都有)
例如:第一条记录的英文地址就写在了2行, 3 San Hop Lane, 
  Tuen Mun
所以读取时完整的英文地址为:3 San Hop Lane, MunTuen Mun
类似的还有中文大厦名,第二条记录 博愛醫院歷屆總理聯誼會
  鄭任安夫人千禧小學
完整的中文大厦名:博愛醫院歷屆總理聯誼會鄭任安夫人千禧小學

[解决办法]
间隔空格和普通的空格能区分开吗?如果它们一样,就很难处理了。
[解决办法]
看不出格式,估计比较难以处理
[解决办法]
空格直接用空格表示,估计看的顺眼些。
[解决办法]
放到[code=Python][/code]中,空格就会被保留。

热点排行