请教如何解析文本或字符串中的信息
现碰到一项目(猎头软件),是将简历导入到数据库中,简历有多种格式的,比如说有文本文件、HTML、WORD等等。
要求,选择简历文件,然后系统自动分析简历中内容,将姓名、生日、学历、工作经验等分类对应数据库中的表导入到数据库中。
我现在的思路是,将各类文档中的内容提取出来,然后解析内容。
但不知道如何解析文本内容
比如解析以下内容(格式可以很乱,比如“姓 名:”中间可以没空格,也可以没有“姓 名:”):
姓 名: 孙三 性 别: 男
出生日期: 1981年11月9日 居 住 地: 武汉市
工作年限: 二年以上 户 口: 湖北
电子邮件: sunsan@126.com
家庭电话: 086- 027- 82834323
系统就会自获取到 姓名是“孙三”,性别是“男”。
[解决办法]
首先用StringReaplce把空格都去掉,
然后足行寻找文字,应该是有规律的.
[解决办法]
删除空格后
逐行分析
用正则表达式取数据