python 匹配url正则表达式
我现在有一个这样的字符串str1="http://hi.baidu.com/rubylang/blog/item/1661ad50d600c46784352445.html#/html/body/table[1]/tr/td"
怎么写一个表达式来匹配它,需要python语言,并且能够把
http://hi.baidu.com/rubylang/blog/item/1661ad50d600c46784352445.html,跟/html/body/table[1]/tr/td提取出来,
放到两个变量里,url地址不一定就上面那个,可以是其他的url地址,后面的也不一定只是一个table,或者一个也没有,
也可能有很多个
就是要匹配
str2="url地址#/html/.../.../"这样的情况,麻烦各位大侠帮忙,急用,thx
[解决办法]
import rep = re.compile(r'^(https?://\w+(?:\.[^\.]+)+(?:/.+)*/.+\.html' \ '\??(?:[^/]+=[^/]+)?(?:&[^/]+=[^/]+)*)?#?((?:/[^/]+)*)$')string = 'http://topic.csdn.net/u/20100119/10/214eb092-9fed-4a54' \ '-b6d2-1373b2bc40e8.html?seed=1976536804&r=62857463#replyachor'p.findall(string)#返回结果[('http://topic.csdn.net/u/20100119/10/214eb092-9fed-4a54-b6d2' \ '-1373b2bc40e8.html?seed=1976536804&r=62857463#replyachor', '')]