如何将具有重复键值的文本数据存入到dict中?
初学python,想把C++的multimap实现的功能用dict来实现,文本数据格式为:
1 2
1 3
1 4
2 3
2 5
4 6
.....
第一列和第二列间用空格隔开,现打算将它存入到dict中,得到dict{1:(2,3,4),2:(3,5),4:(6)},即value部分为一个list。
[解决办法]
楼上稍改:
1. 内容解读独立为生成器函数, 以正则表达式解析;
2. 用dict的setdefault方法替代判断aKey in aDict
#!/usr/bin/env python import repatt = re.compile(r'(\d+)\s+(\d+)')def parser(filename): with open(filename, 'rt') as handle: for ln in handle: m = patt.match(ln) if m: yield map(int, m.groups())aDict = {}for (aKey, aValue) in parser('num.dat'): aDict.setdefault(aKey,[]).append(aValue) print aDict