learning at 20190821 13:00

vodaka · vodaka · commit eecd8277a980 · 2019-08-21T13:33:24.000+08:00
diff --git a/python3_programming_tricks/cha02/2-4.py b/python3_programming_tricks/cha02/2-4.py
@@ -0,0 +1,41 @@
+
+from random import randint
+
+data = [randint(0,20) for _ in range(30)]
+
+d = dict.fromkeys(data,0)
+
+for x in data:
+    d[x] += 1
+
+#sorted([(v,k) for k,v in d.items()], reverse=True)
+sorted(((v,k) for k,v in d.items()), reverse=True)
+
+# 前3个
+sorted(((v,k) for k,v in d.items()), reverse=True)[:3]
+
+import heapq
+
+heapq.nlarest(3,((v,k) for k,v in d.items()))
+
+
+# solution2
+
+from collections import Counter
+
+c = Counter(data)
+c.most_common(3)
+
+# 英文文章词频统计
+
+import re
+
+txt = open('example.txt').read()
+
+# 使用正则将文本切割，使用非字母字符进行切割
+
+word_list = re.split('\W+',txt)
+c2 = Counter(word_list)
+# 频度最高的前10个
+c2.most_common(10)
+
diff --git a/python3_programming_tricks/cha02/2-5.py b/python3_programming_tricks/cha02/2-5.py
@@ -0,0 +1,27 @@
+from random import randint, simple
+sample('abcdefgh',randint(3,6))
+
+# 第1轮
+
+d1 = {k: randint(1,4) for k insample('abcdefgh',randint(3,6))}
+# 第2轮
+d2 = {k: randint(1,4) for k insample('abcdefgh',randint(3,6))}
+# 第3轮
+d3 = {k: randint(1,4) for k insample('abcdefgh',randint(3,6))}
+
+# solution 1
+# find 公共键
+
+[k for k in d1 if k in d2 and k in d3]
+
+dl = [d1,d2,d3]
+
+[for k in dl[0] if all(map(lambda d: k in d, dl[1:]))]
+
+# solution 2
+
+# python3 中reduce不是内置函数，在functools标准库中。Python2是内置函数，
+
+from functools import reduce
+
+reduce(lambda a, b: a & b ,map(dict.keys,dl))
diff --git a/python3_programming_tricks/cha02/2_datasture_tops.md b/python3_programming_tricks/cha02/2_datasture_tops.md
@@ -64,4 +64,38 @@
 
 sorted(d.items(), key=lambda item: item[1], reverse=True)
 
+## 2.4 如何统计序列中元素的频度
+
+**实际案例**
+
+1 某随机序列中，找到出现次数最高的3个元素，他们出现的次数是多少
+2 对某英文文章的单词，进行词频统计，找到出现次数最高的10个单词，它们出现的次数是多少
+
+**解决方案**
+
+方案1：将序列转换为字典{元素:频度}，根据字典中的值排序
+
+这种方法不是很好，如果列表很大，需要将整个列表排序，而我们只需要最大前3个，这样显然是很浪费的
+在很大的列表中找到很小的前3个，通常会使用堆，python中也有实现，heapq
+
+方案2：使用标准库collections中的Counter对象
+
+## 2.5 如何快速找到多个字典的公共键key
+
+**实际案例**
+
+西班牙足球甲级联赛，每轮球员进球统计：
+第1轮：{'苏亚雷斯':1,'梅西':2,'本泽马':1,...}
+第2轮：{'苏亚雷斯':2,'C罗':1,'格里兹曼':2,...}
+第3轮：{'苏亚雷斯':1,'托雷斯','贝尔':1,...}
+.....
+
+统计出前N轮，每场比赛都有进球的球员
+
+**解决方案**
+
+领用集合set的交集操作
+step1:使用字典的keys()方法，得到一个字典keys的集合
+step2:使用map函数，得到每个字典keys的集合
+step3:使用reduce函数，取所有字典的keys集合的交集