python-lambda之sort-key

5,425次阅读

共计 3370 个字符，预计需要花费 9 分钟才能阅读完成。

用 Python 时间也算不短了，但总感觉自己在用写 C++ 代码的思维写 Python，没有真正用到其作为脚本语言的优势。之前刷 LeetCode 时，自己的 Python 代码总是很长，很像披着 Python 外衣的 C++ 代码（放在这里，不断重构中）。

想来大概是因为觉得python简单，平时只是零零碎碎的学习，也没有去读别人的代码，导致掌握的不够深入。回想起前段时间的面试，面试官看我简历写熟悉Python，就问了两个Python的问题：

Python 中常用的优化技巧（能够提升 Python 执行效率的，除了算法层面）
按照 value 从小到大输出 dict 中的 key-value值。

我支支吾吾半天，就是没有答到点上，直接导致被拒（后来整理的内容放在这里）。所谓知耻而后勇，经过一段时间对 Python 的重新学习，才慢慢发现 Python 的一些强大与美妙之处。

程序中经常用到排序函数，Python 提供了 sort 和 sorted 函数，一个原地排序，一个返回排序后的新结果，函数原型很简单

1	sort([cmp[, key[, reverse]]])

自己用的最多的类似下面的语句：

1

2

3

4

>>> l = [43, 12, 4, 6]

>>> l.sort()

>>> l

[4, 6, 12, 43]

曾经窃以为这就体现了 Python 的简单优雅，不像 C++ STL中那样还需要指定迭代器范围，然后对 sort 的理解也就止步于此。后来遇到稍微复杂一点的排序场景，自己就 Google-Stackoverflow-Copy，解决了眼前的问题，但是从来没有去深挖（这也就导致那次面试中中没有回答出来上面的第二个问题）。

后来去看了下 sort 的函数说明，包括 cmp, key, reverse 参数究竟怎么去用，又写了几个例子，以为这下子对 sort 可谓是理解透彻了。比如要要根据值的大小输出字典内容，那么就可以像下面这样优雅地解决：

1

2

3

>>> d = {1: ‘z’, 2:‘y’, 3: ‘x’}

>>> print sorted(d.items(), key=lambda x: x[1])

[(3, ‘x’), (2, ‘y’), (1, ‘z’)]

我甚至可以得到一个根据value排序的字典，只需要用 collections.OrderedDict 即可：

1

2

3

4

>>> from collections import OrderedDict

>>> sorted_d = OrderedDict(sorted(d.items(), key=lambda x: x[1]))

>>> sorted_d

OrderedDict([(3, ‘x’), (2, ‘y’), (1, ‘z’)])

我以为我对 sort 理解足够了，直到在 hackerrank 遇到这个题目。

给定一个只包含大小写字母，数字的字符串，对其进行排序，保证：

所有的小写字母在大写字母前面
所有的字母在数字前面
所有的奇数在偶数前面

考虑用 sort 函数来完成排序。开始之前，再来看看文档对sort函数中key的说明：

key parameter to specify a function to be called on each list element prior to making comparisons. The value of the key parameter should be a function that takes a single argument and returns a key to use for sorting purposes.

通俗讲，key 用来决定在排序算法中 cmp 比较的内容，key 可以是任何可被比较的内容，比如元组（python 中元组是可被比较的）。所以上面的排序问题可以用下面的代码来解决：

1

2

3

>>> s = “Sorting1234”

>>> “”.join(sorted(s, key=lambda x: (x.isdigit(), x.isdigit() and int(x) % 2 == 0, x.isupper(), x.islower(), x)))

‘ginortS1324’

这里，lambda 函数将输入的字符转换为一个元组，然后 sorted 函数将根据元组（而不是字符）来进行比较，进而判断每个字符的前后顺序。

如果同样的程序用 C++ 来写的话，可能需要一个复杂的仿函数，来定义排序的规则，远没有 Python 这般简洁优雅。

Python 是一门简单方便的语言，相信这是大部分人对 Python 的第一感觉。初学 Python，我们可能痴迷于 Python 的列表解析，list 切片，字典推导，或者是陶醉在各种强大的第三方库里，比如网络库 requests，科学计算库 numpy，web开发框架 Django 等。

但是实际写程序中，我们经常会写出许多繁杂的、丑陋的Python代码。比如要判断一个数字是否是回文数字，可能会习惯性地写出下面这样的代码：

1

2

3

4

5

6

7

8

9

def isPalindrome(x):

if x < 0:

return False

reversed_x = 0

original_x = x

while x > 0:

reversed_x = reversed_x * 10 + x % 10

x /= 10

return reversed_x == original_x

仔细一看，这简直就是 C++ 代码，完全没有 Python 的优雅与简单。那么，该怎样写才能够显的 Pythonic 呢？其实，用 Python 的话只要一行就可以啦（这里不考虑效率，如果考虑效率的话，C++会更加合适，单对这题来说，其实有比上面更高效的方法）！

1 2	def isPalindrome(x): return x >= 0 and str(x) == str(x)[::–1]

那么如何养成用 Pythonic 的思维解决问题呢？我觉得首先要对 Python 十分熟悉，精通大部分函数以及 Python 的特色：比如装饰器，迭代器，生成器以等，下面举几个简单的例子：

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

21

22

23

24

25

26

27

28

29

30

31

32

33

34

35

36

37

# 函数式编程

>>> nums = map(int, “123456789” )

>>> nums

[1, 2, 3, 4, 5, 6, 7, 8, 9]

>>> reduce(lambda x, y: x+y, [1, 2, 3, 4, 5])

15

>>> sum(nums)

45

# 生成器

>>> mygenerator = (x*x for x in range(3))

>>> for i in mygenerator:

... print i

...

0

1

4

>>> for i in mygenerator:

... print i

...

# lambda 匿名函数

>>> c = lambda *z: z

>>> c( 10, ‘test’)

(10, ‘test’)

# 迭代

>>> l = [i**2 for i in range(9)]

>>> l_iter = iter(l)

>>> next(l_iter)

0

>>> next(l_iter)

1

>>> next(l_iter)

4

# 数据结构 set

>>> set_a = set([i for i in range(1,9,2)])

>>> set_b = set([i for i in range(0,9,2)])

>>> print set_a | set_b

set([0, 1, 2, 3, 4, 5, 6, 7, 8])

其次，要多读一些 Pythonic 的代码，学习别人如何优雅地使用python。这里我推荐去看 Leetcode 的 Discuss，里面有许多惊才艳艳的代码。特别推荐 @StefanPochmann，许多代码让我获益匪浅，比如这里对 iter() 的使用。

再来看一个问题，按照二进制位反转 32 位的一个整形无符号数字。用 Python 可以写出很简单直观的代码，如下：

1

2

3

4

def reverseBits(n):

bit_str = ‘{0:032b}’.format(n)

reverse_str = bit_str[::–1]

return int(reverse_str, 2)

当然，上面不考虑效率，这里有一个利用分治法思想的高效的方法。

Python 是一门高效、简单、方便的语言，但这并不意味你不花时间就可以用的很好。

转载自http://python.jobbole.com/85025/

正文完

请博主喝杯咖啡吧！

Python

发表至： Python

2016-05-17

转载说明：除特殊说明外本站文章皆由CC-4.0协议发布，转载请注明出处。

pandas删除列

快速熟悉numpy，101 个 NumPy 的常用代码

开源Polynote：一个受IDE启发的多语言notebook

最小二乘与最大似然参数估计及Python实现

双线性插值(Bilinear Interpolation)

python-lambda之sort-key

从排序说起！

sort 之美

sort 之魅

再探 Python