本文共 7039 字,大约阅读时间需要 23 分钟。
来源:
最近使用Python的过程中遇到了一些坑,例如用datetime.datetime.now()
这个可变对象作为函数的默认参数,模块循环依赖等等。
在此记录一下,方便以后查询和补充。
在使用函数的过程中,经常会涉及默认参数。在Python中,当使用可变对象作为默认参数的时候,就可能产生非预期的结果。
下面看一个例子:
def append_item(a = 1, b = []): b.append(a) print b append_item(a=1)append_item(a=3)append_item(a=5)
结果为:
[1][1, 3][1, 3, 5]
从结果中可以看到,当后面两次调用append_item
函数的时候,函数参数b并没有被初始化为[]
,而是保持了前面函数调用的值。
之所以得到这个结果,是因为在Python中,一个函数参数的默认值,仅仅在该函数定义的时候,被初始化一次。
下面看一个例子证明Python的这个特性:
class Test(object): def __init__(self): print("Init Test") def arg_init(a, b = Test()): print(a) arg_init(1) arg_init(3) arg_init(5)
结果为:
Init Test135
从这个例子的结果就可以看到,Test
类仅仅被实例化了一次,也就是说默认参数跟函数调用次数无关,仅仅在函数定义的时候被初始化一次。
对于可变的默认参数,我们可以使用下面的模式来避免上面的非预期结果:
def append_item(a = 1, b = None): if b is None: b = [] b.append(a) print b append_item(a=1)append_item(a=3)append_item(a=5)
结果为:
[1][3][5]
Python的作用域解析顺序为Local、Enclosing、Global、Built-in,也就是说Python解释器会根据这个顺序解析变量。
看一个简单的例子:
global_var = 0def outer_func(): outer_var = 1 def inner_func(): inner_var = 2 print "global_var is :", global_var print "outer_var is :", outer_var print "inner_var is :", inner_var inner_func() outer_func()
结果为:
global_var is : 0outer_var is : 1inner_var is : 2
在Python中,关于作用域有一点需要注意的是,在一个作用域里面给一个变量赋值的时候,Python会认为这个变量是当前作用域的本地变量。
对于这一点也是比较容易理解的,对于下面代码var_func
中给num
变量进行了赋值,所以此处的num
就是var_func
作用域的本地变量。
num = 0def var_func(): num = 1 print "num is :", num var_func()
但是,当我们通过下面的方式使用变量的时候,就会产生问题了:
num = 0def var_func(): print "num is :", num num = 1 var_func()
结果如下,之所以产生这个错误,就是因为我们在var_func
中给num
变量进行了赋值,所以Python解释器会认为num
是var_func
作用域的本地变量,但是当代码执行到print "num is :", num
语句的时候,num
还是未定义。
UnboundLocalError: local variable 'num' referenced before assignment
上面的错误还是比较明显的,还有一种比较隐蔽的错误形式如下:
li = [1, 2, 3]def foo(): li.append(4) print li foo()def bar(): li +=[5] print li bar()
代码的结果为:
[1, 2, 3, 4]UnboundLocalError: local variable 'li' referenced before assignment
在foo
函数中,根据Python的作用域解析顺序,该函数中使用了全局的li
变量;但是在bar
函数中,对li
变量进行了赋值,所以li
会被当作bar
作用域中的变量。
对于bar
函数的这个问题,可以通过global
关键字。
li = [1, 2, 3]def foo(): li.append(4) print li foo()def bar(): global li li +=[5] print li bar()
在Python中,有类属性和实例属性。类属性是属于类本身的,被所有的类实例共享。
类属性可以通过类名访问和修改,也可以通过类实例进行访问和修改。但是,当实例定义了跟类同名的属性后,类属性就被隐藏了。
看下面这个例子:
class Student(object): books = ["Python", "JavaScript", "CSS"] def __init__(self, name, age): self.name = name self.age = age pass wilber = Student("Wilber", 27)print "%s is %d years old" %(wilber.name, wilber.age)print Student.booksprint wilber.bookswilber.books = ["HTML", "AngularJS"]print Student.booksprint wilber.booksdel wilber.booksprint Student.booksprint wilber.books
代码的结果如下,起初wilber
实例可以直接访问类的books
属性,但是当实例wilber
定义了名称为books
的实例属性之后,wilber
实例的books
属性就“隐藏”了类的books
属性;当删除了wilber
实例的books
属性之后,wilber.books
就又对应类的books
属性了。
Wilber is 27 years old['Python', 'JavaScript', 'CSS']['Python', 'JavaScript', 'CSS']['Python', 'JavaScript', 'CSS']['HTML', 'AngularJS']['Python', 'JavaScript', 'CSS']['Python', 'JavaScript', 'CSS']
当在Python值使用继承的时候,也要注意类属性的隐藏。对于一个类,可以通过类的__dict__
属性来查看所有的类属性。
当通过类名来访问一个类属性的时候,会首先查找类的__dict__
属性,如果没有找到类属性,就会继续查找父类。但是,如果子类定义了跟父类同名的类属性后,子类的类属性就会隐藏父类的类属性。
看一个例子:
class A(object): count = 1 class B(A): pass class C(A): pass print A.count, B.count, C.count B.count = 2print A.count, B.count, C.count A.count = 3print A.count, B.count, C.count print B.__dict__print C.__dict__
结果如下,当类B
定义了count
这个类属性之后,就会隐藏父类的count
属性:
1 1 11 2 13 2 3{'count': 2, '__module__': '__main__', '__doc__': None}{'__module__': '__main__', '__doc__': None}
一般来说,在Python中,类实例属性的访问规则算是比较直观的。
但是,仍然存在一些不是很直观的地方,特别是对C++和Java程序员来说,更是如此。
在这里,我们需要明白以下几个地方:
1.Python是一门动态语言,任何实体都可以动态地添加或删除属性。
2.一个类定义了一个作用域。
3.类实例也引入了一个作用域,这与相应类定义的作用域不同。
4.在类实例中查找属性的时候,首先在实例自己的作用域中查找,如果没有找到,则再在类定义的作用域中查找。
5.在对类实例属性进行赋值的时候,实际上会在类实例定义的作用域中添加一个属性(如果还不存在的话),并不会影响到相应类中定义的同名属性。
下面看一个例子,加深对上述几点的理解:
class A: cls_i = 0 cls_j = {} def __init__(self): self.instance_i = 0 self.instance_j = {}在这里,我们先定义类A的一个实例a,然后再看看类A的作用域和实例a的作用域中分别有什么:
>>> a = A()>>> a.__dict__{'instance_j': {}, 'instance_i': 0}>>> A.__dict__{'__init__': , '__module__': '__main__', 'cls_i': 0, 'cls_j': {}, '__doc__': None}
我们看到,a的作用域中有instance_i和instance_j,A的作用域中有cls_i和cls_j。
我们再来看看名字查找是如何发生的:
>>> a.cls_i0>>> a.instance_i0
在查找cls_i的时候,实例a的作用域中是没有它的,却在A的作用域中找到了它;在查找instance_i的时候,直接可在a的作用域中找到它。 如果我们企图通过实例a来修改cls_i的值,那会怎样呢:
>>> a.cls_i = 1>>> a.__dict__{'instance_j': {}, 'cls_i': 1, 'instance_i': 0}>>> A.__dict__{'__init__': , '__module__': '__main__', 'cls_i': 0, 'cls_j': {}, '__doc__': None}
我们可以看到,a的作用域中多了一个cls_i属性,其值为1;同时,我们也注意到A作用域中的cls_i属性的值仍然为0;在这里,我们其实是增加了一个实例属性,并没有修改到类属性。
如果我们通过实例a操纵cls_j中的数据(注意不是cls_j本身),又会怎么样呢:
>>> a.cls_j['a'] = 'a'>>> a.__dict__{'instance_j': {}, 'cls_i': 1, 'instance_i': 0}>>> A.__dict__{'__init__': , '__module__': '__main__', 'cls_i': 0, 'cls_j': {'a': 'a'}, '__doc__': None}
我们可以看到a的作用域没有发生什么变化,但是A的作用域发生了一些变化,cls_j中的数据发生了变化。
实例的作用域发生变化,并不会影响到该类的其它实例,但是类的作用域发生变化,则会影响到该类的所有实例,包括在这之前创建的实例:
>>> A.cls_k = 0>>> i.cls_k0http://www.cnblogs.com/frydsh/p/3194710.html
在Python中,tuple是不可变对象,但是这里的不可变指的是tuple这个容器总的元素不可变(确切的说是元素的id),但是元素的值是可以改变的。
tpl = (1, 2, 3, [4, 5, 6])print id(tpl)print id(tpl[3])tpl[3].extend([7, 8])print tplprint id(tpl)print id(tpl[3])
代码结果如下,对于tpl
对象,它的每个元素都是不可变的,但是tpl[3]
是一个list
对象。也就是说,对于这个tpl
对象,id(tpl[3])
是不可变的,但是tpl[3]
确是可变的。
3676457638639896(1, 2, 3, [4, 5, 6, 7, 8])3676457638639896
在对Python对象进行赋值的操作中,一定要注意对象的深浅拷贝,一不小心就可能踩坑了。
当使用下面的操作的时候,会产生浅拷贝的效果:
使用copy模块里面的浅拷贝函数copy():
import copywill = ["Will", 28, ["Python", "C#", "JavaScript"]]wilber = copy.copy(will)print id(will)print willprint [id(ele) for ele in will]print id(wilber)print wilberprint [id(ele) for ele in wilber]will[0] = "Wilber"will[2].append("CSS")print id(will)print willprint [id(ele) for ele in will]print id(wilber)print wilberprint [id(ele) for ele in wilber]
使用copy模块里面的深拷贝函数deepcopy():
import copywill = ["Will", 28, ["Python", "C#", "JavaScript"]]wilber = copy.deepcopy(will)print id(will)print willprint [id(ele) for ele in will]print id(wilber)print wilberprint [id(ele) for ele in wilber]will[0] = "Wilber"will[2].append("CSS")print id(will)print willprint [id(ele) for ele in will]print id(wilber)print wilberprint [id(ele) for ele in wilber]
在Python中使用import
导入模块的时候,有的时候会产生模块循环依赖,例如下面的例子,module_x
模块和module_y
模块相互依赖,运行module_y.py
的时候就会产生错误。
# module_x.pyimport module_y def inc_count(): module_y.count += 1 print module_y.count # module_y.pyimport module_xcount = 10def run(): module_x.inc_count() run()
其实,在编码的过程中就应当避免循环依赖的情况,或者代码重构的过程中消除循环依赖。
当然,上面的问题也是可以解决的,常用的解决办法就是把引用关系搞清楚,让某个模块在真正需要的时候再导入(一般放到函数里面)。
对于上面的例子,就可以把module_x.py
修改为如下形式,在函数内部导入module_y
:
# module_x.pydef inc_count(): import module_y module_y.count += 1 print module_y.count