Python中可哈希和不可变

Python中hashable和immutable

初学Python,我们清楚元组对象是不可变的(immutable),字典的键必须是可以哈希的(hashable)。这一讲我们就来好好聊聊这两个概念到底是什么意思。

1. 可变与不可变

首先明确可变与不可变对象,我们默认的是Python的内置对象。自定义的对象我们不去讨论,毕竟Python是一门动态语言,需要的话我们随时可以改变自定义对象的可变性。

Python内置的不可变对象有数字类型、字符串类型、元组等,Python内置的可变对象有列表、字典、集合等。我们是依据什么把其中的一些对象归于可变,又把另一些归于不可变的呢?依据很简单:当改变一个对象的值,如果其id值不变,那么对象是可变类型,反之对象为不可变类型

2. 可哈希对象

先来看一下官方文档上面对hashable的说明:

如果一个对象在其生命周期内有一个固定不变的哈希值 (这需要__hash__()方法) 且可以与其他对象进行比较操作 (这需要__eq__()方法) ,那么这个对象就是可哈希对象 (hashable) 。可哈希对象必须有相同的哈希值才算作相等。

由于字典 (dict) 的键 (key) 和集合 (set) 内部使用到了哈希值,所以只有可哈希 (hashable) 对象才能被用作字典的键和集合的元素。

所有python内置的不可变对象都是可哈希的,同时,可变容器 (比如:列表 (list) 或者字典 (dict) ) 都是不可哈希的。用户自定义的类的实例默认情况下都是可哈希的;它们跟其它对象都不相等 (除了它们自己) ,它们的哈希值来自id()方法。

补充下对象的id值与哈希值之间的关系。首先要知道的是在id值相同的情况下,哈希值必然相同。id唯一确定一个对象,同一个对象哈希值也是唯一的。然后,在id不同的情况下哈希值通常不同,但这个在Python内置的对象里是可以有例外的。

3. 小结

可变与不可变的依据是对象的在Python进程中唯一的ID,可哈希依据的是__hash__和__eq__方法,内置Python基本类型不可变类型都是可哈希的,而可变类型都是不可哈希的。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章