2022-11-19 17:49:02 +08:00
|
|
|
|
---
|
|
|
|
|
title: 数据类型
|
|
|
|
|
description: Python 的数据类型
|
|
|
|
|
keywords:
|
2023-11-09 17:30:33 +08:00
|
|
|
|
- Python
|
|
|
|
|
- 数据类型
|
2022-11-19 17:49:02 +08:00
|
|
|
|
tags:
|
2023-11-09 17:30:33 +08:00
|
|
|
|
- Python/入门
|
2022-11-19 17:49:02 +08:00
|
|
|
|
sidebar_position: 2
|
|
|
|
|
author: 7Wate
|
2023-08-03 20:12:42 +08:00
|
|
|
|
date: 2023-08-03
|
2022-11-19 17:49:02 +08:00
|
|
|
|
---
|
|
|
|
|
|
2023-08-03 20:12:42 +08:00
|
|
|
|
在编程领域,理解和掌握各种数据类型是任何编程语言的基础,Python 也不例外。Python 3 提供了多种内置数据类型,包括但不限于数字(整型、浮点型、复数)、布尔型、列表、元组、字符串、集合、字典等,还有函数、模块等高级类型。每种数据类型都有其特定的特性和适用场景。
|
2022-11-19 17:49:02 +08:00
|
|
|
|
|
2023-11-09 17:30:33 +08:00
|
|
|
|
> 在 Python 中,变量可以被理解为一个标签(tag)或者标记,它是附着在特定对象上的名字。你可以将这个理念理解为在超市里的商品标签,标签告诉你这是什么商品,而商品是具体的物品。同样的,Python 的变量名就像是一个标签,它告诉我们这个变量指向的是什么对象,而对象是存储在内存中的具体数据。
|
2022-12-03 18:18:23 +08:00
|
|
|
|
|
2023-08-03 20:12:42 +08:00
|
|
|
|
## 对象与类型
|
2023-01-17 12:16:43 +08:00
|
|
|
|
|
2023-08-03 20:12:42 +08:00
|
|
|
|
**在 Python 中,几乎所有的数据都可以被视为对象,每一个对象都有其相应的类型。**例如:
|
2023-01-17 12:16:43 +08:00
|
|
|
|
|
2023-08-03 20:12:42 +08:00
|
|
|
|
```python
|
|
|
|
|
print(type(123)) # <class 'int'>
|
|
|
|
|
print(type(3.14)) # <class 'float'>
|
|
|
|
|
print(type('hello')) # <class 'str'>
|
|
|
|
|
```
|
|
|
|
|
|
|
|
|
|
**Python 是动态类型语言,我们不需要预先声明变量的类型。**在程序运行过程中,变量的类型可以根据赋值而改变。例如:
|
|
|
|
|
|
|
|
|
|
```python
|
|
|
|
|
x = 123 # x 是一个整数
|
|
|
|
|
print(type(x)) # <class 'int'>
|
|
|
|
|
|
|
|
|
|
x = 'hello' # x 变成了一个字符串
|
|
|
|
|
print(type(x)) # <class 'str'>
|
|
|
|
|
```
|
|
|
|
|
|
2023-11-09 17:30:33 +08:00
|
|
|
|
Python 中有两个内置函数 `id` 和 `type`。
|
2023-08-03 20:12:42 +08:00
|
|
|
|
|
2023-11-09 17:30:33 +08:00
|
|
|
|
- `id(obj)` 函数:返回对象 `obj` 的唯一标识符,其实质上是该对象在内存中的地址。
|
|
|
|
|
- `type(obj)` 函数:返回对象 `obj` 的类型。
|
2023-08-03 20:12:42 +08:00
|
|
|
|
|
|
|
|
|
### 引用计数和垃圾收集
|
|
|
|
|
|
|
|
|
|
Python 不依赖存储期(即对象在内存中存在的时间)来管理变量和对象,而是**使用引用计数。每个对象都会计算有多少个变量引用了它,当引用计数为 0 时,对象就会被垃圾收集器删除**。可以使用内置的 `id` 函数获取对象的标识(这实际上是该对象的内存地址),使用 `type` 函数获取对象的类型。
|
|
|
|
|
|
|
|
|
|
```python
|
|
|
|
|
# 引用计数和垃圾收集的例子:
|
|
|
|
|
# 在代码中,`sys.getrefcount(a)`可以获得对象`a`的引用计数。
|
|
|
|
|
# 当我们创建一个新的引用`b`时,`a`的引用计数增加1。
|
|
|
|
|
# 当我们删除`b`时,`a`的引用计数减少1。
|
|
|
|
|
|
|
|
|
|
import sys
|
|
|
|
|
|
|
|
|
|
a = [] # 创建一个空列表
|
|
|
|
|
|
|
|
|
|
print(sys.getrefcount(a)) # 输出:2,一个引用来自 a,一个来自 getrefcount 的参数
|
|
|
|
|
|
|
|
|
|
b = a # 增加一个引用
|
|
|
|
|
|
|
|
|
|
print(sys.getrefcount(a)) # 输出:3,新增一个引用来自 b
|
|
|
|
|
|
|
|
|
|
b = None # 删除一个引用
|
|
|
|
|
|
|
|
|
|
print(sys.getrefcount(a)) # 输出:2,b 不再引用
|
|
|
|
|
```
|
|
|
|
|
|
|
|
|
|
### 可变类型、不可变类型
|
|
|
|
|
|
|
|
|
|
Python 中的数据类型可以分为两大类:可变类型与不可变类型。
|
|
|
|
|
|
|
|
|
|
- **可变类型**:值可以更改,如列表、字典和集合。
|
|
|
|
|
- **不可变类型**:值不可更改,如数字、字符串、元组等。
|
|
|
|
|
|
2023-11-09 17:30:33 +08:00
|
|
|
|
不可变类型的变量如果改变值,实际上是生成了一个新的对象,并使变量引用新的对象。Python 的赋值语句复制的是对象的引用,而不是对象的值。因此,Python 中的“变量”与其他编程语言中的“变量”不完全相同,将其翻译为“引用”可能更加合适。
|
2023-08-03 20:12:42 +08:00
|
|
|
|
|
|
|
|
|
```python
|
|
|
|
|
# 在代码中,`list1`是一个列表,是可变类型。
|
|
|
|
|
# 我们可以通过`append`方法修改`list1`,但是`list1`的`id`并未改变,说明`list1`还是同一个对象。
|
|
|
|
|
# `x`是一个整数,是不可变类型。当我们改变`x`的值时,`x`的`id`改变了,说明`x`现在是一个新的对象。
|
|
|
|
|
|
|
|
|
|
# 可变类型:列表
|
|
|
|
|
list1 = [1, 2, 3]
|
|
|
|
|
print(id(list1)) # 输出 list1 的 id
|
|
|
|
|
list1.append(4) # 修改 list1
|
|
|
|
|
print(id(list1)) # id 没有改变
|
|
|
|
|
|
|
|
|
|
# 不可变类型:整数
|
|
|
|
|
x = 1
|
|
|
|
|
print(id(x)) # 输出 x 的 id
|
|
|
|
|
x = x + 1 # 修改 x
|
|
|
|
|
print(id(x)) # id 改变了
|
|
|
|
|
```
|
|
|
|
|
|
|
|
|
|
## Python3 内置类型
|
|
|
|
|
|
2023-11-09 17:30:33 +08:00
|
|
|
|
Python 3 内置了多种数据类型,同时还内建了许多其他类型,如上下文管理器类型、模块、方法、代码对象、类型对象、内部对象等。
|
2023-08-03 20:12:42 +08:00
|
|
|
|
|
|
|
|
|
### 数字类型
|
|
|
|
|
|
|
|
|
|
数字类型主要用于存储和处理数值。这包括整数、浮点数、复数和布尔类型。
|
|
|
|
|
|
|
|
|
|
| 类型 | 描述 | 示例 | 可变性 |
|
|
|
|
|
| ------- | ---------------------------------- | ---------------------- | ------ |
|
|
|
|
|
| int | 整数,无论大小都可以是正数或负数。 | `123`, `-456`, `0` | 不可变 |
|
|
|
|
|
| float | 浮点数,包含小数部分的数字。 | `3.14`, `-0.01`, `9.0` | 不可变 |
|
|
|
|
|
| complex | 复数,包含实部和虚部的数字。 | `1+2j`, `3-4j` | 不可变 |
|
|
|
|
|
|
|
|
|
|
### 布尔类型
|
2023-01-17 12:16:43 +08:00
|
|
|
|
|
2023-08-03 20:12:42 +08:00
|
|
|
|
| 类型 | 描述 | 示例 | 可变性 |
|
|
|
|
|
| ---- | ---------------------- | --------------- | ------ |
|
|
|
|
|
| bool | 布尔,表示真或假的值。 | `True`, `False` | 不可变 |
|
2023-01-17 12:16:43 +08:00
|
|
|
|
|
2023-08-03 20:12:42 +08:00
|
|
|
|
### 序列类型
|
2023-01-17 12:16:43 +08:00
|
|
|
|
|
2023-08-03 20:12:42 +08:00
|
|
|
|
序列类型是一种有序的元素集合,包括字符串、列表和元组。每个元素都有一个相应的索引,可以通过索引来访问。
|
2022-11-19 17:49:02 +08:00
|
|
|
|
|
2023-08-03 20:12:42 +08:00
|
|
|
|
| 类型 | 描述 | 示例 | 可变性 |
|
|
|
|
|
| ----- | ---------------------------------------- | -------------------------- | ------ |
|
|
|
|
|
| str | 字符串,由零个或多个字符组成的文本。 | `'hello'`, `"world"`, `''` | 不可变 |
|
|
|
|
|
| list | 列表,由一系列按特定顺序排列的元素组成。 | `[1, 'two', 3.0]` | 可变 |
|
|
|
|
|
| tuple | 元组,类似于列表,但元素不可更改。 | `(1, 'two', 3.0)` | 不可变 |
|
|
|
|
|
|
|
|
|
|
### 集合类型
|
|
|
|
|
|
|
|
|
|
集合类型是一个无序的元素集合,其中的元素都是唯一的。这包括集合和冻结集合。
|
|
|
|
|
|
|
|
|
|
| 类型 | 描述 | 示例 | 可变性 |
|
|
|
|
|
| --------- | ---------------------------------------- | ---------------------------- | ------ |
|
|
|
|
|
| set | 集合,一组无序的、不重复的元素。 | `{1, 'two', 3.0}` | 可变 |
|
|
|
|
|
| frozenset | 不可变集合,类似于集合,但元素不可更改。 | `frozenset({1, 'two', 3.0})` | 不可变 |
|
|
|
|
|
|
|
|
|
|
### 映射类型
|
|
|
|
|
|
|
|
|
|
映射类型是一个存储键值对的元素集合,其中的键是唯一的。字典就是一个映射类型。
|
|
|
|
|
|
|
|
|
|
| 类型 | 描述 | 示例 | 可变性 |
|
|
|
|
|
| ---- | ---------------------------- | ----------------------------- | ------ |
|
|
|
|
|
| dict | 字典,包含键值对的数据结构。 | `{'name': 'John', 'age': 25}` | 可变 |
|
|
|
|
|
|
|
|
|
|
### 特殊类型
|
|
|
|
|
|
|
|
|
|
| 类型 | 描述 | 示例 | 可变性 |
|
|
|
|
|
| ------------------ | ------------------------------------------------------ | ------------------- | ------ |
|
2023-11-09 17:30:33 +08:00
|
|
|
|
| NoneType | 表示 None 的特殊类型。 | `None` | 不可变 |
|
|
|
|
|
| EllipsisType | 表示省略的特殊类型,主要在切片和 NumPy 库中使用。 | `Ellipsis` 或 `...` | 不可变 |
|
2023-08-03 20:12:42 +08:00
|
|
|
|
| NotImplementedType | 表示未实现方法的特殊类型,主要在自定义比较方法中使用。 | `NotImplemented` | 不可变 |
|
|
|
|
|
|
|
|
|
|
### 二进制类型
|
|
|
|
|
|
|
|
|
|
| 类型 | 描述 | 示例 | 可变性 |
|
|
|
|
|
| ---------- | ------------------------------------------------------------ | ------------------------- | -------------- |
|
2023-11-09 17:30:33 +08:00
|
|
|
|
| bytes | 字节,包含零个或多个范围为 0<=x<256 的整数的不可变序列。 | `b'hello'`, `b'\x01\x02'` | 不可变 |
|
|
|
|
|
| bytearray | 字节数组,包含零个或多个范围为 0<=x<256 的整数的可变序列。 | `bytearray(b'hello')` | 可变 |
|
2023-08-03 20:12:42 +08:00
|
|
|
|
| memoryview | 内存查看,用于访问其他二进制序列、打包的数组和缓冲区的内部数据。 | `memoryview(b'hello')` | 依据所查看对象 |
|
|
|
|
|
|
|
|
|
|
### 类、实例和异常
|
|
|
|
|
|
|
|
|
|
| 类型 | 描述 | 示例 | 可变性 |
|
|
|
|
|
| --------- | ------------------------ | --------------------------- | ---------- |
|
|
|
|
|
| object | 对象,所有类的基类。 | `obj = object()` | 依据具体类 |
|
|
|
|
|
| exception | 异常,程序运行时的错误。 | `raise Exception('Error!')` | 不可变 |
|
|
|
|
|
|
|
|
|
|
### 其他内置类型
|
|
|
|
|
|
|
|
|
|
| 类型 | 描述 | 示例 | 可变性 |
|
|
|
|
|
| --------- | ----------------------------------------------------------- | ------------------------------ | ------ |
|
|
|
|
|
| function | 函数,包含一系列指令的代码块。 | `def greet(): print('Hello!')` | 不可变 |
|
|
|
|
|
| type | 类型,表示对象的类型。 | `type(123)` | 不可变 |
|
|
|
|
|
| generator | 生成器,一种可迭代的对象,由函数定义并使用 `yield` 产生值。 | `(x**2 for x in range(10))` | 不可变 |
|
2022-11-20 19:10:55 +08:00
|
|
|
|
|
|
|
|
|
## 类型转换
|
|
|
|
|
|
2023-11-09 17:30:33 +08:00
|
|
|
|
Python 提供了多种函数,用于在不同类型之间进行转换:
|
2023-08-03 20:12:42 +08:00
|
|
|
|
|
|
|
|
|
```Python
|
|
|
|
|
x = "123" # 这是一个字符串
|
|
|
|
|
print(type(x)) # <class 'str'>
|
|
|
|
|
|
|
|
|
|
x = int(x) # 将字符串转为整数
|
|
|
|
|
print(type(x)) # <class 'int'>
|
|
|
|
|
|
|
|
|
|
x = float(x) # 将整数转为浮点数
|
|
|
|
|
print(type(x)) # <class 'float'>
|
|
|
|
|
```
|
|
|
|
|
|
2022-11-20 19:10:55 +08:00
|
|
|
|
| 函数 | 描述 |
|
|
|
|
|
| :-------------------- | :-------------------------------------------------- |
|
2023-11-09 17:30:33 +08:00
|
|
|
|
| int(x [,base]) | 将 x 转换为一个整数 |
|
|
|
|
|
| float(x) | 将 x 转换到一个浮点数 |
|
2022-11-20 19:10:55 +08:00
|
|
|
|
| complex(real [,imag]) | 创建一个复数 |
|
|
|
|
|
| str(x) | 将对象 x 转换为字符串 |
|
|
|
|
|
| repr(x) | 将对象 x 转换为表达式字符串 |
|
2023-11-09 17:30:33 +08:00
|
|
|
|
| eval(str) | 用来计算在字符串中的有效 Python 表达式,并返回一个对象 |
|
2022-11-20 19:10:55 +08:00
|
|
|
|
| tuple(s) | 将序列 s 转换为一个元组 |
|
|
|
|
|
| list(s) | 将序列 s 转换为一个列表 |
|
|
|
|
|
| set(s) | 转换为可变集合 |
|
2023-11-09 17:30:33 +08:00
|
|
|
|
| dict(d) | 创建一个字典。d 必须是一个 (key, value) 元组序列 |
|
2022-11-20 19:10:55 +08:00
|
|
|
|
| frozenset(s) | 转换为不可变集合 |
|
|
|
|
|
| chr(x) | 将一个整数转换为一个字符 |
|
|
|
|
|
| ord(x) | 将一个字符转换为它的整数值 |
|
|
|
|
|
| hex(x) | 将一个整数转换为一个十六进制字符串 |
|
|
|
|
|
| oct(x) | 将一个整数转换为一个八进制字符串 |
|
2022-11-19 17:49:02 +08:00
|
|
|
|
|
|
|
|
|
## 运算符
|
|
|
|
|
|
2022-11-20 19:10:55 +08:00
|
|
|
|
在实际开发中,如果搞不清楚运算符的优先级,可以**使用括号来确保运算的执行顺序**。
|
2022-11-19 17:49:02 +08:00
|
|
|
|
|
2023-08-03 20:12:42 +08:00
|
|
|
|
```python
|
|
|
|
|
# 运算符
|
|
|
|
|
a = 10
|
|
|
|
|
b = 20
|
|
|
|
|
|
|
|
|
|
print(a + b) # 加法,输出: 30
|
|
|
|
|
print(a - b) # 减法,输出: -10
|
|
|
|
|
print(a * b) # 乘法,输出: 200
|
|
|
|
|
print(a / b) # 除法,输出: 0.5
|
|
|
|
|
print(a ** 2) # 幂运算,输出: 100
|
|
|
|
|
print(a % 3) # 取模,输出: 1
|
|
|
|
|
|
|
|
|
|
# 逻辑运算符
|
|
|
|
|
print(a > b) # 大于,输出: False
|
|
|
|
|
print(a < b) # 小于,输出: True
|
|
|
|
|
print(a == b) # 等于,输出: False
|
|
|
|
|
print(a != b) # 不等于,输出: True
|
|
|
|
|
|
|
|
|
|
# 成员运算符
|
|
|
|
|
s = 'Hello World'
|
|
|
|
|
print('World' in s) # 输出: True
|
|
|
|
|
print('Python' not in s) # 输出: True
|
|
|
|
|
```
|
|
|
|
|
|
2022-11-19 17:49:02 +08:00
|
|
|
|
| 运算符 | 描述 |
|
|
|
|
|
| ------------------------------------------------------------ | ------------------------------ |
|
|
|
|
|
| `[]` `[:]` | 下标,切片 |
|
|
|
|
|
| `**` | 指数 |
|
|
|
|
|
| `~` `+` `-` | 按位取反, 正负号 |
|
|
|
|
|
| `*` `/` `%` `//` | 乘,除,模,整除 |
|
|
|
|
|
| `+` `-` | 加,减 |
|
|
|
|
|
| `>>` `<<` | 右移,左移 |
|
|
|
|
|
| `&` | 按位与 |
|
|
|
|
|
| `^` `|` | 按位异或,按位或 |
|
|
|
|
|
| `<=` `<` `>` `>=` | 小于等于,小于,大于,大于等于 |
|
|
|
|
|
| `==` `!=` | 等于,不等于 |
|
|
|
|
|
| `is` `is not` | 身份运算符 |
|
|
|
|
|
| `in` `not in` | 成员运算符 |
|
|
|
|
|
| `not` `or` `and` | 逻辑运算符 |
|
2023-08-03 20:12:42 +08:00
|
|
|
|
| `=` `+=` `-=` `*=` `/=` `%=` `//=` `**=` `&=` `| =``^=``>>=``<<=` | 赋值运算符 |
|