Python3 列表 – 菜鸟教程-菜鸟网博客-为草根创业提供网络知识

在 Python 3 中，列表 (List) 是最基础、最强大且最常用的数据结构之一。它是一个有序的、可变的 (Mutable) 序列，能够容纳任意类型的对象（包括数字、字符串、甚至其他列表），并且支持动态扩容。

为了让你全面、深入地掌握 Python 3 的列表，本文将从基础语法、高级操作、底层原理、性能分析到最佳实践进行全方位、详尽的解析。（本文篇幅较长，旨在提供一份可作为参考手册的深度指南）

一、列表的创建与初始化

在 Python 中，创建列表有多种方式，选择合适的方式不仅能提高代码可读性，还能优化性能。

1. 基础创建方式

使用方括号 [] 是最直观的方法。

plaintext

# 空列表
empty_list = []
empty_list_2 = list()  # 使用构造函数，效果相同

# 包含不同类型元素的列表 (异构)
mixed_list = [1, "hello", 3.14, True, [1, 2]]

# 使用 list() 构造函数将其他可迭代对象转换为列表
chars = list("Python")      # ['P', 'y', 't', 'h', 'o', 'n']
nums = list(range(5))       # [0, 1, 2, 3, 4]
tuple_to_list = list((1, 2, 3)) # [1, 2, 3]

2. 列表推导式 (List Comprehension) 🌟

这是 Python 最具特色的语法之一，用于基于现有可迭代对象快速生成新列表。它比使用 for 循环和 append() 更简洁，且执行速度更快（因为在 C 语言层面进行了优化）。

plaintext

# 基础用法：生成 0-9 的平方
squares = [x**2 for x in range(10)]
# 等价于:
# squares = []
# for x in range(10):
#     squares.append(x**2)

# 带条件过滤：只保留偶数的平方
even_squares = [x**2 for x in range(10) if x % 2 == 0]  # [0, 4, 16, 36, 64]

# 嵌套循环：生成坐标对
coords = [(x, y) for x in range(2) for y in range(2)] 
# [(0, 0), (0, 1), (1, 0), (1, 1)]

# 复杂表达式：字符串处理
words = ["  apple ", "BANANA", "cherry  "]
cleaned = [word.strip().lower() for word in words]  # ['apple', 'banana', 'cherry']

3. ⚠️ 核心避坑：列表乘法与浅拷贝陷阱

使用 * 运算符可以快速初始化包含重复元素的列表，但对于可变对象（如嵌套列表），这会引发严重的引用共享问题。

plaintext

# ✅ 正确：不可变对象（如整数、字符串）的重复
zeros = [0] * 5  # [0, 0, 0, 0, 0]

# ❌ 错误：可变对象的重复 (所有子列表指向同一个内存地址)
bad_matrix = [[0] * 3] * 3  
bad_matrix[0][0] = 99
print(bad_matrix)  
# 输出: [[99, 0, 0], [99, 0, 0], [99, 0, 0]] (全部被修改了！)

# ✅ 正确做法：使用列表推导式创建独立的子列表
good_matrix = [[0] * 3 for _ in range(3)]
good_matrix[0][0] = 99
print(good_matrix)  
# 输出: [[99, 0, 0], [0, 0, 0], [0, 0, 0]] (只有第一个被修改)

二、列表的访问与切片 (Slicing)

列表是有序序列，支持通过索引和切片来访问元素。

1. 索引 (Indexing)

索引从 0 开始。Python 也支持负数索引，-1 表示最后一个元素，-2 表示倒数第二个，依此类推。

plaintext

my_list = ['a', 'b', 'c', 'd', 'e']
print(my_list[0])   # 'a'
print(my_list[4])   # 'e'
print(my_list[-1])  # 'e'
print(my_list[-3])  # 'c'

# ⚠️ 索引越界会抛出 IndexError
# print(my_list[10])  # IndexError: list index out of range

2. 切片 (Slicing)

切片语法为 list[start:stop:step]。

start：起始索引（包含），默认为 0。
stop：结束索引（不包含），默认为列表长度。
step：步长，默认为 1。可以为负数，表示反向遍历。

plaintext

nums = [0, 1, 2, 3, 4, 5, 6, 7, 8, 9]

print(nums[2:5])      # [2, 3, 4] (索引 2, 3, 4)
print(nums[:4])       # [0, 1, 2, 3] (从头开始)
print(nums[6:])       # [6, 7, 8, 9] (直到末尾)
print(nums[:])        # [0, 1, ..., 9] (浅拷贝整个列表)

# 步长用法
print(nums[::2])      # [0, 2, 4, 6, 8] (每隔一个取一个)
print(nums[::-1])     # [9, 8, 7, 6, 5, 4, 3, 2, 1, 0] (经典反转列表方法)
print(nums[5:1:-1])   # [5, 4, 3, 2] (反向切片，start 必须大于 stop)

# 💡 切片越界是安全的，不会报错，只会返回尽可能多的元素或空列表
print(nums[5:100])    # [5, 6, 7, 8, 9]

3. 切片赋值 (Slice Assignment)

切片不仅可以用于读取，还可以用于就地修改列表，甚至改变列表的长度。这是 Python 列表非常强大的特性。

plaintext

letters = ['a', 'b', 'c', 'd', 'e']

# 替换部分元素
letters[1:4] = ['X', 'Y']  
print(letters)  # ['a', 'X', 'Y', 'e'] (长度从 5 变成了 4)

# 在中间插入元素 (不删除原有元素)
letters[2:2] = ['M', 'N'] 
print(letters)  # ['a', 'X', 'M', 'N', 'Y', 'e']

# 删除部分元素 (等价于 del letters[1:3])
letters[1:3] = []
print(letters)  # ['a', 'N', 'Y', 'e']

三、列表的增、删、改、查操作

1. 增加元素 (Add)

append(x): 在列表末尾添加一个元素。均摊时间复杂度 $O(1)$。
extend(iterable): 将另一个可迭代对象中的所有元素追加到列表末尾。时间复杂度 $O(k)$，k 为追加元素的个数。
insert(i, x): 在指定索引 i 处插入元素 x。时间复杂度 $O(N)$，因为需要移动后续所有元素。

plaintext

lst = [1, 2]
lst.append(3)          # [1, 2, 3]
lst.extend([4, 5])     # [1, 2, 3, 4, 5]
lst.insert(0, 0)       # [0, 1, 2, 3, 4, 5] (在头部插入，效率较低)

性能提示：如果需要频繁在列表头部添加元素，不要使用 list，应改用 collections.deque。

2. 删除元素 (Remove)

pop([i]): 移除并返回索引为 i 的元素。如果不提供 i，默认移除并返回最后一个元素。时间复杂度：尾部弹出 $O(1)$，中间/头部弹出 $O(N)$。
remove(x): 移除列表中第一个值为 x 的元素。如果不存在，抛出 ValueError。时间复杂度 $O(N)$。
del: Python 语句，可通过索引或切片删除元素，甚至删除整个列表变量。
clear(): 清空列表中的所有元素，使其变为 []。

plaintext

lst = ['a', 'b', 'c', 'b', 'd']

# pop
last = lst.pop()       # last='d', lst=['a', 'b', 'c', 'b']
first = lst.pop(0)     # first='a', lst=['b', 'c', 'b']

# remove
lst.remove('b')        # 移除第一个 'b', lst=['c', 'b']
# lst.remove('z')      # ValueError: list.remove(x): x not in list

# del
del lst[0]             # lst=['b']
del lst[:]             # 清空列表内容，等价于 lst.clear()

# clear
lst.clear()            # lst=[]

3. 修改元素 (Update)

通过索引或切片直接赋值即可（如前文“切片赋值”所示）。

plaintext

lst = [10, 20, 30]
lst[1] = 99            # [10, 99, 30]

4. 查找元素 (Search)

in / not in: 检查元素是否存在。返回布尔值。时间复杂度 $O(N)$。
index(x[, start[, end]]): 返回第一个值为 x 的元素的索引。可限定搜索范围。找不到则抛出 ValueError。
count(x): 返回元素 x 在列表中出现的次数。

plaintext

colors = ['red', 'green', 'blue', 'green']

print('green' in colors)        # True
print(colors.index('blue'))     # 2
print(colors.index('green', 2)) # 3 (从索引 2 开始找)
print(colors.count('green'))    # 2

四、列表的排序与反转

Python 的列表排序基于 Timsort 算法（一种结合了归并排序和插入排序的稳定排序算法），时间复杂度为 $O(N \log N)$。

1. 就地排序：`list.sort()`

直接修改原列表，不返回新列表（返回 None），节省内存。

plaintext

nums = [5, 2, 9, 1, 5, 6]
nums.sort()
print(nums)  # [1, 2, 5, 5, 6, 9] (默认升序)

nums.sort(reverse=True)
print(nums)  # [9, 6, 5, 5, 2, 1] (降序)

# 使用 key 参数进行自定义排序 (极其强大)
words = ["banana", "pie", "Washington", "book"]
# 按字符串长度排序
words.sort(key=len)
print(words)  # ['pie', 'book', 'banana', 'Washington']

# 按字典列表的某个键排序
students = [{'name': 'Alice', 'age': 22}, {'name': 'Bob', 'age': 20}]
students.sort(key=lambda x: x['age'])
print(students)  # [{'name': 'Bob', 'age': 20}, {'name': 'Alice', 'age': 22}]

2. 返回新列表：`sorted()`

内置函数 sorted(iterable) 接受任何可迭代对象，返回一个新的已排序的列表，不修改原对象。

plaintext

original = (5, 2, 9)  # 元组是不可变的，不能用 .sort()
new_list = sorted(original)
print(new_list)       # [2, 5, 9]
print(original)       # (5, 2, 9) (保持不变)

3. 反转列表

list.reverse(): 就地反转，时间复杂度 $O(N)$，无返回值。
reversed(list): 返回一个反向迭代器，节省内存，需配合 list() 转换。
list[::-1]: 切片反转，会创建一个全新的列表副本，消耗额外内存。

五、列表的进阶操作与内置函数

1. 常用内置函数

plaintext

nums = [10, 20, 30, 40]
print(len(nums))   # 4 (元素个数)
print(max(nums))   # 40 (最大值)
print(min(nums))   # 10 (最小值)
print(sum(nums))   # 100 (求和，要求元素支持加法)

2. `enumerate()`: 同时获取索引和值

在遍历列表时，如果需要同时知道元素的索引，不要使用 range(len(list))，这是反模式。应使用 enumerate。

plaintext

fruits = ['apple', 'banana', 'cherry']
for index, value in enumerate(fruits, start=1):  # start 默认为 0
    print(f"第 {index} 个水果是 {value}")

3. `zip()`: 并行遍历多个列表

将多个列表对应位置的元素打包成元组。

plaintext

names = ['Alice', 'Bob', 'Charlie']
scores = [85, 92, 78]

for name, score in zip(names, scores):
    print(f"{name}: {score}")

# zip 还可以用于将二维列表转置 (Unzipping)
matrix = [[1, 2, 3], [4, 5, 6], [7, 8, 9]]
transposed = list(zip(*matrix))
print(transposed)  # [(1, 4, 7), (2, 5, 8), (3, 6, 9)]

六、列表的底层原理与内存管理 (深度解析)

理解底层原理有助于写出高性能的 Python 代码。在 CPython 实现中，列表并不是链表 (Linked List)，而是动态数组 (Dynamic Array)。

1. 动态数组与指针

Python 的列表在底层是一个 C 结构体，包含三个核心部分：

ob_size: 列表中当前实际存储的元素个数。
allocated: 底层数组已分配的内存容量。
ob_item: 一个 C 语言数组，存储的是指向 Python 对象的指针，而不是对象本身。

这意味着，列表 [1, "a", [2, 3]] 在内存中存储的是三个指针，分别指向内存中不同位置的整数对象、字符串对象和列表对象。这也是为什么列表可以容纳异构数据，且列表的 append 操作相对较快的原因。

2. 扩容机制 (Over-allocation)

当向列表添加元素（如 append）导致 ob_size 超过 allocated 时，Python 会触发扩容。
为了避免每次添加元素都重新分配内存（这会导致 $O(N)$ 的时间复杂度），Python 采用过度分配策略。它会申请一块比当前需求更大的新内存，将旧数据复制过去，然后释放旧内存。
CPython 的扩容公式大致为：new_allocated = (new_size >> 3) + (new_size < 9 ? 3 : 6)。
这使得 append 操作的均摊时间复杂度 (Amortized Time Complexity) 降为 $O(1)$。

3. 浅拷贝 (Shallow Copy) vs 深拷贝 (Deep Copy)

由于列表存储的是引用，拷贝列表时需要特别注意。

plaintext

import copy

original = [1, 2, [3, 4]]

# 1. 赋值 (=)：仅仅是创建了新的引用，指向同一个对象
ref = original
ref[0] = 99
print(original[0])  # 99 (original 也被修改了)

# 2. 浅拷贝 (Shallow Copy)：创建新列表，但内部元素仍是原对象的引用
# 方法有：list.copy(), list[:], copy.copy()
shallow = original.copy()
shallow[0] = 100
print(original[0])  # 99 (第一层修改不影响原列表)
shallow[2][0] = 999
print(original[2][0]) # 999 (⚠️ 嵌套的可变对象被同步修改了！)

# 3. 深拷贝 (Deep Copy)：递归地复制所有层级的对象，完全独立
deep = copy.deepcopy(original)
deep[2][0] = 0
print(original[2][0]) # 999 (原列表不受任何影响)

最佳实践：如果列表只包含不可变对象（如数字、字符串），浅拷贝完全足够且性能更好；如果包含嵌套的列表或字典，且需要独立修改，必须使用 copy.deepcopy。

七、性能分析与最佳实践 (Big-O 复杂度总结)

操作	平均时间复杂度	说明
索引访问 `list[i]`	$O(1)$	直接通过内存偏移量计算，极快。
尾部追加 `append`	$O(1)$	均摊复杂度，得益于动态数组的过度分配。
尾部弹出 `pop()`	$O(1)$	无需移动其他元素。
头部插入/删除 `insert(0, x)` / `pop(0)`	$O(N)$	性能杀手：需要移动底层数组中的所有后续元素。
查找 `in` / `index` / `remove`	$O(N)$	需要线性遍历列表。
排序 `sort` / `sorted`	$O(N \log N)$	基于高度优化的 Timsort 算法。
切片 `list[a:b]`	$O(K)$	K 为切片长度，需要创建新列表并复制引用。

🌟 核心最佳实践清单：

避免在循环中使用 + 拼接列表

plaintext

   # ❌ 反模式：每次 + 都会创建新列表并复制所有元素，总体复杂度 O(N²)
   result = []
   for i in range(10000):
       result = result + [i] 

   # ✅ 模式 1：使用 append (均摊 O(1)，总体 O(N))
   result = []
   for i in range(10000):
       result.append(i)

   # ✅ 模式 2：使用列表推导式 (最快，C 层面优化)
   result = [i for i in range(10000)]

优雅地判断列表是否为空
在 Python 中，空列表的布尔值为 False。

plaintext

   my_list = []
   # ❌ 不推荐
   if len(my_list) == 0:
       pass
   # ✅ 推荐 (Pythonic)
   if not my_list:
       print("列表为空")

频繁的首部操作请使用 collections.deque
如果你需要实现队列 (Queue)，频繁使用 insert(0, item) 或 pop(0)，列表的 $O(N)$ 性能会成为瓶颈。应使用双端队列 deque，其首部操作的时间复杂度为 $O(1)$。

plaintext

   from collections import deque
   dq = deque([1, 2, 3])
   dq.appendleft(0)  # O(1)
   dq.popleft()      # O(1)

使用 list.sort() 而不是 sorted() 处理大型列表
如果不需要保留原列表的顺序，优先使用就地排序的 list.sort()，因为它不需要分配新列表的内存，速度更快且更节省内存。

八、总结

Python 3 的列表是一个功能完备、高度优化的动态数组。它通过简洁的语法（如切片、推导式）和强大的内置方法，极大地提升了开发效率。掌握列表的关键不仅在于记住 API，更在于理解其可变性、引用机制以及底层动态扩容原理，从而在面对不同场景（如海量数据处理、频繁首部操作）时，能够选择最优的数据结构和操作方式。

当你熟练掌握了列表后，下一步可以自然过渡到学习其“不可变”的兄弟——元组 (Tuple)，以及专为快速查找和去重设计的集合 (Set)。如果你对列表的某个特定高级应用（如多维列表处理、与 NumPy 数组的对比）有疑问，欢迎随时深入探讨！

一、 列表的创建与初始化

1. 基础创建方式

2. 列表推导式 (List Comprehension) 🌟

3. ⚠️ 核心避坑：列表乘法与浅拷贝陷阱

二、 列表的访问与切片 (Slicing)

1. 索引 (Indexing)

2. 切片 (Slicing)

3. 切片赋值 (Slice Assignment)

三、 列表的增、删、改、查操作

1. 增加元素 (Add)

2. 删除元素 (Remove)

3. 修改元素 (Update)

4. 查找元素 (Search)

四、 列表的排序与反转

1. 就地排序：list.sort()

2. 返回新列表：sorted()

3. 反转列表

五、 列表的进阶操作与内置函数

1. 常用内置函数

2. enumerate(): 同时获取索引和值

3. zip(): 并行遍历多个列表

六、 列表的底层原理与内存管理 (深度解析)

1. 动态数组与指针

2. 扩容机制 (Over-allocation)

3. 浅拷贝 (Shallow Copy) vs 深拷贝 (Deep Copy)

七、 性能分析与最佳实践 (Big-O 复杂度总结)

🌟 核心最佳实践清单：

八、 总结

延伸阅读

Python3 命名空间和作用域

Python3 面向对象

Python3 错误和异常

发表回复 取消回复

一、列表的创建与初始化

二、列表的访问与切片 (Slicing)

三、列表的增、删、改、查操作

四、列表的排序与反转

1. 就地排序：`list.sort()`

2. 返回新列表：`sorted()`

五、列表的进阶操作与内置函数

2. `enumerate()`: 同时获取索引和值

3. `zip()`: 并行遍历多个列表

六、列表的底层原理与内存管理 (深度解析)

七、性能分析与最佳实践 (Big-O 复杂度总结)

八、总结

发表回复取消回复