Python3 模块 – 菜鸟教程-菜鸟网博客-为草根创业提供网络知识

在 Python 3 中，模块（Module） 和 包（Package） 是组织代码、实现代码复用和避免命名冲突的核心机制。简单来说，一个 .py 文件就是一个模块，而包含多个模块的文件夹就是一个包。

下面我将从基础导入语法、核心机制、包的组织结构到最佳实践，为你系统梳理 Python 3 的模块系统。

一、导入模块的 5 种方式

Python 提供了灵活的 import 语句，不同的方式适用于不同的场景。

1. 导入整个模块 (`import module`)

最安全、最推荐的方式。命名空间清晰，不会污染当前作用域。

import math
import random

print(math.sqrt(16))       # 必须带上模块名前缀
print(random.randint(1, 10))

2. 导入特定对象 (`from module import name`)

当你只需要模块中的某几个函数或类时，可以省略模块前缀，使代码更简洁。

from math import sqrt, pi

print(sqrt(16))  # 直接使用，无需 math. 前缀
print(pi)

⚠️ 注意：如果导入的名称与当前文件中的变量同名，会发生覆盖。

3. 使用别名 (`import ... as ...` / `from ... import ... as ...`)

用于解决命名冲突，或为过长的模块名提供简写（业界惯例）。

import numpy as np
import pandas as pd
from datetime import datetime as dt

now = dt.now()

4. 导入包中的所有公开对象 (`from module import *`)

强烈不推荐在生产代码中使用。它会将该模块中所有不以下划线 _ 开头的名称全部导入当前命名空间，极易造成命名冲突，且让代码难以追踪来源。

# ❌ 糟糕的实践
from os import * 
print(path.join("a", "b")) # 读者很难知道 path 来自哪里

5. 动态导入 (`importlib`)

在运行时根据字符串名称动态加载模块（高级用法，常用于插件系统）。

import importlib

module_name = "math"
math_module = importlib.import_module(module_name)
print(math_module.ceil(3.14))  # 输出: 4

二、核心机制：`name == 'main'`

这是 Python 模块中最重要的惯用法。它用于判断当前文件是被直接运行，还是被作为模块导入。

# file: my_script.py

def helper_function():
    return "I am a helper"

def main():
    print("程序开始运行...")
    print(helper_function())

# 👇 关键判断
if __name__ == '__main__':
    # 只有当直接运行 `python my_script.py` 时，这里的代码才会执行
    # 如果被其他文件 `import my_script`，这里的代码会被跳过
    main()

为什么需要它？
它允许你编写既可以作为独立脚本运行（进行测试或执行），又可以作为模块被其他程序安全导入（只导出函数/类，不执行副作用代码）的文件。

三、包 (Packages) 的组织结构

当项目变大时，你需要将多个模块组织成目录，这就是包。

1. 标准包结构示例

my_project/
│
├── main.py                 # 程序入口
│
└── my_package/             # 这是一个包 (目录)
    ├── __init__.py         # 包的初始化文件 (Python 3.3+ 可选，但推荐保留)
    ├── utils.py            # 模块 1
    └── database/           # 子包 (子目录)
        ├── __init__.py
        └── connector.py    # 模块 2

2. `init.py` 的作用

标识包：告诉 Python 解释器这个目录应该被视为一个包。
控制导出：可以在其中定义 __all__ 列表，限制 from my_package import * 时导出的内容。
简化导入：可以在 __init__.py 中提前导入子模块，让用户可以直接从包级别导入。

  # my_package/__init__.py
  from .utils import format_data  # 提前暴露

  __all__ = ["format_data"]       # 明确允许被 * 导入的内容

3. 绝对导入 vs 相对导入

绝对导入（推荐）：从项目的根目录或 sys.path 开始写完整路径。清晰易懂。

  from my_package.database.connector import connect_db

相对导入：使用 . (当前目录) 或 .. (上级目录)。只能在包内部使用，直接运行该文件会报错 (ImportError: attempted relative import with no known parent package)。

  # 在 my_package/utils.py 中
  from .database.connector import connect_db  # 导入同级目录下的子包模块
  from ..main import some_func                # 导入上级目录的模块

四、模块搜索路径 (`sys.path`)

当你执行 import xxx 时，Python 会按照以下顺序查找模块：

内置模块（如 sys, math）。
当前脚本所在的目录。
环境变量 PYTHONPATH 中指定的目录。
Python 安装目录下的 site-packages（通过 pip install 安装的第三方库都在这里）。

你可以通过 sys 模块查看或临时修改搜索路径：

import sys
print(sys.path)

# 临时添加自定义目录到搜索路径 (不推荐作为长期解决方案)
sys.path.append('/path/to/my/custom/modules')

五、 Python 3 高频标准库模块推荐

掌握以下模块，能解决 80% 的日常开发需求：

类别	推荐模块	核心用途
系统与路径	`pathlib`	现代 Python 首选。面向对象的文件系统路径操作 (替代老旧的 `os.path`)。
系统与进程	`os`, `sys`	环境变量、命令行参数 (`sys.argv`)、退出程序 (`sys.exit`)。
数据处理	`json`, `csv`	序列化/反序列化 JSON 和 CSV 文件。
日期时间	`datetime`, `zoneinfo`	时间计算、格式化。Python 3.9+ 推荐使用内置的 `zoneinfo` 处理时区。
正则表达式	`re`	复杂的字符串匹配和提取。
网络请求	`urllib`	内置的基础 HTTP 客户端 (复杂场景建议用第三方库 `requests` 或 `httpx`)。
并发编程	`concurrent.futures`	简化多线程 (`ThreadPoolExecutor`) 和多进程 (`ProcessPoolExecutor`) 编程。

pathlib 现代用法示例：

from pathlib import Path

# 创建路径对象
p = Path("my_folder/data.txt")

# 检查是否存在
if p.exists():
    # 读取文件 (自动处理编码和关闭)
    content = p.read_text(encoding="utf-8")

# 拼接路径 (跨平台兼容，自动处理 / 和 \)
new_p = p.parent / "backup" / p.name

六、最佳实践与避坑指南

警惕循环导入 (Circular Import)

现象：A.py 导入 B.py，而 B.py 又导入 A.py，导致 ImportError。
解法：
- 重构代码，将共同依赖的部分提取到第三个模块 C.py 中。
- 将 import 语句移到函数或方法内部（延迟导入）。
- 使用 import module 而不是 from module import name。

始终使用虚拟环境 (Virtual Environment)

不要在全局 Python 环境中安装第三方包。使用 python -m venv venv 创建隔离环境，避免不同项目的模块版本冲突。

为自定义模块添加 Docstring 和 Type Hints

良好的模块应该在文件开头包含文档字符串，说明该模块的用途。
结合 typing 模块，让导入你模块的人能享受 IDE 的智能提示。

   """
   用户认证相关工具模块。
   """
   def verify_token(token: str) -> bool:
       """验证 JWT token 是否有效"""
       pass

第三方包管理

使用 requirements.txt 或现代的 pyproject.toml (配合 pip, poetry, uv 等工具) 来精确记录项目依赖的模块及其版本。

如果你想了解如何发布自己的 Python 模块到 PyPI，或者想深入探讨 pathlib / concurrent.futures 的具体用法，随时告诉我！

一、 导入模块的 5 种方式

1. 导入整个模块 (import module)

2. 导入特定对象 (from module import name)

3. 使用别名 (import ... as ... / from ... import ... as ...)

4. 导入包中的所有公开对象 (from module import *)

5. 动态导入 (importlib)

二、 核心机制：__name__ == '__main__'

三、 包 (Packages) 的组织结构

1. 标准包结构示例

2. __init__.py 的作用

3. 绝对导入 vs 相对导入

四、 模块搜索路径 (sys.path)

五、 Python 3 高频标准库模块推荐

六、 最佳实践与避坑指南

Written by lichongyang

You might also like

Python3 列表

Python3 字典

Python3 集合