最常用且可靠的方式是用pip安装NLTK:运行pip install nltk(或pip3/python -m pip install nltk),安装后需执行nltk.download('punkt')等命令下载数据包,推荐运行nltk.download('popular')一次性获取常用资源。

直接用 pip 安装即可,这是最常用也最可靠的方式。
使用 pip 安装 nltk
在终端(Windows 命令提示符、macOS/Linux 终端)中运行:
pip install nltk
如果系统中有多个 Python 版本,可能需要指定 pip 对应的版本,比如:
立即学习“Python免费学习笔记(深入)”;
- pip3 install nltk(确保安装到 Python 3 环境)
- python -m pip install nltk(避免 pip 命令指向旧版本)
验证是否安装成功
安装完成后,在 Python 中尝试导入并简单测试:
python
>>> import nltk
>>> nltk.download('punkt')
第一次使用某些功能时,nltk 会提示下载对应的数据包,punkt 是最常用的一个,用于句子切分。
常见问题处理
-
权限错误:加
--user参数,例如pip install --user nltk -
网络慢或超时:可换国内源,如清华源:
pip install -i https://pypi.tuna.tsinghua.edu.cn/simple/ nltk -
找不到 pip 命令:检查 Python 是否已加入系统 PATH,或使用
python -m ensurepip启用 pip
可选:安装常用数据包
nltk 功能依赖外部数据集,建议一次性下载常用资源:
>>> nltk.download('popular')
这会下载包括停用词、词干器、命名实体识别模型等在内的约 150 个资源,适合入门和多数 NLP 任务。











