自然语言处理类库NLTK数据的安装配置

pip install nltk

git clone --depth 1 https://gitee.com/gislite/nltk_data.git

import nltk
from nltk import data
data.path.append("/path-to/nltk_data/packages")

nltk.sent_tokenize(cnt)

Resource punkt not found.
Please use the NLTK Downloader to obtain the resource:
  >>> import nltk
  >>> nltk.download('punkt')

dev@w4:~/nltk_data$ find . | grep punkt
  ./packages/tokenizers/punkt.zip
  ./packages/tokenizers/punkt.xml
dev@w4:~/nltk_data$ cd ./packages/tokenizers/
dev@w4:~/nltk_data/packages/tokenizers$ unzip punkt.zip
  Archive:  punkt.zip
  creating: punkt/
  inflating: punkt/greek.pickle
  inflating: punkt/estonian.pickle
  inflating: punkt/turkish.pickle