Python-NLTK安装

最近《C++Primer》有些看不下去了,说是到了一个瓶颈吧,又不是,感觉好多东西还是不懂,仅仅是看过去了一些知识点,准备换换思路,看看机器学习的东西,毕竟很火…大概搜了一下,觉得自然语言处理这块还挺好玩,决定搭个python环境玩玩,然而并没有想的那么顺利…

1. 安装步骤 

1.1 下载python

传送门:python
版本最好选择2.0+,我选择的是2.7,因为2.0+的版本比较稳定些,而且在后面安装nltk可能会避免很多错误。
安装时候选择intall just for me;然后一路next就行了。
安装结束后,如果没有修改路径,会在C盘下生成一个Python27的文件夹,该目录下有一个python.py应用程序,双击弹出以下界面就说明python已经安装好啦。

1.2 下载nltk

传送门:NLTK
现在官网上挂的是3.05版本,如果下载这个版本安装估计会出问题,我一开始就用的这个版本,在下一步dowload数据包时一直给我报错,无奈换了一个2.0版本的,可以到这里下载:戳我

1.3 下载book资源

1
2
import nltk
nltk.download()

跳出如下界面,选择book下载就行了。

2. 遇到的一些问题

python安装的还算顺利,但是在安装nltk时卡了我一天…一开始报错UnicodeDecodeerror ascii codec can’t decode byte 0xd7 in position 9 ordinal not in range(128)…编码错误?好吧,python安装的编码方式是ascii,可能与nltk的编码方式不同,于是在网上找到了两种解决方案:

2.1 更改编码方式:

1
2
3
import sys
reload(sys)
sys.setdefaultencoding('utf-8')

然而并没有什么卵用…依然报错

2.2 修改目录Python2.7/lib/下的mimetypes.py文件:

删除或注释掉以下语句:

1
2
3
4
try:
ctype = ctype.encode(default_encoding)
except UnicodeEncodeError:
pass

依然没解决问题…
后来在官网上找到一种安装步骤:

照着步骤走,重新安装python,nltk但是最后还是报了一个错:’ImportError: No module named six’
搜了一圈没找到合适答案,但找到一个一个2.0版本的nltk,决定按照《python自然语言处理》这本书上说的试试,用python2.7+nltk2.0。
import nltk 时报了一个错:ImportError: No module named yaml,下载了一个PyYAML-3.10win32-py2.7安装,再次import nltk 万事大吉。

所以,总结一句话:一定要下载合适的版本,互相搭配才能更好工作。

资源搬运工:
python2.7
nltk2.0
PyYAML-3.10win32-py2.7

参考资料:
http://www.cnblogs.com/huangcong/archive/2011/08/29/2157437.html
http://www.xuebuyuan.com/512758.html

写的还不错?那就来个红包吧!
0%