1楼:匿名用户
nltk里面提供的函数应该不可能用于中文吧。
分词就没法分,剩下的就都做不了了
即使设置一下编码什么的,也没什么意义啊
如果我说错了就错了吧,留个名,看看其他人怎么回答。哈哈
2楼:匿名用户
在开始写上
#!-*- coding:utf8 -*-如果其中读取的文件有中文可以用
s="你好回"
s.decode('gbk'),encode('utf8')s.decode('gb2312'),encode('utf8')这样的方式来尝试一下答
如何用 python 中的 nltk 对中文进行分析和处理
3楼:蛋包饭配冰红茶
我感觉用nltk 处理中文是完全可用的。其重点在于中文分词和文本表达的形式。
中文和英文主要的不同之处是中文需要分词。因为nltk 的处理粒度一般是词,所以必须要先对文本进行分词然后再用nltk 来处理(不需要用nltk 来做分词,直接用分词包就可以了。严重推荐结巴分词,非常好用)。
中文分词之后,文本就是一个由每个词组成的长数组:[word1, word2, word3...... wordn]。之后就可以使用nltk 里面的各种方法来处理这个文本了。
比如用freqdist 统计文本词频,用bigrams 把文本变成双词组的形式:[(word1, word2), (word2, word3), (word3, word4)......(wordn-1, wordn)]。
如何用 python 中的 nltk 对中文进行分析和处理
4楼:匿名用户
一、nltk进行分词
用到的函数:
nltk.sent_tokenize(text) #对文本按照句子进行分割
nltk.word_tokenize(sent) #对句子进行分词
二、nltk进行词性标注
用到的函数:
nltk.pos_tag(tokens)#tokens是句子分词后的结果,同样是句子级的标注
三、nltk进行命名实体识别(ner)
用到的函数:
nltk.ne_chunk(tags)#tags是句子词性标注后的结果,同样是句子级
上例中,有两个命名实体,一个是xi,这个应该是per,被错误识别为gpe了; 另一个事china,被正确识别为gpe。
四、句法分析
nltk没有好的parser,推荐使用stanfordparser
但是nltk有很好的树类,该类用list实现
可以利用stanfordparser的输出构建一棵python的句法树
5楼:匿名用户
买本书看 ......
6楼:令梅函靖巧
有很多好用的中文处理包:
jieba:可以用来做分词,词性标注,textrankhanlp:分词,命名实体识别,依存句法分析,还有fudannlp,nlpir
个人觉得都比nltk好用~
如何用 python 中的 nltk 对中文进行分析和处理
7楼:匿名用户
一、nltk进行分bai
词用到的函数:
nltk.sent_tokenize(text) #对文本
du按照句子zhi进行dao分割
nltk.word_tokenize(sent) #对句子进行分词
二、nltk进行词内性标注容
用到的函数:
nltk.pos_tag(tokens)#tokens是句子分词后的结果,同样是句子级的标注
三、nltk进行命名实体识别(ner)
用到的函数:
nltk.ne_chunk(tags)#tags是句子词性标注后的结果,同样是句子级
上例中,有两个命名实体,一个是xi,这个应该是per,被错误识别为gpe了; 另一个事china,被正确识别为gpe。
四、句法分析
nltk没有好的parser,推荐使用stanfordparser
但是nltk有很好的树类,该类用list实现
可以利用stanfordparser的输出构建一棵python的句法树
python函数变量参数怎么使用
1楼 育知同创教育 刚学用python的时候,特别是看一些库的源码时,经常会看到func args kwargs 这样的函数定义,这个 和 让人有点费解。其实只要把函数参数定义搞清楚了,就不难理解了。 先说说函数定义,我们都知道,下面的 定义了一个函数funca def funca pass 显然,...
斜杠号可以在汉语正式文体中使用吗?怎样使用
1楼 匿名用户 现代诗歌中有用的 不过平时自己用用还可以 要出书,那种格式就不符合规范。 语文中的斜线号 有哪些用处? 2楼 匿名用户 斜线号的主要功能是分隔作用,其具体用法有 1 用于分隔替换词。 or students 可以是老师和 或学生。 2 用于分隔并列词语。 3 用于某些缩略词中。 4 ...
几何画板4.07中文版怎么用,几何画板4.07最强中文版使用效果怎么样
1楼 匿名用户 第一节 绘图工具的介绍 画板的左侧是画板工具箱,它们分别是 选择箭头工具 点工具 圆规工具 直尺工具 文本工具 自定义画图工具 画点 单击 点工具 ,然后将鼠标移动到画板窗口中单击一下,就会出现一个点 画线 单击 直尺工具 ,然后拖动鼠标,将光标移动到画板窗口中单击一下,再拖动鼠标到...