NLP——Word2Vec 未分类

NLP——Word2Vec

看完了,感觉挺有意思,基本分析如下: 先读取,分词,去掉停用词,形成二维列表,交给Word2Vec去计算 最后调用相关函数,虽然不甚理想,但是比起之前的测试准确度提高到了70%左右 先上代码: #-*...
阅读全文
NLP初步——其它 未分类

NLP初步——其它

和北大处理工具差不多 SPacy商业开源软件,速度最快,但是不支持中文 8、Gensim文本的向量表示 特征提取。 TF-IDF、word2vec。Bag of Words BOW 磁带模型 pip ...
阅读全文
初步——PKUseg 未分类

初步——PKUseg

安装:pip install pkuseg 北大的分词工具。 (1)多领域分词。新闻、科研、网络、医药、旅游、金融、工业。 (2)跟高的分词准确率 (3)支持用户自训练模型。支持用户使用全新的标注数据...
阅读全文
NLP初步——SnowNLP 未分类

NLP初步——SnowNLP

pip install snownlp 个人感觉还是比较low的,可以仅作了解 (1)支持中文,受Textblob,没有用NLTK 特征、中文分词、词性标注、情感分析(买卖东西评价)、文本分类、拼音转...
阅读全文
FRP实操备份 未分类

FRP实操备份

注意,服务器和客户机版本相差不能太大,否则会出现坏连接 https://github.com/fatedier/frp/releases/tag/v0.34.0 Linux 版本下载链接: https...
阅读全文
spark算子初步 未分类

spark算子初步

秉承归零心态是学习编程必备态度的原则,这次scala也使用python的方法,把代码敲一遍,所以,就有了下面的....同样保留了试错的内容。   scala> var rdd1 = s...
阅读全文