未分类 初步——PKUseg 安装:pip install pkuseg 北大的分词工具。 (1)多领域分词。新闻、科研、网络、医药、旅游、金融、工业。 (2)跟高的分词准确率 (3)支持用户自训练模型。支持用户使用全新的标注数据... 05月22日 2,192 views 发表评论 阅读全文
未分类 NLP初步——jieba pip install jieba jieba有一定识别新词的能力 #-*- coding:utf-8 -*- import jieba import jieba.analyse as ... 05月22日 4,467 views 发表评论 阅读全文
python-AI NLP初步——HanNLP pip install JPype1-0.7.0-cp37-cp37m-win_amd64 pip install pyhanlp 然后命令行import pyhanlp时,会有一个下载的过程 部分可... 05月21日 2,872 views 发表评论 阅读全文
未分类 NLP初步——SnowNLP pip install snownlp 个人感觉还是比较low的,可以仅作了解 (1)支持中文,受Textblob,没有用NLTK 特征、中文分词、词性标注、情感分析(买卖东西评价)、文本分类、拼音转... 05月21日 1,470 views 发表评论 阅读全文
未分类 NLP初步——TextBlob 安装 pip install textblob (1)处理文本数据的python库、功能:词性标注、名词短语抽取、情感分析、分类、翻译。 <pre>#-*- coding:utf-8 -*... 05月21日 623 views 发表评论 阅读全文
python-AI NLP初步——NLTK 安装相关库: conda install NLTK then import nltk # 调用 首次在python中执行nltk.download() 可以设置相关的下载地址 无法支持向... 05月21日 880 views 发表评论 阅读全文
未分类 FRP实操备份 注意,服务器和客户机版本相差不能太大,否则会出现坏连接 https://github.com/fatedier/frp/releases/tag/v0.34.0 Linux 版本下载链接: https... 05月11日 1,897 views 发表评论 阅读全文
未分类 spark算子初步 秉承归零心态是学习编程必备态度的原则,这次scala也使用python的方法,把代码敲一遍,所以,就有了下面的....同样保留了试错的内容。 scala> var rdd1 = s... 04月21日 604 views 发表评论 阅读全文
未分类 spark 配置和Word Count jar包 配置:解压,配置文件: 配置文件:conf/spark-env.sh export JAVA_HOME=/opt/module/jdk1.8.0_144 export SPARK_MASTER_HOS... 04月20日 605 views 发表评论 阅读全文
未分类 spark wordcount 初步 package wordcount import org.apache.spark.{SparkConf, SparkContext} object wordCountScala extends Ap... 04月19日 2,248 views 发表评论 阅读全文