未分类 高级sql记录: package day0108 import java.text.SimpleDateFormat import org.apache.log4j.{Level, Logger} import org... 06月19日 193 views 发表评论 阅读全文
未分类 spark IDEA代码初步 IDEA通过DS+Row查询数据 package day0106 import java.util.Properties import org.apache.spark.sql.{Row, Spark... 06月19日 173 views 发表评论 阅读全文
未分类 spark表缓存 实测可以从1s降低到76ms scala> val df1 = spark.read.json("/testdata/emp.json") //需要上传到hdfs df1: org.apache... 06月19日 179 views 发表评论 阅读全文
未分类 spark-SQL连接Hive server端(biddata166主机hive/conf目录下hive-site.xml): <configuration> <property> <name>h... 06月19日 186 views 发表评论 阅读全文
未分类 scala 日志统计代码 自定义分区 数据库连接 package customPartition0103 package customPartition0103 import org.apache.spark.rdd.RDD impor... 06月16日 325 views 发表评论 阅读全文
未分类 scala两种环境备忘 IDEA环境: package wordcount import org.apache.spark.{SparkConf, SparkContext} object wordCountScala ex... 06月15日 147 views 发表评论 阅读全文
未分类 Hbase Region 均衡设置 package hbaseapi; import org.apache.hadoop.conf.Configuration; import org.apache.hadoop.hbase.*; imp... 06月14日 173 views 发表评论 阅读全文
未分类 HbaseAPI编写 package hbaseapi; import com.google.inject.internal.util.$AsynchronousComputationException; import c... 06月14日 145 views 发表评论 阅读全文