您当前的位置: 首页 >  ar

段智华

暂无认证

  • 3浏览

    0关注

    1232博文

    0收益

  • 0浏览

    0点赞

    0打赏

    0留言

私信
关注
热门博文

第45课 Spark 2.0实战之Dataset:map、flatMap、mapPartitions、dropDuplicate、coalesce、repartition等

段智华 发布时间:2016-09-16 19:01:41 ,浏览量:3

第45课 Spark 2.0实战之Dataset:map、flatMap、mapPartitions、dropDuplicate、coalesce、repartition等

 

package com.dt.spark200

import org.apache.spark.sql.SparkSession import scala.collection.mutable.ArrayBuffer

object DataSetsops {   case class Person(name:String,age:Long)   def main(args: Array[String]): Unit = {          val spark = SparkSession        .builder()        .appName("DatasetOps")        .master("local")        .config("spark.sql.warehouse.dir", "file:///G:/IMFBigDataSpark2016/IMFScalaWorkspace_spark200/Spark200/spark-warehouse")        .getOrCreate()          import spark.implicits._    import org.apache.spark.sql.functions._   val personDF= spark.read.json("G:\\IMFBigDataSpark2016\\spark-2.0.0-bin-hadoop2.6\\examples\\src\\main\\resources\\people.json")   val p

关注
打赏
1659361485
查看更多评论
立即登录/注册

微信扫码登录

0.1357s