您当前的位置: 首页 >  大数据

段智华

暂无认证

  • 4浏览

    0关注

    1232博文

    0收益

  • 0浏览

    0点赞

    0打赏

    0留言

私信
关注
热门博文

大数据Spark “蘑菇云”行动补充内容第69课: Spark SQL案例之分析电影评分系统.

段智华 发布时间:2016-10-29 20:51:22 ,浏览量:4

大数据Spark “蘑菇云”行动补充内容第69课: Spark SQL案例之分析电影评分系统.

昨天的作业dataframe的 算子实现 :

import org.apache.spark.sql.types._ import org.apache.spark.sql.Row val PATH = "/data/moviesData/" val moviesData = sc.textFile(PATH + "movies.dat") val ratingsData = sc.textFile(PATH + "ratings.dat") val usersData = sc.textFile(PATH + "users.dat") val userSchemaString = "USERID::GENDER::AGE" val userSchema = StructType(userSchemaString.split("::").map(field => StructField(field, StringType, true))) val userDataFrame = sqlContext.createDataFrame(usersData.map(_.split("::")).map(line => Row(line(0),line(1), line(2))), userS
关注
打赏
1659361485
查看更多评论
立即登录/注册

微信扫码登录

0.1389s