您当前的位置: 首页 >  大数据

段智华

暂无认证

  • 2浏览

    0关注

    1232博文

    0收益

  • 0浏览

    0点赞

    0打赏

    0留言

私信
关注
热门博文

大数据Spark “蘑菇云”行动第72课: 基于Spark 2.0.1项目实现之二. 实战 各种小bug修复及性能调优 200并行度调整为2个task

段智华 发布时间:2016-11-03 21:30:56 ,浏览量:2

 大数据Spark “蘑菇云”行动第72课: 基于Spark 2.0.1项目实现之二.

源数据格式 及代码的小bug修复。

 

 

大数据Spark “蘑菇云”行动第72课: 基于Spark 2.0.1项目实现之二.

 

规律:agg前一般都进行grouBy操作

 

 







大数据Spark “蘑菇云”行动第72课: 基于Spark 2.0.1项目实现之二.

 

规律:agg前一般都进行grouBy操作

 

 

 

 

 

 

{"userID":"userID5234","Name":"zhangsan","Gender":"man","Occupation":"student"}
{"userID":"userID2234","Name":"lisi","Gender":"woman","Occupation":"teacher"}
{"userID":"userID4234","Name":"wangwu","Gender":wo"man","Occupation":"student"}
{"userID":"userID5234","Name":"wangwu","Gender":"man","Occupation":"student"}


 

 

{"logID":"logID1111&#
关注
打赏
1659361485
查看更多评论
立即登录/注册

微信扫码登录

0.1707s