1、数据文件
[root@master IMFdatatest]#cat members.txt
1 Spark 1
2 Hadoop 1
3 flink 3
4 Kafka 1
5 Tachyon 2
[root@master IMFdatatest]#cat address.txt
1 America
2 China
3 Germa
2、上次文件到hdfs
=======================================================
代码分析
1、自定义MemberKey hadoop如何定义key体现开发人员的水准
private int keyID
private boolean flag
compareTo方法
hashCode方法,就以keyID作为hashCode值
2、自定义类Member_Information,包含成员ID 成员名字 地址
ID 地址
String memberNo
String memberName
String addresNo
String addressName
3、自定义GroupComparator
定义组的c
