您当前的位置：首页 > java晴天过后 ar

千万级数据查询中CK、ES、RediSearch方案的优化

java晴天过后发布时间：2022-06-01 20:34:32 ，浏览量：5

前言

在开发中遇到一个业务诉求，需要在千万量级的底池数据中筛选出不超过 10W 的数据，并根据配置的权重规则进行排序、打散（如同一个类目下的商品数据不能连续出现 3 次）。

下面对该业务诉求的实现，设计思路和方案优化进行介绍，对「千万量级数据中查询 10W 量级的数据」设计了如下方案

多线程 + CK 翻页方案
ES scroll scan 深翻页方案
ES + Hbase 组合方案
RediSearch + RedisJSON 组合方案

初版设计方案

整体方案设计为

先根据配置的「筛选规则」，从底池表中筛选出「目标数据」
在根据配置的「排序规则」，对「目标数据」进行排序，得到「结果数据」

技术方案如下

每天运行导数任务，把现有的千万量级的底池数据（Hive 表）导入到 Clickhouse 中，后续使用 CK 表进行数据筛选。
将业务配置的筛选规则和排序规则，构建为一个「筛选 + 排序」对象 SelectionQueryCondition。
从 CK 底池表取「目标数据」时，开启多线程，进行分页筛选，将获取到的「目标数据」存放到 result 列表中。

//分页大小  默认 5000
int pageSize = this.getPageSize();
//页码数
int pageCnt = totalNum / this.getPageSize() + 1;

List result = Lists.newArrayList();
List futureList = new ArrayList(pageCnt);

//开启多线程调用
for (int i = 1; i


    
        
            
        
        
            
                
                
                    java晴天过后
                    暂无认证
                
            
            
                
                    
                        5浏览
                        0关注
                        185博文
                        0收益
                    

                    
                        0浏览
                        0点赞
                        0打赏
                        0留言
                    
                
            
            
                私信
                关注
            

        
        
            热门博文
            
                收到6家大厂offer，我把问烂了的《Java八股文》打造成3个PDF。共1700页
SpringBoot 接口数据加解密实战
看完这个故事，你敢说还不懂Docker？
Netty如何做到单机百万并发？
后端服务架构的不同与区别
如何保证数据库和缓存双写一致性？
使用阿里巴巴 Druid 轻松实现加密
面试官：int(1) 和 int(10) 有什么区别？
2022科技公司薪酬排行榜，来了！
SpringBoot 读取配置文件的 5 种方法！







    [ 申请 ]友情链接：
    
        
        优质稳定机场推荐

        绘画宝宝
        配音宝宝
    


    
        
            关于我们
            服务条款
            广告服务
            联系我们
            网站地图
            免责声明
            WAP
        
        技术支持：
            武汉快勤科技有限公司
            XML网站地图 
            备案号：鄂ICP备18027844号-9
            
        
    




    
        立即登录/注册
        
    
    
        
        微信扫码登录