五、LSQL基础特性
5.1. 映射表
5.1.1. 背景介绍
业务有成百上千张表,每张表有上百个列。
在如下场景中:每张表的数据量都不多(几亿几十亿),但是表数量特别多(几十张甚至几百张表)
如果为每个表都创建一个物理表,则会造成资源的浪费。同时存在如下问题:
每张物理表都需要维护自己的BUFFER,极易OOM,导入性能太差。
每张物理表都需要单独开个线程去维护。
每张物理表生成的索引都很小,但由于文件数量太多,频繁合并索引会导致namenode非常繁忙。
等等,总之小表数量过多,会存在诸多问题。
在搜索时,如果需要根据关键字搜索含有该关键字的所有字段对应的所有表的对应记录,采用物理表意味着每张表都需要写一个sql,若查询过滤条件拼了N个OR查询,则会导致SQL语句很长,同时并发性能也会很差。