当TableInputFormat在 MapReduce job 中被用做获取 HBase 表时,它的拆分器将为表的每个分区指定一个 map 任务.因此如果表中有 100 个分区,无论要扫描多少列,都会为该任务 拆分出 100 个 map 任务.
如果对自定义拆分器感兴趣,请参阅TableInputFormatBase中的getSplits方法,它是 map 任务拆分逻辑所在.
getSplits