在依赖生产环境的备份和还原策略之前,必须演练如何执行备份,更重要的是,必须演练如何还原。测试该策略以确保其可行。至少,能把生产集群的数据存储备份到不同集群或服务器上的。要进一步保护数据,请使用位于不同物理位置的备份位置。
如果由于计算机系统问题导致主生产集群上的数据丢失不可恢复,则可以从同一站点的其他集群或服务器还原数据。然而,破坏整个站点的灾难使本地存储的备份变得毫无用处。考虑存储备份数据和必要资源(计算能力和操作员专业知识),以便在远离生产站点的站点恢复数据。如果在整个主要站点(火灾,地震等)发生灾难,远程备份站点可能非常有价值。
作为基准,您必须至少完成一次HBase数据的完整备份,然后才能依赖增量备份。完整备份应存储在源集群之外。要确保完整的数据集恢复,必须使用还原基准完全备份选项运行还原实用程序。完整备份是数据集的基础。在还原操作期间,将在完全备份的基础上应用增量备份数据,以使您返回上次执行备份的时间点。
您可以将表分组到称为备份集的对象中。当您有一组特定的表,您希望重复备份或还原时,备份集可以节省时间。
创建备份集时,键入要包括在组中的表名。备份集不仅包括相关表组,还包含HBase备份元数据。然后,您可以使用备份集名称以指示对哪些表执行命令,而不用输入所有表名。
记录整个过程,以便知识库可以在员工离职后转移给新的管理员。作为额外的安全预防措施,还要记录日期,时间以及有关每个备份数据的其他相关详细信息。在源群集发生故障或主站点灾难的情况下,此元数据可能有助于查找特定数据集。给所有文档维护重复副本:生产集群站点的一个副本和备份位置的或管理员从生产集群远程访问的任何位置一个副本。