2.6 数据保护

为了防止数据误操作,导致数据丢失,可以进行一下几项配置;其中“数据快照”、“NameNode元数据备份”和“启用回收站”强烈建议配置,“DataNode数据硬链接”可以根据需要选择配置。

2.6.1 数据快照

  1. 创建快照
   在/opt/software/lsql/sbin/目录中存在snapshot.sh脚本,用于实现创建快照,可以使用这个脚本定期对hdfs数据进行备份,以防误删数据。
   使用方法:
   sh snapshot.sh             需要快照的目录        保存快照最大数量
    例如:
    lsql/sbin/snapshot.sh               /data                         3
    参数3表示保留最近三个快照
    通常情况下,可以将快照放到定时任务里,每天凌晨10分创建一次快照。
    10 0 * * * sh /opt/software/lsql/sbin/snapshot.sh /data 3 >/dev/null 2>&1
    # * * * * * 分别代表 分 时 天 月 星期几   数值范围分别是 0-59: 0-23 :1-31: 1-12: 0-7
  1. 查看快照

    查看.snapshot 下快照是否生成成功:
    hadoop fs -ls /data/.snapshot/
    快照生成后也可以在hdfs的50070页面看到生成的快照。
    

    图 2.6.1.1hdfs50070页面

  2. 快照恢复

    hadoop fs -cp /data/.snapshot/20191125162639 /data/
    
  3. 需要在Zk启动的基础上启动Kafka:

    # 创建topic
    ./bin/kafka-topics.sh --create --zookeeper minione:2181  --replication-factor 1   --partitions 8  --topic test
    # 查看topic
    ./bin/kafka-topics.sh --list --zookeeper minione:2181
    # 启动控制台生产者
    ./bin/kafka-console-producer.sh  --broker-list minione:9092 --topic test
    # 启动控制台消费者
    /bin/kafka-console-consumer.sh --bootstrap-server minione:9092 --topic test --from-beginning
    
Copyright © lucene.xin 2020 all right reserved修改时间: 2021-07-05 10:36:42

results matching ""

    No results matching ""