2.6 数据保护
为了防止数据误操作,导致数据丢失,可以进行一下几项配置;其中“数据快照”、“NameNode元数据备份”和“启用回收站”强烈建议配置,“DataNode数据硬链接”可以根据需要选择配置。
2.6.1 数据快照
- 创建快照
在/opt/software/lsql/sbin/目录中存在snapshot.sh脚本,用于实现创建快照,可以使用这个脚本定期对hdfs数据进行备份,以防误删数据。
使用方法:
sh snapshot.sh 需要快照的目录 保存快照最大数量
例如:
lsql/sbin/snapshot.sh /data 3
参数3表示保留最近三个快照
通常情况下,可以将快照放到定时任务里,每天凌晨10分创建一次快照。
10 0 * * * sh /opt/software/lsql/sbin/snapshot.sh /data 3 >/dev/null 2>&1
# * * * * * 分别代表 分 时 天 月 星期几 数值范围分别是 0-59: 0-23 :1-31: 1-12: 0-7
查看快照
查看.snapshot 下快照是否生成成功: hadoop fs -ls /data/.snapshot/ 快照生成后也可以在hdfs的50070页面看到生成的快照。
图 2.6.1.1hdfs50070页面
快照恢复
hadoop fs -cp /data/.snapshot/20191125162639 /data/
需要在Zk启动的基础上启动Kafka:
# 创建topic ./bin/kafka-topics.sh --create --zookeeper minione:2181 --replication-factor 1 --partitions 8 --topic test # 查看topic ./bin/kafka-topics.sh --list --zookeeper minione:2181 # 启动控制台生产者 ./bin/kafka-console-producer.sh --broker-list minione:9092 --topic test # 启动控制台消费者 /bin/kafka-console-consumer.sh --bootstrap-server minione:9092 --topic test --from-beginning