IBM WebSphere MQ Crash

今日发生了WebSphere Crash的故障。因为备份软件占用了IBM WebSphere MQ的check point 文件(/var/mqm/qmgrs/队列管理器/amqalchk.fil)因为MQ进程使用操作系统的O_NSHARE属性去打开”amqalchk.fil”文件。使用排他的方式打开checkpoint文件是为了避免两个队列管理器同时打开一个checkpoint文件。两个队列管理器同时打开checkpoint会导致日志损坏。当日志被损坏会导致MQ队列管理器无法启动。英文文档解释的原文:The file system must obey requests to lock files either using O_NSHARE on the open() call or fcntl() with.