현상 : CMDTUX_CAT:1395: WARN: Slow BBL response, machine=CCRSL10
원인 : 각 machine에 있는 BBL은 그 기계의 sanity check을 할 때마다 DBBL??IMOK 메시지를 보낸다. 이 check은 *RESOURCES 섹션에 정해져 있는 SANITYSCAN*SCANUNIT 초마다 발생하며 DBBL은 매 BBLQUERY*SCANUNIT 초마다 모든 기계의 BBL에 대한 sanity check을 한다. 전단계의 check 시간 동안 각 기계로부터 IMOK 메시지를 받지 못하면 DBBL은 이 warning 메시지를 내보내고 전 network에 대한 sanity check을 시작한다. 이 ?綱?실패하면, 그 기계는 partition 된 것으로 판단한다.
조치 : 이 메시지는 네트워크가 혼잡상태이거나 기계가 overload 상태임을 뜻한다. 이 이후에는 그 기계가 partition 될 염려가 있으므로 다음 사항을 ?改磯?
1) 두 기계간의 네트워크를 ?改構? 네트워크의 응답이 느려지는 원인을 찾는다.
2) 그 기계에서 BBL 프로세스의 동작을 방해하는 CPU의 overload를 ?改磯?
3) master 기계에서 DBBL이 자신의 queue에 있는 메시지를 처리할 때 이를 방해하는 CPU의 overload를 ?改磯?
4) *RESOURCES 의 BBLQUERY parameter를 SANITYSCAN 보다 크게 고쳐준다. 대부분의 환경에서 이 두 parameter의 차이는 10 초나 혹은 그 이상이어야 한다.
5) Network 오류 수정 또는 구성 파일의 BBLQUERY, DBBLWAIT 값및 BLOCKTIME을 적절히 조정. ( DBBLWAIT는 BLOCKTIME/2 보다 작게 세트)
'▶ Tuxedo > 오류 메시지(Tuxedo)' 카테고리의 다른 글
LIBTUX_CAT:466: ERROR: tpopen TPERMERR xa_open returned XAER_RMERR (0) | 2010.07.09 |
---|---|
GP_CAT:1356: ERROR: pifreg: can not open registry database (0) | 2010.07.09 |
CMDTUX_CAT:1395, CMDTUX_CAT:1394 (0) | 2010.07.07 |
CMDTUX_CAT:1392: ERROR : BBL partitioned, machine=DONGGU (0) | 2010.07.07 |
CMDTUX_CAT:1392, CMDTUX_CAT:1394 (0) | 2010.07.07 |