사건 발생 개요
- 카프카 도입과 함께 스톰 1.0.x 로 버전업 함
- 문제를 심플하게 하기 위해 SSID 토폴로지랑 Signal 토폴로지 중에서 리얼타임 기능을 주석 처리 함
- 처음에는 카프카 머신에서 스톰을 구동했음
- CPU를 많이 쓰는 문제인지, 카프카도 죽고 스톰도 죽는 문제 발견
- 카프카가 죽으면 문제가 너무 복잡해지기 때문에 스톰 머신을 카프카 머신에서 빼서 새로 설정 했음
- 이전 docker 가 스톰 0.8.x에 맞춰서 설정 됐고, nimbus, supervisor 등 각 인스턴스 별로 이미지가 별도로 있어서 관리 이슈가 있었음. 특히 슈퍼바이저의 경우 kill 커멘드가 씹히는 문제가 있어서 도커 리드플로이도 잘 안되는 문제가 있었음. 그래서 새로운 도커 이미지를 만듬. deploy 프로젝트 참고