728x90
반응형

계기

개발 진행 중, 체인 데이터가 깨지는 이슈가 발생하였으나 컨테이너의 health 체크 및 재시동에 이슈가 발생하였음
현재는 본인이 3년전에 세팅한 Docker Swarm 으로 컨테이너 오케스트레이션 중이나, 서비스 고도화로 인한 오케스트레이션해야 할 컨테이너가 다양해지고 많아짐
컨테이너 health 상태 체크 및 정상화에 대한 기능이 필요해짐
서비스 운영시의 서버 문제 발생 및 리소스 문제 대처를 위한 Auto Scaling 기능 역시 필요
이외에 무중단 배포 전략 수행을 위한 옵션 역시 필요함
이를 해결하기 위한 방안에 대하여 고민중, 회사에 제안할 내용의 초안을 작성해본다.


현 상태

  • Docker Swam을 통한 노드 컨테이너 오케스트레이션이 수행되고 있음
    • 오케스트레이션 대상이 블록체인 노드 8개 밖에 없었기에 kubernetes를 사용할 필요가 없어 보였음
  • 그러나 관리 및 오케스트레이션 해야 할 대상이 많고 다양해짐
    • 노드
    • Explorer
    • 어플리케이션들
      • 거래소
      • 지갑
    • DB
    • 게이트웨이
    • 모니터링 시스템
      • 자체 제작 Collector 및 대시보드
      • Prometheus
      • Grafana
  • Auto-Scaling, 리소스 할당에 대한 필요성 대두
  • 무중단 배포 전략 도입의 필요성 확인

제안

  • 컨테이너 오케스트레이터(Orchestrator)를 Kubernetes로 변경
    • 더욱 안정적 시스템 운영
    • Auto Scaling

구상

  • 노드 구성
    • Master
    • Worker Nodes
      • Explorer
      • Chain Nodes - 7 nodes
      • DataBase
      • Monitoring
      • Trade Application
      • Wallet Application
  • Pods 단위
    • Explorer pod
    • Blockchain Nodes pod
    • Database pod
    • Services
      • Trade Application
      • Wallet Application
      • etc...
    • Monitoring pod
      • Prometheus
      • Grafana
      • 자체 제작 Collecter, Dashboard
728x90
반응형

+ Recent posts