재경일보

[이슈 인사이드] 카톡 사태 잊었나… 대전 화재가 던진 데이터 리스크

김영 기자

지난 26일 국가정보자원관리원(NIRS) 대전 본원 화재는 배터리에서 시작된 화재로 인해 '정부24', '모바일 신분증' 등 다수의 정부 온라인 서비스(최대 647개 시스템)가 중단된 사건이다.

이로 인해 정부의 핵심 디지털 인프라가 마비되며 행정 업무에 큰 차질을 빚었다.

반면, 2022년 10월 발생한 카카오톡 먹통 사태는 SK C&C 판교 데이터센터의 전기실 화재로 인해 카카오의 주요 민간 서비스(메신저, 결제, 모빌리티 등)가 장시간 불능 상태에 빠지며 국민 생활에 막대한 불편을 초래했다.

▲ '전원 인프라 화재’ 기술적 요인

두 사건 모두 화재의 근본 원인이 전원 인프라(배터리, UPS, 배전 계통)에 있었다는 공통점이 있다.

NIRS 화재는 배터리 발화 후 항온·항습 시스템까지 영향을 미쳐 서버 과열 위험을 키웠다.

카카오 사태는 전기실 화재로 전력 공급이 중단되며 서비스가 멈췄고, 재해복구(DR) 시스템의 즉각적인 전환이 실패하며 장애가 장기화되었다.

이는 전력 및 냉각 상실이 서버와 네트워크 가용성 급락으로 이어지는 치명적인 경로를 보여주었다.

국가정보자원관리원
[연합뉴스 제공]

▲ ‘공공 마비’ vs ‘민간 커뮤니케이션 차질’

NIRS 화재는 행정, 우편, 신분, 부동산 등 공공 핵심 서비스가 동시다발적으로 멈추면서 정부 기능 자체에 대한 신뢰를 흔들었다.

반면, 카카오 사태는 메시징, 결제, 모빌리티 등 국민 생활과 밀접하게 연결된 민간 서비스가 멈추면서 사회적 파장을 일으켰다.

두 사건 모두 단순히 기술적 장애를 넘어 사회적 재난으로 인식되었다.

▲ 복구와 가용성, ‘이중화’보다 중요한 ‘자동 전환’

NIRS의 경우, 다단계 백업/DR 체계가 있었지만 실질적인 서비스 재가동에는 상당한 시간이 소요되었다.

이는 물리적 인프라(전원, 냉각)와 가상화 플랫폼의 동시 안정화가 필요했기 때문이다.

카카오 사태는 즉시 무중단 전환(Active-Active)이 기대만큼 작동하지 못했다는 점에서 중요한 교훈을 남겼다.

두 사건은 백업 시스템이 '존재하는 것'과 '즉시 작동하는 것'은 전혀 다른 문제임을 보여주며, 자동 페일오버와 정기적인 복구 리허설의 중요성을 강조했다.

주민센터 일부 민원사무 중단 안내문
주민센터 일부 민원사무 중단 안내문 [연합뉴스 제공]

▲ 공공 DR 표준과 민간 플랫폼 복원력 의무화

두 사건을 계기로 정부와 민간 모두에 대한 정책적 변화의 필요성이 제기되었다.

공공 부문의 경우 NIRS 사태 이후 단일 거점에 의존하는 구조를 개선하고, 필수 행정 시스템에 대한 다지역 이중화 및 정례적인 재해복구 훈련을 정착해야 한다는 지적이 이어지고 있다.

카카오 사태 이후 논의된 데이터센터 안전 및 이중화 기준 강화, 그리고 사고 발생 시 보고 의무를 실효성 있게 적용하여 금융, 결제 등 생활 인프라급 서비스의 복원력을 높이는 것이 필요하다.

▲ 전환과 복원의 속도가 신뢰를 구축한다

NIRS 화재와 카카오 사태는 전원 인프라의 취약성이 공공과 민간을 막론하고 대규모 시스템 장애를 유발할 수 있음을 입증했다.

두 사건의 가장 큰 교훈은 단순히 백업 시스템을 갖추는 것을 넘어, 위기 상황에서 자동으로 신속하게 전환되고 복원되는 능력이 곧 서비스의 신뢰도와 직결된다는 점이다.

정부와 민간 모두 물리적 인프라와 소프트웨어 레벨의 이중화를 병행하고, 실제 재난 상황을 가정한 훈련을 반복함으로써 예측 불가능한 사고에 대한 복원력을 강화가 중요한 시점으로 보인다.

저작권자 © 재경일보 무단전재 및 재배포 금지

#이슈 인사이드