카카오 데이터센터 (1) 안전 운영 계획
상세한 IT 엔지니어링 혁신
카카오가 데이터센터를 안전하게 운영하기 위해 기술적 조치와 함께 IT엔지니어링을 혁신한다.
우선적으로 데이터센터 이중화, 데이터와 서비스 이중화, 플랫폼과 운영 도구 이중화 등 인프라 하드웨어 설비부터 서비스 애플리케이션에 이르기까지 전체 시스템을 다중화하고 철저하게 대비책을 마련해 실행한다.
데이터센터 전체 시스템 다중화 및 장애 대비 훈련 확대
모니터링과 장애 탐지가 잘 작동할 수 있도록 모니터링 시스템을 다중화하고 메인 백본 센터를 현재 두 곳에서 세 곳으로 확대해 데이터센터 간 늘어날 트래픽에 대응할 수 있도록 설비 투자를 진행할 예정이다.
아울러 대용량 트래픽 전송에 필요한 서비스의 데이터센터 간 별도 전용망을 구성한다. 모든 형태의 데이터를 다중 복제 구조로 구성하고, 장애 발생 시 장애 복구 조치를 즉각 실행할 수 있는 환경도 구축했다. 현재 데이터센터 간 운영관리 도구 이중화를 완료했고 각종 자연재해/인위적 사건 사고로 사업이 중단되는 상황을 최소화하고자 향후 삼중화를 계획하고 있다.
데이터센터 삼중화는 구조상 3개 데이터센터 중 하나가 무력화되는 상황에서도 이중화가 담보되는 안정성을 갖고 있다. 여기에 주요 서비스는 멀티 클라우드를 활용해 서비스 연속성을 더욱 강화한다.
데이터센터 전체 시스템 다중화 작업과 함께 장애 대비 훈련도 확대 강화한다. 자체 데이터센터와 소방서 간 협력 체계를 구축해 소방당국과 맞춤형 화재 대응 매뉴얼을 공동 개발하고 정기적 합동 모의 소방훈련을 진행할 예정이다.
IT 엔지니어링 혁신 위해 전담 조직 확대하고 비상대응계획(BCP) 개선
카카오는 기술적인 혁신 뿐만 아니라 향후 5년간 IT 엔지니어링을 획기적으로 바꾸고자 한다. 이를 위해 IT 엔지니어링 전담 조직을 확대하고 장애, 재난 등 재해 발생 시 비상대책위원회를 가동하는 등 거버넌스를 위한 활동을 강화하기 시작했다. 외부 자문도 활용한다. 외부 전문가들의 자문을 구해 더욱 객관적으로 현재 BCP(Business Continuity Plan) 취약성을 진단하고 개선 작업을 진행한다.
아울러 서비스 안정성을 담보하기 위한 기술적 접근들, 특히 카오스 엔지니어링, 서비스 상태 페이지 등 주요 글로벌 기업들이 도입하여 효과를 보고 있는 영역에서 R&D를 진행할 예정이다. IT 엔지니어링 거버넌스 강화, BCP 외부 자문, 기술 R&D 등을 위해 향후 5년간은 지난 5년간 투자 금액의 3배 이상 규모로 투자를 확대한다.
[참고] 카카오 데이터센터 안산
경기도 안산시 한양대 에리카(ERICA) 캠퍼스 내 위치한 카카오 데이터센터 안산은 카카오의 첫 자체 데이터센터다. 연면적 47,378 제곱미터의 하이퍼스케일(10만대 이상의 서버를 운영할 수 있는 초대형 데이터센터) 규모로, 4천 개의 랙, 총 12만대의 서버를 보관할 수 있으며 6EB(엑사바이트)의 데이터를 저장할 수 있다. 카카오는 이용자들의 일상을 안전하게 지킬 수 있는 인프라 확충을 목표로 2023년 9월 데이터센터를 준공했으며, 2024년 1월 가동을 시작했다.
- 기술 [AI_TOP_100] AI와 함께_문제를 해결하는_사람들 | 댓글 이벤트 🎁
#AITOP100#기술#카카오임팩트 - 보도자료 발행일 2025.12.29 카카오, 정부 ‘GPU 확보 사업’ 인프라 구축 순항 ... 연내 목표 초과 달성
#데이터센터#카카오데이터센터안산#인프라#GPU#B200 - 보도자료 발행일 2026.03.31 책 속 문장이 이모티콘으로...카카오, 문학과 이모티콘 잇는 ‘텍스트힙 기획전’ 진행
#기획전#이모티콘#카카오#텍스트힙