안녕하세요. OpsNow팀 입니다.
저번 주에 전세계 IT 대란이 발생했습니다.
보안 프로그램의 업그레이드가 컴퓨터 OS와 충돌이 발생하면서 주요 은행, 언론사와 항공사를 포함한 수많은 글로벌 기관들이 대규모 IT 중단 문제가 발생한 것입니다.
👉 전세계 IT 대란…항공기 운항 멈추고 방송·금융 차질 이어져(BBC News 코리아)
이런 IT 대란이 발생한 원인을 생각해 보면 다양한 원인들이 있을 수 있겠지만, 그 중에서도 핵심 원인은 시스템의 복잡도 증가와 선제적 대응의 미흡이 아닐까 하는 생각이 듭니다.
최근 시스템에는 클라우드, 마이크로서비스 아키텍처, 분산 처리, 엣지 컴퓨팅, AI/ML, 다양한 보안 솔루션 등이 적용되기에 시스템의 복잡도가 증가할 수 밖에 없습니다.
이렇게 복잡도가 증가한 시스템을 잘 운영하기 위해서는 운영에 투입되는 인력과 비용이 증가하게 되고 당연히 운영 비용이 늘어날 수 밖에 없는 것이죠.
그리고 문제가 발생하기 전에 선제적 대응까지 고려한다면 더 많은 비용이 발생할 수 밖에 없습니다.
이에 조직들은 운영 비용과 시스템의 안정성, 이 두 마리의 토끼를 모두 잡을 수 있는 방안을 고려할 수 밖에 없는 것이고 말이죠.
이런 고려의 결과로 IT 운영에 AI를 활용하는 방안을 모색하게 되었습니다.
바로 AIOps 입니다.
오늘은 이 AIOps에 대해서 자세히 살펴보겠습니다.
|