카카오 개발자가 본 '요즘 클라우드 흐름' 세 가지

"클라우드 기반 비슷한 자원 쓰면서 차별화 전략 중요"

컴퓨팅입력 :2019/07/21 09:46    수정: 2019/07/21 09:49

기업들의 클라우드 지향점이 서비스형 인프라(IaaS)에서 출발해 플랫폼(PaaS)을 지나 소프트웨어(SaaS)로 간다. 오픈소스 소프트웨어(SW)에 채택된 라이선스와 클라우드 비즈니스 모델이 충돌하고 있다. 멀티·하이브리드 클라우드 혼용 시나리오가 현실화하기 시작했다.

이는 국민메신저 카카오톡 서비스를 제공하는 카카오의 클라우드 개발자가 바라본 최근까지의 흐름과 전망을 세 줄기로 압축한 얘기다. 카카오 공용준 클라우드파트 리드가 이 메시지의 주인공이다.

그는 지난 18일 서울 중구 페럼타워, 삼화타워, T타워에서 열린 오픈소스 클라우드 기술 컨퍼런스 '오픈인프라스트럭처 앤드 클라우드네이티브데이즈 코리아 2019(Open Infrastructure & Cloud Native Days Korea 2019)' 1일차 현장의 세번째 기조강연자로 나섰다.

클라우드 업계 주요 흐름으로 소비처의 활용전략과 제공자의 수익성이 맞물린 SaaS 중시 경향, 기존 오픈소스 라이선스와 클라우드 서비스의 충돌 문제 심화, 설득력이 커진 멀티·하이브리드 클라우드 시나리오 확산 가능성이 제시됐다. [사진=Pixabay]

기조강연에선 기업 IT인프라의 진화 과정상 이제 클라우드 기반으로 비슷한 자원을 쓰면서 어떻게 차별할 것인지 고민하는 '전략'이 중요해졌다는 지적과, IaaS보다 운영은 간편하면서 현업의 문제를 실제 해결 가능한 SaaS의 시장 기회가 크다는 전망이 나왔다.

프로젝트의 라이선스가 클라우드 사업자를 견제하는 쪽으로 바뀐 몇몇 사례도 소개됐다. 그 배경은 주요 다국적 기업이 자사 클라우드 서비스에 인기 오픈소스 SW를 제공해 수익을 거두면서, 해당 오픈소스 프로젝트와 커뮤니티에 별 기여를 하지 않는 행태가 지적됐다.

기업의 레거시 인프라와 프라이빗 클라우드, 다수의 퍼블릭 클라우드를 혼용하면서 각각의 장점을 극대화할 수 있는 방안이 설득력을 얻고 있다는 진단이 나왔다. 오픈소스는 이런 혼용 환경의 기술적 과제를 극복할 수단을 이미 제공해, 카카오도 그 덕을 본 곳으로 묘사됐다.

공 리드는 기조강연에서 이런 내용을 담은 클라우드 분야의 쟁점과 이슈, 그 의미와 향후 오픈소스와 오픈 인프라가 클라우드의 진화 방향을 돕는 방식을 설명했다. 카카오가 이런 오픈소스의 흐름을 이용해 어떻게 클라우드를 만들고 있는지도 간단히 언급했다.

카카오 공용준 클라우드파트 리드는 지난 18일 열린 오픈인프라스트럭처 앤드 클라우드네이티브 데이즈 코리아 컨퍼런스 1일차 세번째 기조강연을 진행했다.

행사는 오픈스택, 쿠버네티스, 세프, OCP, 네 오픈소스 프로젝트의 한국 커뮤니티 연합 주최로 열렸다. 네 커뮤니티와 오픈스택재단(OSF), 정보통신산업진흥원(NIPA)이 '오픈 앤드 인텔리전트 인프라스트럭처'라는 부제로 행사를 주관했다.

카카오, 삼성, SK텔레콤, 라인, 맨텍, 뉴타닉스, F5네트웍스, SK주식회사 C&C, 레드햇, 뉴렐릭, OSF, 클라우드네이티브컴퓨팅재단(CNCF), 넷앱, 엣지코어네트웍스, 패킷, 한빛미디어, 책만이 후원사 명단에 이름을 올렸다.

■ IaaS로 시작한 클라우드, PaaS 지나 결국 SaaS 향한다

그는 먼저 "클라우드와 (기업 실무자의) 비즈니스, 실제로 해야 하는 일의 결합이 심해지고 있다"고 지적했다. 기업이 클라우드라는 개념을 다루는 관심사를 '기본(basic)', '표준(standard)', '서비스(service)', '전략(Strategy)'이라는 네 단계로 구분하면서다.

국내에 2010년 초반 실제 구축된 클라우드의 기본 수준은 'IT코스트센터', 즉 그저 돈 먹는 하마였다. 큰 돈을 들여 만들어졌지만 이후 효율적으로 잘 사용된다고 보기 어려웠다. 클라우드로 제공되는 IT자원을 수작업으로 관리하고 있었기 때문이다.

2010년 중반께 효율을 위해 API로 동작하는 클라우드, '프로그래머블 리소스 매니지먼트'라는 정의가 나왔다. 표준 기반 자동화 관리가 중요해진 시기다. 공 리드는 "클라우드가 API로 동작하려면 내외부 비즈니스가 표준화돼야 한다"며 "표준이란 단어가 나오면서 API를 어떻게 구현하나, 비용효율이라는 현실, 자동화할 수 있지 않을까, 이런 얘기가 나오기 시작했다"고 말했다.

다음 진화 방향의 키워드는 서비스였다. IT자산을 곧 비즈니스로 인식하고 IaaS와 PaaS 기반의 서비스를 활용하는 시기다. 공 리드는 "애즈 어 서비스(as a Service)라는 말을 많이 쓰는데, 여기서 말하는 '서비스'는 IT서비스, 즉 앱서버, 웹서버, DB서버를 통해 사용자가 직접 (IT를) 쓸 수 있게 해 주는 것을 의미한다"면서 "IT자산이 비즈니스화하는 시대에 살게 됐다"고 언급했다.

카카오 공용준 클라우드파트 리드의 '오픈인프라데이즈코리아2019' 기조강연 발표자료 일부. 클라우드서비스 기능과 비즈니스가 결합되면서 활용 전략이 중요해지는 추세임을 나타낸다.

그는 이어 "아마존웹서비스(AWS)부터 후발주자까지, 그들의 IT자산을 외부에 쓰라고 내놓고 외부 기업이 그 IT자산을 쓰면서, '우린 어떻게 더 발전할 수 있나'를 고민하는 '전략'이 중요해졌다"며 "이 때부터 SaaS가 좀 더 주요한, 클라우드를 이끄는 키워드가 돼 간다"고 지적했다. IT를 비즈니스의 전략적 파트너로 인식하고 SaaS 기반 서비스 활용에 집중하게 된다는 얘기다.

공 리드는 "한국에서 이 과정이 짧게는 4년, 길게는 10년밖에 걸리지 않았다"며 "기업은 내부 조직과 외부 협력사, 벤더를 두고 있는데 과거에 맞춰진 프로세스와 그걸 지원하는 기술을 다 바꾸고 진화시켜야하는 숙제를 떠안게 됐다"고 말했다. 그는 "기술 분야에서 사람이 점점 중요해지는 시대"라며 "클라우드의 방식으로 어떻게 사람들을 잘 설득하고 변화시켜야 하는가가 가장 어려운 부분"이라고 덧붙였다.

그는 발표 중반부에 "특정 회사 외엔 클라우드로 인프라를 제공해 돈을 벌 수 없다는 것이 거의 정답인데, 기업들에겐 이미 비용과 자원이 투자된 상황에서, 플랫폼으로 가면 좀 더 이익이 괜찮을 수 있다는 기대를 갖게 된다"면서 "결국 (사업자가) 클라우드로 하고 싶은 건 SaaS"라고 지적했다. 이어 "아마존이 클라우드 시장에서 제일 크다 이런 얘길 하지만, 비즈니스 도메인의 문제를 풀어주는 제품이 돈을 훨씬 더 많이 벌고 있고, IaaS보다 SaaS가 오히려 요구사항이 간단하다"고 설명했다.

공 리드는 클라우드 자원으로 제공되는 IT서비스가 다국적 클라우드서비스 사업자가 전면에 나선 인공지능(AI) 관련 흐름과도 관련이 있다고 봤다. 그에 따르면 클라우드 기반으로 제공되는 일명 '서비스형 인공지능(AI as a Service)' 기술이 큰 효용을 얻고 있다. 더불어 목적별 성능을 넘어 그 영역내 특정 기능을 잘 처리하는 AI 역량이 중시될 전망이다.

공 리드는 "전세계 휩쓴 AI가 구글의 비전API, 아마존 비디오AI 이런 식으로 클라우드서비스로 전환됐다"며 "여러분이 AI를 잘 몰라도 (클라우드 AI 서비스에) 데이터를 올리면 분석해 줄 수 있다"고 지적했다.

카카오 공용준 클라우드파트 리드의 '오픈인프라데이즈코리아2019' 기조강연 발표자료 일부. 클라우드 개발과 클라우드 네이티브 개발의 경계는 불분명하다는 메시지.

그는 "2016년쯤, AI가 없으면 큰일날 줄 알았던 시기가 있었고 대다수 엔터프라이즈 회사가 가리지 않고 AI에 투자했다"면서 "2018년쯤 '우리가 생각하는 범용적인 AI는 없다'는 평가가 나왔고, (AI가) 이제 자율주행 중에서도 '비전' 처리에 더 좋더라 이런식의 특정 분야로 가고 있다"고 설명했다.

이어 업계에서 유행하고 있는 '클라우드네이티브(Cloud-native)'와 '클라우드' 구분짓기는 실질적으로 의미가 크지 않다는 견해를 덧붙였다.

그는 "클라우드서비스 API를 사용해 뭔가 개발하면 '클라우드 유저'고 '클라우드네이티브'한 것이라고 생각하는 이들이 있고 나도 그게 맞다고 생각했다"고 말했다. 이어 "그런데 클라우드 유저가 만든 클라우드서비스 하위 API를 '클라우드 디벨로퍼'가 쓰는 현상도 일어나, 사실 두 영역과 개발자의 툴셋을 구분지을만한 차이가 없다"며 "(두 영역간) 혼종과 매시업이 일어나고 있는 상황이지만, 업계는 좀 더 발전된 느낌을 갖기 위해 계속 클라우드 네이티브를 강조할 것"이라고 내다봤다.

■ 오픈소스 프로젝트와 클라우드 서비스 운영주체의 라이선스 충돌

몽고DB, 레디스, 엘라스틱, 오라클JDK 등 기존 오픈소스SW에 채택된 라이선스와 이 오픈소스SW를 이용하려는 클라우드 사업자의 비즈니스 모델이 충돌하고 있다는 지적이 이어졌다.

카카오 공용준 클라우드파트 리드의 '오픈인프라데이즈코리아2019' 기조강연 발표자료 일부. 클라우드 서비스 사업자와 라이선스 충돌 문제를 겪고 있는 사례 소개 슬라이드.

공 리드는 "작년 중반 몽고DB가 서버사이드퍼블릭라이선스(SSPL)를 미국 오픈소스이니셔티브(OSI)에 제출했다"며 "서비스형 몽고DB를 제공하는 'A사(아마존)'와 'G사(구글)' 때문"이라며 "(클라우드사업자가) 오픈소스를 많은 사람들이 잘 쓰게 하도록 하고는 있지만 잘 쓰게 하기 위한(개선된) 코드를 공개하지 않는다"고 지적했다.

이어 "몽고DB 입장에선 컨트리뷰터(오픈소스 프로젝트 기여자)가 계속 들어와 소스가 발전해야 제품이 좋아지는데, 클라우드라는 '혹'이 생긴 것"이기에, 몽고DB가 클라우드사업자더러 "라이선스 충돌이 있으니 우리와 비용을 얘기하거나 코드를 내놓으라고 하고 있다"고 설명했다.

그는 또다른 인기 오픈소스SW 레디스 역시 '레디스오픈소스어베일러블라이선스(RSAL)'라는 걸 만들어, SSPL를 만든 몽고DB와 똑같은 라이선스 이슈를 제기했다고 소개했다. 클라우드서비스 업체가 그 인프라에서 레디스를 제공하지만, 개선된 코드가 레디스 프로젝트에 들어오지 않는 상황이라고 지적했다.

공 리드는 "돈도 돈이지만, 코드가 (오픈소스 프로젝트에) 들어와야 커뮤니티를 확장하고 실제 개발하는 분들이 계속 관리를 할 수 있는데 그게 안 됐기 때문에, 레디스도 RSAL을 만들었다"며 "이 라이선스가 좋은지, 더 나은지, 적합한지의 판단은 차치하고 OSI에서는 (그게 오픈소스 라이선스로 인정될 수 있는지를) 심사중이고, 그 판단이 어떻게 나오냐에 따라 (다른) 오픈소스에 크게 영향이 갈 것"이라고 말했다.

AWS와 마찰을 일으킨 엘라스틱 사례도 언급됐다. 공 리드는 "엘라스틱도 '특정 회사'와 라이선스 이슈를 겪었다"며 "그후 특정 회사는, 저희 쪽 표현으로는 '(라이선스) 세탁'을 해서, '오픈 디스트로 포 엘라스틱서치'라는 걸 만들었다"고 지적했다. 그는 "사용자들에게 '라이선스 충돌 없는 버전이니 이걸 쓰세요'하는데, 누군가를 비난하려는 게 아니라 (전반적인 상황이) 그렇게 돼 가고 있다"고 덧붙였다.

이런 문제는 몽고DB, 레디스랩스, 엘라스틱 등 독립적인 오픈소스 프로젝트 지원 사업자만 겪는 게 아니다. AWS는 프로덕션용으로 쓸 수 있는 자체 오픈JDK 배포판 '아마존 코레토'를 내놓았다. 이 역시 오라클JDK의 라이선스를 '세탁'한 버전으로 볼 수 있다.

공 리드는 "성공한 비즈니스를 지속성있게 유지하는 게 가장 큰 문제가 되는데, 클라우드 환경에선 (성공 이전 단계에 도입한 오픈소스SW의) 라이선스 이슈가 있게 된다"며 "(오픈소스SW를) 갖다 쓰는 분들과 커뮤니티 내부에 아주 많은 논쟁이 일어나는 상황이고, 라이선스 충돌 문제가 점점 심각해지고 있다"고 말했다.

■ 프라이빗·퍼블릭 클라우드 장점 취하고 단점 상쇄하기

클라우드를 쓰고자하는 기업 시장에서 멀티클라우드, 하이브리드클라우드 도입 시나리오가 현실적인 방안으로 검토되고 있다는 진단도 나왔다. 한국에서도 다수 퍼블릭클라우드 서비스 사업자와 오픈소스 클라우드 솔루션 제공자들이 이를 제안하는 상황이다.

카카오 공용준 클라우드파트 리드의 '오픈인프라데이즈코리아2019' 기조강연 발표자료 일부. 클라우드 성숙도 모델에서 중간 쯤을 지나 헤테로지니어스 클라우드 활용 단계로 가고 있다는 진단.

먼저 공 리드는 '오픈 데이터센터 얼라이언스'에서 공개한 6단계 '클라우드성숙도모델(CMM)' 도안을 제시했다. 도안은 전용 인프라에 레거시 애플리케이션을 돌리는 '성숙도0' 상태부터 활용도를 가늠하는 '성숙도1', 소규모 도입을 추진하는 '성숙도2', 자동화 클라우드를 추구하는 '성숙도3', 하이브리드 클라우드를 수작업으로 통합하는 '성숙도4', 자동으로 통합하는 '성숙도5'까지의 개념을 소개하고 있다.

공 리드는 "저희는 이 정도(성숙도3~5사이)를 지나는 것 같다"며 "(단일) 클라우드에서 멀티클라우드로 갈 때 '데브옵스'와 '클라우드네이티브'라는 단어가 나오고, 표준화를 거치면서 그 다음이 쉬워진다"고 설명했다.

그는 이 멀티클라우드와 하이브리드클라우드 트렌드를 묶어서 '헤테로지니어스 클라우드'라고 표현했다. 멀티클라우드는 다수의 퍼블릭클라우드, 하이브리드클라우드는 프라이빗클라우드와 퍼블릭클라우드만을 놓고 얘기하는 개념이라 포괄적이지 않은 느낌을 준다는 이유에서였다. 요컨대 헤테로지니어스 클라우드는 여러 퍼블릭클라우드와 기업의 자체 프라이빗클라우드를 혼용하는 시나리오를 의미한다.

공 리드는 프라이빗 클라우드와 퍼블릭 클라우드의 이점을 온전히 모두 취하려면 헤테로지니어스 클라우드로 가야 한다고 지적했다. 프라이빗 클라우드는 보안과 가성비가 좋고 조직의 기존 기술자산에 친숙한 장점이 있으나 기능과 확장성은 아쉬울 수 있다. 그와 반대로 퍼블릭 클라우드는 기능과 확장성이 넉넉한 반면 가성비와 기술 친숙성은 떨어진다.

카카오 공용준 클라우드파트 리드의 '오픈인프라데이즈코리아2019' 기조강연 발표자료 일부. 헤테로지니어스 클라우드가 설득력을 얻게 되는 배경은 프라이빗과 퍼블릭 클라우드의 장단점이 뚜렷하기 때문이라는 분석.

그는 "퍼블릭클라우드에서 보안성, 비용, 벤더 종속성은 초기 문제였다고 볼 수 있고 이제 어느정도 보안이 가능하고 비용도 절감이 아니라 합리적 소비라는 관점으로 접근할 순 있지만, 점점 벤더 종속성을 우려하는 상황"이라며 "이 점이 헤테로지니어스 클라우드로 가야 하는 또다른 이유고, 기술적으로 여러 인프라 통합 인증, 네트워크 연결, 가격과 퍼포먼스 측정, 세 가지를 충족하는 게 챌린지"라고 덧붙였다.

오픈소스는 공 리드가 지적한 세 가지 기술적 과제에 'SAML 페더레이션' 인증과 '멀티 프로토콜 레이블 스위칭(MPLS)' 지원 리눅스의 네트워킹과 오픈트레이싱 및 오픈센서스를 결합한 '오픈텔레메트리' 기반 측정 등 해법을 제공한다.

카카오는 자체 클라우드의 베어메탈 서버, 도커, KVM 가상화 시스템과 AWS, 마이크로소프트 애저, 구글클라우드, 3사 인프라를 묶은 '헤테로지니어스 클라우드'를 활용하고 있다. 이를 운영하기 위해 크레인(KRANE), 케미(KEMI), DKOS, 세 가지 관리 플레인을 구성했다. 크레인은 추상화된 자원을 API로 제공하고, 케미는 중앙화된 측정API를 제공하며, DKOS는 인프라 자동 배포 API를 제공한다.

관련기사

공 리드에 따르면 카카오 전체 인프라 가운데 40% 가량의 인스턴스가 가상화돼 있다. 가상화 인스턴스 중 65%는 컨테이너 형태로 작동한다. 이런 서비스 인프라에서 발생하는 로그 색인 데이터 용량은 매일 80테라바이트(TB)다. 트래픽과 저장공간에 들어가는 비용을 제외하고 순전히 인스턴스를 운영하는 비용만 계산했을 때 연간 8천만달러(약 1천억원)에 달한다.

공 리드는 "모 (퍼블릭클라우드서비스) 회사 대비 우리(카카오 클라우드 인프라)의 인스턴스당 비용이 얼마인지 파악해 보니, 규모가 클수록 비용이 줄어드는데 지금 100분의 1 수준으로 가고 있다"며 "이렇게 발전할 수 있었던 이유는 여러분을 비롯한 CNCF, CEPH, OCP, 오픈인프라 오픈소스 커뮤니티와 우리의 기여 활동을 통한 오픈소스의 발전 덕분"이라고 밝혔다.