script - Githubissues

[표지 1page] 안녕하세요. “Big Data with NAVER Cloud"라는 주제로, "네이버클라우드가 바라보는 빅데이터에 대한 이야기를 전할 네이버클라우드의 김홍진이라고 합니다.

최근 1-2년 사이에 데이터에 대한 얘기들이 정말로 많이 나오고 있습니다. 이와 더불어, AI 기술 등 여러 디지털 기술들이 물밀듯이 들어오고 있는 상황입니다. 이러한 기술들을 활용한 디지털 트랜스포메이션을 통해 새로운 비즈니스 모델을 개발하는 곳도 많아지고 있는데요. 여기서 Data는 일하는 방식 자체를 기존과 다르게 변화시키고, 새로운 기회를 찾을 수 있는 무기가 되고 있는 것 같습니다.

[2page]

오늘 저는 이러한 시대적인 상황에서 네이버 클라우드가 어떻게 빅데이터를 보고 있고, 어떠한 노력들을 하고 있는지를 말씀 드리려 합니다.

[3 Page] 본론에 앞서, 네이버가 오랫동안 서비스를 운영하고, 또 실행해온 경험이 네이버 그 자체를 빅데이타 환경으로 만들었지 않았나 생각해봅니다. 실질적으로 보면, 네이버에서 1초동안 발생되는 데이터는 보시는 바와 같습니다. 매초 상당량의 데이터가 생성되고 있는데요. 이렇기 때문에 네이버는 자연스럽게, 방대한 이 데이터들을 어떻게 하면 더 안전하게 관리하고, 효과적으로 처리할지에 대해 늘 고민해왔습니다. 네이버의 IT 서비스 전반을 운영해온 네이버클라우드가 빅데이터와 관련된 여러 도전과 경험들을 할 수밖에 없었던 기업이었다는 점을 말씀드리고 싶었습니다.

[4 Page] 또 중요한 점은, 당연한 이야기이지만, 네이버는 다른 기업에 비해 탁월한 품질의 한국어 데이터를 다량 보유하고 있다는 점입니다. 어제 있었던 클로바 성낙호 책임리더님의 키노트에서 이미 살펴보셨을 텐데요. 장표에 표현된 것처럼, 네이버는 이미 많은 모수의 한국어 데이터를 갖고 있어, 그만큼 한국 기업들에게 우수한.. 가치 있는 정보들을 제공할 수 있습니다.

GPT-3 와 비교했을 때 무려 6,500배 이상의 한국어 데이터를 갖고 있는 네이버의 하이퍼클로바만 봐도, 그 규모가 엄청나보이죠?

이렇게 관리해야 하는 데이터가 매년 기하급수적으로 늘어나면서 이러한 데이터를 처리할 IT 장비와 인프라 규모도 폭발적으로 커지고 있는 상황입니다.

[5 Page]

그래서 네이버클라우드는, 이러한 광범위하고 다양한 데이터를 운영하고 관리해야 하는 역할을 수행하면서 항상 다음과 같은 고민을 해왔습니다.

**첫째, 이렇게 방대한 규모의 데이터를 처리할 인프라 성능과 용량, 데이터가 흘러 다니는 유통 체계에 대한 부분을 어떻게 효율적으로..효과적으로 관리할 것인가?

둘째, 이러한 데이터를 활용하기 위한 인프라 외에.. 어떤 기반 기술을 통해 보유하고 있는 데이터의 가치를 극대화 시킬것인가? 이것도 고민이었습니다. 다양한 디지털 기술들을 어떻게 구성하고 운영해야 도움이 될지.. 인공지능과 빅데이터 분석과 같은 것들을 실제 업무 시스템에 어떻게 적용할 수 있을지.. 이런 것들도 늘 고려 대상이었죠.

셋째, 실제 엔드 유저나, 기업 고객들의 업무 관점, 즉 산업 specific한 요구 관점에서 봤을 때, 지금 네이버가 보유하고 있는 데이터를 가치화해서 이를 서비스 그 자체의 형태로 제공할 수 있을까에 대한 생각도 많이 해왔습니다. 실질적으로 네이버는 여러 컨텐트 서비스에 이렇게 보유하고 있는 데이터를 활용해서 지능화된 정보 서비스를 제공하고 있는데요. 네이버 스마트 스토어 같은 것이 한 예이기도 합니다.**

[6page]

이러한 고민들을 토대로, 네이버클라우드는 빅데이터와 관련된 도전 영역을 다음과 같이 한 단계 더 확장해나갔습니다.

'데이터 자체의 서비스화'를 실현하기 위해 어떤 것들을 어떻게 제공해야 할지, 그리고 '인프라와 서비스의 지능화'를 위해 어떤 데이터와 기술을 활용해야 할지, 더불어, 이를 뒷받침 해주는 인프라를 어떻게 구성하고, 안정적인 Capa 확보를 위해 어떤 노력을 해야할지..
저희는 이러한 것들을 늘 고민해왔고, 그런 고민의 결과들을 네이버 클라우드 플랫폼 서비스에 적극적으로 녹여왔습니다.

[7 Page] 앞에서 말씀드린 내용은 이렇게도 말씀드릴 수 있을 것 같습니다.

기업마다 갖고 있는 자사 데이터와 네이버가 보유한 데이터를 연동해서 새로운 가치를 획득할 수 있다면, 비즈니스에 많은 도움이 되겠죠?

네이버클라우드는 이러한 고객 니즈에 일찍부터 집중해왔고, 그 결과, 이를 실현할 수 있는 데이터와 분석 플랫폼, AI 서비스, 그리고 다양한 디지털 기술들이 총집합된 데이터센터와 같은 고성능 인프라 환경까지.. end to end의 전방위적 역량을 갖게 되었습니다.

(인텔에서 요청한 내용) 빅데이터를 이야기할 때 빠질 수 없는 고성능 인프라 환경에 대해서는 드릴 말씀이 많은데요. 최고의 AI 기술을 제공하고, 효과적인 빅데이터 분석 환경을 구축하기 위해 국내 기업 뿐만 아니라 글로벌 벤더들과도 긴밀히 협업하고 있습니다. 어제 있었던 트랙 세션 중에서, 인텔 나승주 상무님의 발표를 이미 보고 오신 분도 계실 것 같은데요. 해당 발표에서처럼 네이버클라우드는 인텔과도 오랜 시간동안 기술적으로 교류해오면서, 제온 CPU와 같이, 다양한 워크로드에 최적화된 인프라를 구축하는 등, 우리가 얻고자 하는 최상의 결과를 내기 위해 다방면으로 협업하고, 또 노력하고 있습니다.

[8 Page] 이번에는 전체적인 네이버 클라우드 플랫폼의 상품 포트폴리오 형식으로 펼쳐보겠습니다.

크게 인프라 영역 / 플랫폼 영역 / 솔루션 영역으로 구분을 지어봤는데요.

앞서 말씀드린 고성능 인프라 영역을 보면... (HPC, GPU, 하이브리드 클라우드, 5G 기반 엣지 클라우드 등에 대한 이야기를 덧붙여 주시면 좋을 것 같습니다.)

플랫폼 영역에서는 다양한 AI 서비스와 분석 플랫폼을 말씀드릴 수 있겠습니다.. (세부 설명 추가해주실 수 있으실까요?)

이와 같은 서비스와 플랫폼을 각 산업별 니즈에 맞게 묶어서 제공하는 vertical 특화 solution도 네이버클라우드의 중요한 무기라고 할 수 있습니다.... (버티컬 솔루션에 대한 추가 설명을 덧붙여주시면 좋을 것 같습니다.)

[9 Page] 지금까지 전체적인 그림을 보셨다면, 이제는 세부적으로 예를 들며 설명을 드리겠습니다.

앞서 말씀드렸던 데이터의 서비스화, 즉 Data as a Service 에 대한 네이버클라우드의 고민의 결과를 소개한다면, Cloud Data Box를 가장 먼저 말씀드릴 수 있을 것 같습니다. Cloud Data Box는 기업이 보유하고 있는 데이터와 네이버의 빅 데이터를 안전한 클라우드 환경에서 연동 분석해서 차별화된 비즈니스 인사이트를 발굴할 수 있는 종합 분석 플랫폼 서비스인데요. 출시 전부터 시장에서 많은 관심을 받고 있는 서비스인만큼, 드릴 말씀이 많습니다. 제 키노트에서는 예고편 느낌으로 살짝 말씀드렸는데요. 이 상품에 대한 더 자세한 내용과 활용 사례는 이따 3시에.. 첫번째 트랙에 배치된 네이버클라우드 문정욱 님의 별도 세션에서 만나보실 수 있을 겁니다. 궁금하신 분들께서는 해당 세션을 시청해주시면 도움이 되실 것 같고요.

이어서, Data Analytis Service에 대해서도 소개해드리면, 이 상품 역시 Data as a Service의 한 예라고 보실 수 있습니다. 나의 웹 사이트에 방문한 고객의 행동 데이터를 다각도로 분석해서 고객과 시장에 대한 이해도를 높일 수 있습니다.

이 두 개의 상품은 모두 네이버 클라우드 플랫폼 포털에서 신청하시고, 이용하실 수 있습니다.

검증이 된 서비스인지도 선택하시는 데 있어 중요한 결정 요소이실 텐데요. 이러한 서비스들은 실질적으로 이미 네이버의 여러 컨텐트 및 커머스 서비스에 녹아 들어가서 서비스 되고 있는 상황입니다.

[10 Page] 다음은 초거대AI모델인 HyperClova 클라우드입니다. 어제 있었던 AI 발표들을 놓치신 분들도 계실 것 같아서, 제가 이 장표에서 관련 설명을 좀 더 드릴게요. 하이퍼클로바는 이미 발표된 것과 같이, 국내 최초의 초대규모 AI 로, 모두를 위한 AI 시대를 이끌어 갈 무기로서 사용자에게 정말로 차별화된 서비스를 제공할 것입니다. 세계 최대 한국어 언어모델로 AI 주권을 확보하고자 하는 노력으로도 볼 수 있는데요. 현재 다양한 네이버 서비스에 적용될 계획을 갖고 있고, 네이버 클라우드 플랫폼의 다양한 AI 서비스를 통해서도 곧 하이퍼클로바의 강력한 힘을 만나보실 수 있을 겁니다.

[11 Page] 다음은 업무 영역에 적용된 사례 중 하나인 CLOVA AiCall 기반의 컨택센터 입니다. 지금의 코로나 상황에서 서로의 안전을 위한 노력 중 하나로, 비대면 업무 환경 구축이 중요해졌죠. 직접 얼굴을 보고 커뮤니케이션하지 않더라도, 효과적으로 일이 진행될 수 있도록 돕는 기술이 주목받고 있는데요. CLOVA AiCall은 그러한 기술의 집합체라고 볼 수 있고, 이 또한 제가 앞서 이야기 한 하나의 버티컬 솔루션으로도 볼 수 있습니다. AI 상담원이 엔드유저와 원활하게 소통하여 원하는 정보를 정확하게 확인하기 위해서는 똑똑한 AI 모델이 필요하고, 이 AI 모델을 지속적으로 학습시키기 위한 데이터 플랫폼이 필수적으로 뒤따릅니다. 이를 일반 기업에서 자체적으로 구축하고, 학습하고, 서비스화하려면 정말 많은 비용과 시간을 투자해야 할텐데요. 네이버클라우드는 이미, 앞에서 말씀드린 대로 모든 영역에 대한 역량을 갖춰놓았고, 이를 기업에게 그대로 서비스로 제공하고 있기 때문에 많은 기업의 리소스를 아껴주고 있다고 볼 수 있습니다. 네이버가 기존에 인프라에 많은 투자를 진행해왔고, 또 여러 도전과 노력을 했기 때문에 지금의 CLOVA AiCall을 제공할 수 있게 됐고, 이 솔루션으로 인해 상당한 비용 효과는 물론, 공공의 이익이 되는 결과들까지 많이 만들어나가고 있습니다.

[12 Page ] Data Forest 상품도 빼놓을 수 없는데요. Data Forest란, 다양한 빅데이터 프레임워크들을 앱으로 생성해 사용자가 쉽고 빠르게 자신만의 분석 환경을 구성할 수 있는 빅데이터 통합 분석 플랫폼으로 ML을 위한 텐서플로우(Tensorflow), 파이토치(PyTorch) 등 오픈소스 라이브러리와 빅데이터 분석을 위한 하둡(Hadoop) 기반의 다양한 오픈소스 프레임워크를 제공한다. 대용량 데이터 저장, 처리에 필요한 빅데이터 에코시스템 뿐만 아니라 GPU 리소스를 활용한 딥러닝 분석이 가능한 인프라를 지원한다.

[13 Page] 마지막으로 이러한 거대한 데이터 및 새로운 기술들을 수용해서 안정적인 서비스를 맘껏 제공할 수 있는 슈퍼 데이터 센터가 한창 건축 중에 있습니다. '각 세종'이라는 이름으로, 2023년 상반기 오픈 목표로 지어지고 있는데요. 각 세종은 현재 춘천에 있는 데이터센터 대비 6배 더 큰 용량으로 확장되어 Hyperscale의 데이터센터로 선보여질 예정입니다.

각 세종을 왜 짓게 됐는지, 어떤 기술이 적용될 건지 등등 좀 더 자세한 내용은 트랙 two에서 있을 김재필 님의 세션을 통해 확인하실 수 있을 겁니다.

[마지막 14 page]

벌써 마지막 장표네요.

네이버클라우드는 데이터가 가장 큰 무기가 되고 있는 지금 이 시대에서 사용자에게 차별화된 서비스를 제공하고, 이를 통해 많은 사람들이 더 큰 가치를 창출할 수 있도록 서비스 업무, 인프라, 데이터, 센터 등 전방위적인 역량 체계를 글로벌 수준으로 준비하고 실행하고 있습니다.

지금 이 행사를 함께 하고 계신 여러분들께서도 네이버 클라우드 플랫폼의 데이터 관련 서비스를 적극 활용하셔서, 거기서 발생되는 가치를 마음껏 누리실 수 있길 바랍니다.

앞으로도 많은 관심 부탁드립니다. 감사합니다.

kr039503 / CTS-Team

script #30