Aug 19, 2024

소버린 AI : AI 시대 네이버의 새로운 도전과 과제

Image for 소버린 AI : AI 시대 네이버의 새로운 도전과 과제

AI 시대의 과제, 소버린 AI

여러분은 소버린 AI (Sovereign AI)라는 말을 들어보신 적 있나요? 소버린은 ‘자주적인’, ‘주권이 있는’이라는 의미로 자국의 정책이나 자원에 대한 독립적인 통제권을 의미합니다. 최근 소버린의 개념은 기술과 데이터의 영역으로 확장되어 더욱 중요한 의미를 갖게 되었습니다. 이는 기술과 데이터 주권이 국가의 독립과 안보에 중요한 요소가 되었음을 나타냅니다.

생성형 AI 시대, 소버린 AI는 무엇이며 어떻게 대비할 수 있을까요?



기술의 발전과 AI
인간 문명은 혁신적인 기술 진보를 거듭하며 발전해 왔습니다. 최근 AI가 인류 역사상 가장 강력한 게임체인저로 부상하면서, 우리는 새로운 변곡점에 서게 되었습니다.


AI는 인간의 지적 능력과 창의성에 새로운 차원을 열어 줌으로써 그동안 물리적으로 불가능했던 문제들을 해결할 것으로 기대됩니다. 동시에 전례 없는 파급력으로 인한 우려도 공존합니다. 데이터 프라이버시, 윤리 및 보안 이슈, 경제적 존속, 문화적 획일화 등입니다. 소버린 AI는 이러한 문제를 해결하기 위한 접근 방식입니다.




최근 가트너의 하이프 사이클 그래프에도 소버린 AI가 새롭게 등장했습니다. 하이프 사이클 그래프는 기술 혁신의 성숙 단계를 시각화하는 그래프로, 가트너는 향후 5년 이내에 소버린 AI에 대한 대비책을 갖고 있는 국가와 그렇지 못한 국가 간 격차가 현저하게 벌어질 것으로 전망합니다.


소버린 AI
소버린 AI는 각 국가가 자체 데이터와 인프라를 활용하여 그 국가나 지역의 제도, 문화, 역사, 가치관을 정확하게 이해하는 AI를 개발하고 운영하는 것을 의미합니다. 하지만 모든 국가가 높은 수준의 AI 개발 및 운영 역량을 보유하는 것은 현실적으로 어렵습니다.


따라서 소버린 AI를 판단할 때 기술적 자립 여부보다는 해당 국가가 사용하는 AI에 자국의 가치관과 윤리, 문화적 특성이 충분히 반영되었는지, 그리고 해당 국가의 이익과 존속을 지켜낼 수 있는지를 기준으로 삼는 것이 더 합리적입니다. 후자의 관점에서는 AI 학습에 활용하는 데이터와 독립적인 클라우드 인프라 요건이 중요합니다.


비교우위론과 자유무역 원칙에 따르면, 경제 주체는 상대적으로 더 효율적으로 생산할 수 있는 재화에 특화하는 것이 전체의 이익을 극대화합니다. 그러나 AI 분야에서 독과점을 견제하고 AI 주권과 소버린 AI에 특별한 관심을 기울여야 하는 이유는 무엇일까요?


첫 번째로 문화적 다양성을 지키고 유지하기 위함입니다.
이는 생성형 AI, 거대 언어 모델(Large Language Model; LLM)의 메커니즘을 통해 쉽게 이해할 수 있습니다. 생성형 AI의 가장 큰 특징은 높은 수준으로 언어를 이해하고 콘텐츠를 생성하는 능력입니다. 이는 방대한 데이터 학습에 의한 것인데, 학습에 사용되는 데이터에는 불변의 지식뿐만 아니라 언어, 문화, 역사, 제도, 규범, 관습, 가치관 등이 모두 포함됩니다. 만약 특정 문화권의 편향된 데이터를 학습한 AI가 글로벌 시장을 독과점하게 되면 어떤 결과가 벌어질까요? 다른 문화권의 고유한 특성을 간과하거나 왜곡할 수 있으며, 이는 장기적으로 문화 종속과 획일화를 야기할 수 있습니다.


이는 실제로 진행 중인 문제이기도 합니다. 현재 패권을 장악하고 있는 글로벌 빅테크 기업들의 AI 모델은 미국의 인터넷 데이터를 압도적인 비중(약 90% 이상)으로 학습한 것으로 알려져 있습니다.



두 번째는 AI 기술이 가진 잠재력과 파급력 때문입니다.
생성형 AI는 전기와 같이 과거 인류의 패러다임을 변화시킨 기술 혁명들을 훨씬 능가하는 영향력을 가질 것으로 평가되며, 이는 AI가 미래 사회의 핵심 동력으로 자리 잡게 될 것임을 시사합니다.
특정 국가의 AI 기술에 의존하게 되면 단순한 기술 비용의 문제를 넘어 국가 경제 정책의 자율성과 글로벌 경쟁력을 위협하는 종속 문제로 발전할 위험이 있습니다. 특히 LLM은 이용자가 많을수록 그 성능이 향상되는 특성이 있어, 시간이 지날수록 시장 독점과 기술 격차가 커질 수밖에 없습니다.


각 국가의 AI 개발 현황

  • 네이버의 HyperCLOVA는 2021년 세계에서 3번째로 공개된 LLM입니다.
  • 영국은 2023년부터 BritGPT 모델을 개발 중입니다.
  • 프랑스는 2023년 Mistral AI를 공개하였으나 영어 데이터 중심으로 학습된 모델입니다.
  • 중국에서는 바이두의 Ernie Bot, 알리바바의 통이치엔원이 출시되었으나 중국 정부 체제를 반영해야 합니다.
  • 아랍과 인도에서도 LLM 개발 프로젝트가 진행 중이지만 상용화 단계에 이르지 않았습니다.


유럽과 아시아 국가들도 자국의 언어와 문화를 반영한 LLM 개발을 준비하고 있습니다. 하지만 상당수의 선진국에서조차 가시적인 성과를 내지 못하고 있습니다. 이는 LLM 개발의 기술적, 경제적 난이도를 잘 보여줍니다.


AI 기술 격차는 국가 간 경제적 불균형을 심화시키고, 안보 위험과 일자리 문제 등을 초래하여 국가 경쟁력을 약화할 수 있는 주요 요인입니다. 이에 대한 현실적이고 합리적인 대안으로, 네이버의 HyperCLOVA X와 같은 모델이 AI 개발 역량이 부족한 국가들이 자국의 소버린 AI를 구축하는 기반이 될 수 있습니다.


AI 시대의 과제
소버린 AI는 AI 시대의 필수 과제입니다. 이는 단순한 선택의 문제가 아닌, 국가의 기술 주권과 문화적 정체성을 보호하기 위한 필수 요소입니다. 소버린 AI를 통해 우리는 AI 기술의 혁신과 편의를 누리면서도, 인류 문명의 다양성과 풍요로움이라는 소중한 가치를 지킬 수 있습니다.


또한 소버린 AI를 통해 다양한 국가와 기업이 참여하는 건전한 AI 생태계를 구축할 수 있습니다. 다양한 주체 간 경쟁과 공존은 기술 혁신을 가속화하고, 더 안전하고 효율적인 알고리즘 개발로 이어져 AI의 장기적이고 균형 잡힌 발전에 기여할 것입니다.






네이버의 새로운 도전, 소버린 AI

AI 개발 기술이 부족한 국가에서 AI 시대를 어떻게 준비해야 하는지, 그리고 네이버의 기술이 이런 국가에 어떠한 도움을 줄 수 있는지에 대해 이야기하겠습니다.


AI 시대의 정보 소비
생성형 AI는 LLM을 기반으로 텍스트, 이미지, 오디오 등 다양한 형태의 콘텐츠를 생성합니다. 즉 AI 산업에서는 대규모 데이터와 막대한 컴퓨팅 자원이 있어야 하고, 이는 자연스럽게 소수 빅테크 기업이 시장을 지배하는 구조로 이어졌습니다. (대표적인 LLM으로는 ChatGPT, Gemini, HyperCLOVA X 등이 있습니다.)


빅테크가 제공하는 AI 모델은 수많은 이용자와의 상호작용을 통해 재학습하고 발전을 거듭하며 강력해지고 있지만 앞서 언급한 문화적 편향이나 독점적 지배력에 대한 우려는 커지고 있습니다.


인터넷 시대에서 우리는 정보의 능동적인 소비자였습니다. 다양한 검색 결과를 비교 선별하고 정보의 진위를 의심하기도 했습니다. 미디어 피드를 스크롤 하며 관심 있는 내용을 골라 읽었고, 다양한 관점을 가진 뉴스 기사들을 비교하기도 했습니다. 하지만 LLM과 채팅형 AI가 등장하면서 정보의 소비 행태가 크게 변화하고 있습니다. 생성형 AI는 우리의 질문에 대한 해답을 미리 세팅한 설정에 따라 맞춤형으로 제공합니다.


생성형 AI 설정 예시

  • 페르소나 설정: “당신은 면접관입니다, 당신은 소설가입니다.”
  • 청자 설정: “기타리스트 지망생을 위한 좋은 기타 리프를 제공해 주세요.”
  • 참고 정보: “이력서 또는 채용공고를 참고해서 질문 리스트를 작성해 주세요.”
  • 구체적인 할 일: “기업 채무를 개선하기 위한 전략을 제시해 주세요.”
  • 룰: “특정 단어를 금지하거나 특정 주제에 대한 답변을 제한해 주세요.”
  • 포맷: “텍스트 형식에 대한 결괏값을 jason 형식으로 출력해 주세요.”
  • 예시: “다음의 예시를 참고해서 응답해 주세요, 다음과 같은 형식으로 출력해 주세요.”

이러한 편리함의 이면에는 사람들이 비판적 사고와 다양한 관점을 상실할 위험이 존재합니다. 이는 안전하고 책임감 있는 AI 모델을 고민하면서 가장 중요하게 고려되어야 할 요소이며, 다양한 AI 모델의 공존이 필요하다는 것을 시사합니다.


※ 더 알아보기 : 소설로 보는 정보 통제의 위험성


  • 조지 오웰의 소설 ‘1984’ 속 빅 브라더는 정보 흐름을 실시간으로 통제하고 정권의 필요에 따라 조작할 뿐 아니라 과거에 대한 해석을 독점함으로써 권력을 유지하고 미래를 통제했어요.
  • 올더스 헉슬리의 ‘멋진 신세계’ 속 사람들은 기술이 극도로 발전한 세상에서 편안하고 행복하게 살아가는 듯 보이지만 체제가 승인하는 극도로 제한된 범위의 정보와 자극적이고 쾌락 위주의 콘텐츠에만 노출되어 있어요.

두 소설 속 사람들은 모두 비판적 사고와 다양한 가치관을 억압당한 채, 체제에 의해 설계된 대로 살아갑니다. 각기 다른 양상을 보이지만, 정보 통제를 통해 사람들의 사고를 제한하는 디스토피아를 그리는 두 소설이 주는 교훈은 AI 시대에 더욱 중요하게 다가옵니다.


네이버의 기술 철학
네이버의 기술에는 세상의 다양한 가치에 대한 존중이 깔려 있습니다. 정보와 이용자를 잇는 검색, 누구나 최첨단 기술을 누릴 수 있는 기반이 되는 클라우드, 과거의 모든 데이터와 현실의 문제를 연결하는 AI에 이르기까지 네이버는 다양성을 통해 더 큰 가치를 창출할 수 있다는 철학을 바탕으로 사람과 지식, 기술을 연결하는 서비스를 실현하고 있습니다.


네이버의 ‘다양성 존중’에는 소버린 개념이 함께합니다. 예를 들어 네이버의 소버린 클라우드는 이용국 현지에 데이터 센터를 두고, 현지 국가의 데이터 저장 요건이나 정보 수집 등에 대한 법률을 준수하는 모델입니다. 이용 기업 입장에서는 외산 클라우드를 활용하면서도 민감한 워크로드 호스팅이나 개인정보 데이터 관리 등에 대한 완전한 제어권을 가짐으로써 자국의 데이터 주권을 수호할 수 있습니다.


AI 분야에서도 마찬가지입니다. 네이버가 제공하는 소버린 AI 모델은 AI 개발 역량이 부족한 국가들이 자국의 문화와 가치를 반영한 고유의 AI 모델을 구축하는 기반이 될 수 있습니다. 이는 네이버의 선진 기술을 토대로 각국이 AI 주권을 확보하고 건강하고 책임감 있는 AI 생태계를 함께 구축하는 것을 의미합니다.



네이버의 소버린 AI 경쟁력
미국과 중국을 제외한 많은 나라에서 소버린 AI의 필요성에 공감하고 AI 주권 확보를 위해 노력하고 있지만 기술 격차로 인한 제약이 존재합니다. 실제로 영어와 중국어가 아닌 지역 언어를 기반으로 초거대 AI 모델을 토대부터 구축할 수 있는 원천 기술을 보유하고, 클라우드 기반 AI 산업 생태계를 구축한 경험까지 갖춘 기업은 네이버가 유일하다는 것 알고 계셨나요?



HyperCLOVA X를 활용한 소버린 AI
2021년 네이버는 세계에서 3번째로 HyperCLOVA를 공개하였으며, 2023년에는 업그레이드된 모델 HyperCLOVA X를 출시했습니다. 네이버의 LLM은 비영어권 국가에서 개발한 자국어 모델입니다. 글로벌 모델에 비해 우수한 한국어 능력과 사회문화적 맥락에 대한 이해를 보여주며, 영어 능력 또한 경쟁력 있는 수준으로 평가되었습니다.


이는 HyperCLOVA X가 AI 역량이 부족한 국가들이 자국의 AI 주권을 실현하는 데 기반이 되는 모델이 될 수 있음을 시사합니다. HyperCLOVA X를 베이스 LLM으로 하는 소버린 AI는 해당 국가와 인접 국가의 언어로 된 데이터와 영어 데이터를 함께 학습시키는 방식으로 구현이 가능합니다. 이렇게 개발된 모델은 영어 기반의 전문 지식은 물론 자국의 역사, 사회, 문화에 대한 높은 이해도를 바탕으로 성능 경쟁력을 확보할 수 있습니다.


즉 네이버는 소버린 AI 확보를 원하는 국가들과 협력을 통해 해당 국가의 소버린 AI를 공동 개발, 투자, 운영하는 방식으로 기술을 수출할 수 있습니다. 네이버의 원천 기술을 바탕으로 각국의 AI 주권을 존중하고, 지속 가능한 성장 모델을 구축하는 것입니다. 이는 단순한 기술 수출을 넘어 글로벌 AI 생태계 발전과 국가 경쟁력 강화에 기여하는 일이기도 합니다.


Hybrid Cloud 기반 LLM 구현
LLM을 활용하는 데 있어 해당 국가나 기업의 민감한 데이터가 외부로 유출될 경우, 이는 다른 차원의 문제를 야기할 수 있습니다. 이를 방지하기 위해서는 LLM을 하이브리드 클라우드 방식으로 제공할 수 있는 역량이 필요합니다. 이는 상당한 투자가 필요한 작업으로, AI 주권을 지키고자 하는 많은 국가에서 네이버의 AI에 관심을 보이는 이유 중 하나도 하이브리드 클라우드 역량에 있습니다.


효율성 측면에서 본 소버린 AI
소버린 AI의 필요성을 논의할 때, 국가 주권에 대한 위험만큼이나 효율성 측면도 중요하게 고려해야 합니다. 당장은 빅테크 기업들의 AI가 편리하게 보일 수 있지만, 비용과 성능 측면에서 소버린 AI가 유리할 수 있습니다.


AI 성능은 학습한 데이터에 따라 상이합니다. 실제로 영어 데이터 중심의 글로벌 AI 모델들은 국가나 사용하는 주체의 맥락에 따라 다양한 성능을 보입니다. 이는 대형 기술 기업이 광범위한 언어를 포괄하는 역량을 가진 글로벌 AI를 개발하는 것보다, 특정 국가의 문화 및 언어에 강점을 가진 자국 AI를 개발하는 것이 개발 비용이나 최적화 관점에서 더 효율적일 수 있음을 의미합니다. 모든 언어에 대한 데이터와 요구사항을 처리해야 하는 글로벌 모델과 비교하면 훨씬 적은 양의 데이터 학습과 GPU 투자로도 모국어에 대한 언어 처리 능력을 높일 수 있기 때문입니다.


또한 AI는 다양한 비즈니스의 기반 기술로 활용되므로, 적용 측면에서의 효율성도 중요하게 고려해야 합니다. 동일한 투자 규모로 빅테크 기업의 범용 AI와 유사한 성능을 보장받기 위해서는 자국의 언어와 맥락에 최적화된 소버린 AI 모델이 가장 효과적인 선택지가 될 것입니다.


결론적으로 소버린 AI는 개발 비용 및 성능 측면에서도 효과적인 대안이 될 수 있으며, 비교적 작은 모델로도 이용국에 특화된 성능 구현이 가능하기 때문에 단기 기술 격차를 따라잡는 데에도 도움이 될 수 있습니다.


네이버가 만드는 AI 생태계
지금까지 소버린 AI의 개념을 살펴보고, 문화적 다양성과 정보 소비 방식의 변화, 효율성의 측면에서 소버린 AI의 필요성을 확인했습니다. AI의 급속한 발전으로 거의 모든 산업 생태계의 재편이 예상되는 중요한 변곡점에서 소버린 AI의 중요성은 더욱 커질 것입니다. 이는 국가의 문화적 정체성과 기술 주권을 지키기 위한 움직임이자, 급격한 변화의 흐름 속에서 각국이 자국의 속도에 맞게 변화를 관리하기 위한 방안입니다.


네이버는 AI의 발전으로 인한 혜택이 특정 문화권이나 국가에 편중되지 않고, 다양한 국가와 기업이 참여하는 건전한 AI 생태계를 구축하는 것이 중요하다고 생각합니다. 그래서 네이버는 소버린 AI를 위해 해결해야 할 다양한 과제들에 대해 고민하고 또 협력하고 있습니다. 기술의 편리함을 모두가 공평하게 누리면서, 문화적 가치와 다양성을 보존할 수 있는 환경을 만들어 가는 것이 AI 시대를 맞이하는 네이버의 ‘새로운 도전과 과제’입니다.