Jul 21, 2025

숲으로 자라는 씨앗의 다음 단계: HyperCLOVA X THINK

Image for 숲으로 자라는 씨앗의 다음 단계: HyperCLOVA X THINK

HyperCLOVA X SEED 뿌린 씨앗이 곳곳에서 싹을 틔우고 있습니다. 이제 우리는 위에 무성한 숲을 이루는 나무, HyperCLOVA X THINK 선보입니다. THINK 한국어와 영어를 동시에 이해하고 추론하며, 최대 128K 토큰의 문맥을 번에 파악할 있을 정도로 장문 지성으로 성장한 모델입니다. ‘한국어로 깊이 사고하는 AI’라는 오랜 바람이 현실이 되는 순간입니다.


생각(THINK)’인가?

소버린 AI: 한국을 위한 맞춤형 인공지능

기존의 글로벌 LLM(Large Language Model) 방대한 지식을 담고 있지만, 한국어의 미묘한 뉘앙스나 문화적 맥락을 완전히 반영하긴 어렵습니다. 교육, 행정, 비즈니스 다양한 분야에서 요구되는 높은 수준의 정확성과 규범 준수를 위해서는 현지 언어와 데이터, 정책이 긴밀히 결합된소버린 AI’ 필요합니다.


HyperCLOVA X THINK 6 토큰 규모의 한국어와 영어 데이터를 자체 파이프라인을 통해 정제하고, 네이버의 AI 기술을 바탕으로 학습했습니다. 결과, 단순한 언어 처리 능력을 넘어 한국 사회가 요구하는 문화적 감수성과 언어적 역량까지 고루 갖춘 모델로 탄생했습니다.


고급 추론: 단순한 답변이 아닌 사고의 흐름

많은 정보를 알고 있는 것만으로는 AI 실무에서 활용하기 어렵습니다. 실제 업무에서는 다음 가지 능력이 중요합니다:

  • 사용자 질문을 정확하게 이해하고,
  • 요청한 작업을 빠르고 정확하게 수행하며,
  • 근거와 과정을 투명하게 설명하는 .

HyperCLOVA X THINK 128K 토큰이라는 문맥을 번에 바라볼 있는 능력을 기반으로 사용자의 질문을 신속히 파악하여 정확하고 유용한 답변을 제공합니다. 또한 답변과 함께 판단 근거와 단계별 추론 과정을 제시하여 사용자 스스로 결과를 검토하고 신뢰할 있도록 설계했습니다.



데이터

  • 6 토큰 규모의 말뭉치 (한국어와 영어 중심)
  • 고품질 합성 데이터 포함

아키텍처

  • μP 기반 Peri-LN 구조의 Transformer
  • 128K 토큰까지 처리 가능한 Rotary 확장 구조

학습 단계

  • 기본 지식 학습 (Pre-training)
  • 도메인 특화 능력 강화 (Domain Adaptation)
  • 문맥 학습 (Long Context Training—128K)
  • SFT (Supervised Fine-tuning)
  • RLVR (Reinforcement Learning with Verifiable Reward)
  • 길이 제어 학습 (Length Control Training)
  • RLHF (Reinforcement Learning with Human Feedback)

HyperCLOVA X THINK 핵심 강점

1. 현실 문제 해결 능력

HyperCLOVA X THINK 한국 사회, 문화, 역사, 언어에 대한 정밀한 지식을 기반으로 수능이나 공무원 시험, 정책 문서 현실적인 문제를 실제 난이도로 해결할 있습니다. 답변에는 항상 근거 문장을 함께 제시하여, 결과의 투명성을 높이고 신뢰성을 확보했습니다.


2. 안정성과 학습 효율을 고려한 구조

모델 내부에 적용된 Peri-LN μP 구조는 학습의 안정성과 효율을 모두 확보할 있도록 설계되었습니다. 덕분에 동일한 자원으로도 빠르게 수렴하고, 높은 품질의 결과를 있습니다.


3. 검증 가능한 강화 학습: RLVR

RLVR Reinforcement Learning with Verifiable Reward 약자로, HyperCLOVA X THINK RLVR 방식을 통해 자신이 생성한 답변의 정답 여부를 스스로 검증합니다. 이에 따라 고차원적인 사고가 필요한 문제에서도 신뢰할 있는 추론을 가능하게 합니다. 또한 모델의 추론 능력 성장을 고려하여, 학습 과정에서 난이도를 동적으로 조절하는 방식으로 학습 효율을 비약적으로 높였습니다.


4. 시각 정보까지 해석하는 멀티모달 확장성

HyperCLOVA X THINK 멀티모달 확장이 쉬운 구조로, 이미지와 영상을 한국의 문화적 맥락에 맞게 해석할 있습니다. 실제로 K-시각 추론 벤치마크를 통해 HyperCLOVA X THINK 시각 추론 능력이 입증되었습니다. 예를 들어 전통문화재나 지명 정보를 인식하고, 그에 맞는 설명이나 추천을 제시할 있습니다.


5. 한국어와 영어 균형 학습

HyperCLOVA X THINK 한국어와 영어 데이터를 균형 있게 학습하여 언어 지식 전이를 극대화했습니다. 결과, 영어로 질문하든 한국어로 질문하든 사용자는 거의 동일한 수준의 이해와 응답을 기대할 있습니다. 또한 글로벌 상용 서비스를 능가하는 수준의 번역 품질을 제공합니다.


숫자로 증명하는 HyperCLOVA X THINK

한국어 중심 벤치마크 성능


HyperCLOVA X THINK 다음과 같은 가지 범주의 테스트에서 높은 성능을 보였습니다:

  • 일반 이해 능력 (General Aptitude)
  • 문화 언어 이해력 (Culture and Language)
  • 지시 이행 능력 (Instruction Following)

대표 비교 모델로는 Qwen3-14B, Qwen3-32B, QwQ-32B, EXAONE-Deep-32B 등을 선정했고, HyperCLOVA X THINK 이들 대비 범주에서 가장 뛰어난 성능을 보였습니다. 특히문화 언어 이해력 (Culture and Language)’ 범주에서는 최대 13.9%p 높은 성과를 기록했습니다.


예시로, 다음 데모는 부동산 거래 절벽에 관한 질문을 HyperCLOVA X THINK 답변하는 모습입니다. HyperCLOVA X THINK 복잡한 사회적 배경을 포함한 질문에 대해서도 각각 선택지를 논리적으로 분석하고 올바른 정답을 제시합니다.


텍스트를 넘어 시각 추론으로 확장

HyperCLOVA X THINK 다룰 있는 영역은 어디까지일까요? HyperCLOVA X THINK 보여준 고도화된 추론 능력이 과연 텍스트를 넘어 이미지 영역까지 자연스럽게 확장될 있을까요?


이를 검증하기 위해, 이미지 인코더를 언어 모델 백본에 결합한 멀티모달 버전을 제작하고, 수능 시험에 나온 과학/수학 문제에 대해 이미지 형태로 평가를 진행했습니다. 수능은 한국어, 복잡한 , 그래프, 수식 다양한 형태의 정보를 포함하고 있어, 실제 시각 언어 추론 능력을 측정하기에 적합합니다.


비교 대상으로는 GPT-4.1, GPT-4o, OpenAI o1 최신 멀티모달 모델을 포함해 성능을 비교했습니다. 결과 HyperCLOVA X THINK 수능 STEM 영역에서 46.4% 정답률을 기록하여, GPT-4.1(40.3%)보다 높은 성능을 보였으며, 최상위 모델인 OpenAI o1(50.9%) 근접한 결과를 나타냈습니다. 특히 HyperCLOVA X THINK 고유 추론 모드를 비활성화할 성능이 21.7% 크게 하락하는 점은, HyperCLOVA X THINK 언어 기반 추론 역량이 멀티모달 환경에서도 핵심적인 역할을 한다는 것을 시사합니다.


그래프와 , 글씨가 섞인 복잡한 이미지에 대해서도 정확한 정답을 도출하는 모습을 통해 시각과 언어 정보를 통합한 고차원 추론 능력을 확인했습니다. 다만 멀티모달로 확장하기 위해서는 텍스트 전용 성능과의 조율 문제 아직 기술적으로 복잡한 여러 난제가 남아 있습니다. 그럼에도 불구하고, 이번 실험을 통해 우리는 고차원 논리 추론과 시각 정보가 결합된 한국어 멀티모달 AI 실현 가능성을 분명히 확인할 있었습니다. 관련 구현 세부 사항과 벤치마크 결과는 Technical Report 통해 자세히 살펴보실 있습니다.



다음 데모는 수능에 나온 생물 질문을 THINK with Vision*이 답변하는 모습입니다. 그래프와 표, 글씨가 섞인 이미지를 잘 이해하고, 정확한 추론을 통해 정답을 생성하는 걸 볼 수 있습니다.

*THINK with Vision은 추후 공개될 예정입니다.



<수능 질문 이미지>


맺음말

HyperCLOVA X THINK 단순히많이 아는’ AI 넘어서깊이 이해하고 추론할 있는’ AI 진화하고 있습니다. HyperCLOVA X THINK 대한 상세한 기술 정보는 arXiv 공개된 Technical Report 통해 확인하실 있습니다.


또한 7 중에는 HyperCLOVA X THINK 경량화한 버전도 차례대로 공개할 예정입니다. 프루닝(Pruning) 디스틸레이션(Distillation) 기법을 통해 고성능을 유지하면서도 작은 디바이스에서도 활용할 있는 형태로 제공될 예정이니 많은 관심 부탁드립니다.


HyperCLOVA X THINK 이제 이상 하나의 씨앗이 아닌, 지성의 숲으로 자라나고 있습니다.