Feb 17, 2025

복잡한 정보의 숲에서 길을 찾다: 지식 내비게이션 GraphReady

Image for 복잡한 정보의 숲에서 길을 찾다: 지식 내비게이션 GraphReady

연결의 힘

보험 약관의 수백 페이지에서 필요한 정보를 찾으려면 어떻게 해야 할까요?
복잡한 연말정산 항목에서 나에게 해당하는 정보를 빠르게 찾을 방법이 있을까요?


위의 두 가지 질문의 공통점은 방대한 정보와 다양한 연관 관계입니다. 의료 기록, 법률 문서, 금융 데이터 등 전문 분야의 정보는 점점 더 복잡해지고 있죠. 이제는 단순히 정보를 찾는 것을 넘어 정보 간의 연결을 통해 새로운 가치를 발견하는 것이 중요합니다. 예를 들어 의료 기록을 분석할 때는 환자의 증상, 진단, 처방이 서로 어떻게 연관되어 있는지를 파악해야 하고, 법률 문서를 검토할 때는 각종 조항이 어떻게 얽혀 있는지 이해해야 합니다. 이렇게 데이터 사이의 연결을 발견하고 활용할 때, 비로소 새로운 가치가 만들어집니다.


GraphReady는 이러한 문제를 해결하기 위해 데이터를연결의 지도로 분석하고 필요한 정보를 직관적으로 도출해 주는 기술입니다. 사용자에게 꼭 필요한 정보를 빠르고 정확하게 찾아 의사결정을 돕죠. 기존의 RAG(Retrieval-Augmented Generation)를 더 똑똑하게 만든 기술로 정보 분석에 새로운 방향을 제시합니다.

이번 콘텐츠에서는 GraphReady가 세상에 나오게 된 계기와 어떻게 더 똑똑한 답변을 할 수 있는지 소개해 드리겠습니다.

 

RAG가 어려워하는 질문? GraphReady가 잘 아는 질문!

RAG는 대규모 언어 모델(LLM)이 외부 지식을 활용하여 답변의 정확성과 깊이를 높이는 기술입니다. 마치 학생이 시험 문제를 풀 때 교과서를 참고하듯이, AI도 질문에 답할 때 필요한 자료를 찾아보고 이를 기반으로 답변을 만드는 거죠. 이 기술은 방대한 문서나 데이터에서 필요한 정보를 찾아 활용할 수 있어 특정 분야의 전문적인 질문에 답하는 데 유용하게 사용됐습니다. 하지만 AI의 활용도가 높아지고 데이터의 양과 복잡성이 점점 증가하면서 기존 RAG 기술도 고도화가 필요해졌습니다. 특히 RAG가 어려워하는 질문에 대한 새로운 접근이 요구되었습니다. 아래에서 함께 살펴보겠습니다.

1. 데이터 간의 복잡한 연결 관계를 이해하고 활용해야 하는 경우

예시 질문 질문 유형
암 진단비를 청구하려고 하는데 암 판정을 받기 전에 이미 유사 암으로 치료받은 적이 있으면 보상이 가능한가요? 보험 약관의 보상 조건과 예외 사항을 종합적으로 파악해야 하는 경우


2. 연속적인 맥락을 가지고 추론이 필요한 경우

예시 질문 질문 유형
제가 보유한 A 주택을 올해부터 월세를 주고, B 주택에 전세로 이사 와서 세대주로 있는 상태입니다. A 주택 담보 대출 건 장기주택저당차입금 공제가 가능한 상황인가요? 주택 임대 여부, 세대주 상태, 대출 공제 조건 등 여러 요건을 종합적으로 고려해야 하는 경우


3. 데이터셋 전반의 정보를 종합해야 하는 경우

예시 질문 질문 유형
육아용품별 긍정적 평가를 받는 브랜드는 뭐가 있는지 자세히 알려주세요. 여러 카테고리와 평가 데이터를 종합해 긍정적인 패턴을 도출해야 하는 경우


GraphReady: 기존 RAG를 똑똑하게 만든 기술

GraphReady는 방대한 지식으로부터지식 그래프‘(Knowledge Graph)를 구축하여 데이터 전반에 대한 이해는 물론 복합적인 추론까지 가능하게 하는 기술입니다. 지식 그래프는 데이터를 구성하는 주요 개념 간의 관계를 네트워크 형태로 표현한 데이터베이스인데요. 기존 RAG가 단순한 문서 검색과 내용 생성에 의존하는 반면, GraphReady는 데이터 간의 명시적인 관계를 활용하여 더 깊이 있는 이해와 논리적인 추론이 가능한 응답을 생성합니다.

이는 네이버에서 보유한 빅데이터 처리와 텍스트 분석 노하우가 최신 AI 기술과 만나 탄생한 독창적인 결과물이라고 할 수 있죠. 특히, GraphReady는 LLM이 가진 고질적인 문제, 즉 정보를 왜곡하고 긴 입력을 처리하지 못하는 한계를 동시에 극복한다는 점에서 주목할 만합니다.

[관련 내용 – ‘AI의 거짓말, 줄일 수 있을까? LLM 신뢰도 높이기보러 가기]


효율적인 그래프 검색 알고리즘을 통해 방대한 지식 베이스에서도 필요한 정보를 신속하게 탐색할 수 있으며, 명확하게 정의된 관계를 기반으로 정보 왜곡 현상을 줄이는 데 기여합니다. 이 같은 특성 덕분에, 관련 개념이 복잡하거나 데이터 변화가 적은 전문 분야에 적합하여, 세법, 법률, 기술 문서 등에서 강점을 발휘합니다.


▲ 그래프 데이터베이스 형태로 만들어진 보험 약관 지식 그래프


GraphReady를 활용하면 그간 생성형 AI가 답하기 어려웠던 복잡한 개념에 대한 이해나 비교가 필요한 내용에도 답할 수 있습니다.

GraphReady는 어떻게 더 똑똑한 답변을 할 수 있을까?

이번에는 GraphReady를 활용하면 어떤 과정을 거쳐 답변에 도달하는지 소개해 드리겠습니다. 먼저 데이터셋의 전체 구조와 그 속의 여러 주제를 미리 파악해서 지식 그래프로 정리해 놓고, 이를 요약된 형태로 관리합니다. 그리고 답변에 필요한 개념을 미리 식별하고 취합해서 지식 그래프를 기반으로 검색합니다. 이를 종합적으로 분석하여 응답을 생성하는데요. 그 결과 복잡한 질의에도 신뢰성 높은 섬세한 답변을 제공할 수 있습니다.



좀 더 구체적으로 한 단계씩 살펴보겠습니다.


1. Indexing: 문서 색인 및 지식 그래프를 만드는 단계

입력 문서를 일련의 단위 문서로 분할한 후, 각 문서 단위에서 핵심 객체(Entity) 간의 관계를 추출합니다. 추출한 핵심 객체와 관계는 지식 그래프의 노드와 엣지로 구성되며, 구조화된 지식 그래프를 형성합니다.

또한, 유사한 핵심 객체끼리 계층적 클러스터링을 통해 비슷한 성격의 부분 그래프들이 합쳐져 커뮤니티를 형성하는데요. 지식 그래프에서 커뮤니티란 밀접하게 연결된 노드의 그룹을 의미합니다. 쉽게 말해 같은 주제나 맥락을 공유하는 문서와 객체가 모여 있는 덩어리라고 할 수 있습니다. 예를 들어 연말정산에서는의료비 공제와 관련된 문서가 하나의 커뮤니티를 이루고, ‘주택청약저축 공제와 관련된 문서가 또 다른 커뮤니티를 이루는 식이죠. 이때 형성된 커뮤니티의 핵심 내용을 요약해 둡니다. 이는 대규모 데이터에서도 효율적인 정보 관리를 가능하게 합니다.

 

2. Search: 복합 질의에 대한 정보 검색

사용자 질의에 해당하는 정보를 이미 구축해 놓은 지식 그래프에서 찾는 단계입니다. 이 과정에서 처리해야 할 질문의 내용에 따라 적합한 그래프 탐색 방식을 사용하는데요, 아래의 두 가지 방식을 구분하여 사용합니다.

 

2-1. Local Search: 특정한 핵심 객체와 관련된 세부적인 내용을 묻는 질문을 처리하는 검색 방식



위와 같이사내부부보육수당‘ ‘비과세와 관련된 세부적인 질문에 대해서 Local Search를 활용합니다. 사내 부부와 보육수당에 관련된 모든 지식 그래프의 객체를 식별하고 그와 관련된 세부 정보를 연결하여 답변에 활용합니다.


 

2-2. Global Search: 데이터 전체와 관련된 질문을 처리하는 검색 방식


일반 직장인이 공제받을 수 있는 전체적인 연말정산 관련 정보를 종합하는 질문에 대해서는 Global Search 방식으로 답변을 생성합니다.


Global Search는 전체적인 데이터를 확인하여 요약이 필요한 질문에 적합한데요, 이때 Indexing 과정에 생성한 지식 그래프의 커뮤니티를 활용합니다. 질문에 맞는 커뮤니티를 찾아 활용할 때는 신뢰성 점수도 함께 확인합니다. 최종적으로 답변을 만들 때는 신뢰성 점수가 높은 커뮤니티만 활용합니다.

 

3. Answer: 사용자 질의 의도에 부합하는 답변 최종 생성

최종적으로 GraphReady를 활용하여 향상된 검색 성능을 가진 답변을 만들어 낼 수 있습니다. GraphReady의 향상된 검색 성능을 기반으로 사용자의 복잡한 질문에도 정확한 답변을 찾아낼 수 있으며, 특히 대규모 데이터를 처리하는 과정에서도 사용자의 의도를 정확히 파악하여 최적의 결과를 도출해 내는 것이 가능해졌습니다. 이는 곧 사용자 경험의 질적 향상으로 이어질 수 있습니다.


GraphReady로 보는 새로운 가능성

GraphReady 2025 1월 팀네이버 사내 임직원의 연말정산을 돕기 위한 ‘CLOVA X 연말정산 도우미에 적용되었습니다.

국세청 연말정산 가이드를 지식 그래프 형태로 미리 분석하고 학습한 것인데요. 연말정산은 해마다 개정되는 내용이 반영되어야 하고 사용자와 관련된 여러 가지 복합 조건들이 고려되어야 하는 어려운 도메인으로, 기존 RAG로는 조건에 부합하는 답변을 제공하기 어려웠습니다.

GraphReady는 그래프 탐색을 기반으로 사용자의 다양한 조건을 고려하여 관련 정보를 가져올 수 있기 때문에 복합 조건을 고려한 자세한 답변이 가능하고, 이를 통해 실제로 연말정산을 하며 생기는 다양한 사례에 대한 궁금증 해결에 도움을 줄 수 있었습니다.


GraphReady 기술은 더 나아가 보험 약관이나 연말정산 같은 복잡한 데이터 문제를 단순히 해결하는 데 그치지 않습니다. 기존 RAG가 해결하지 못하는 복잡한 추론이 필요한 분야에 적용되어 전문 영역 에이전트를 만드는 데 활용할 예정입니다.

  • 맞춤형 정보 제공: 사용자에게 꼭 필요한 정보를 빠르고 정확하게 제공하여 의사결정을 돕습니다.
  • 전문 지식 확장 가능성: 의료 기록 분석, 법률 문서 처리, 금융 데이터 시각화, 고객 상담 분석 등 다양한 산업으로 확장할 수 있습니다.
  • 미래의 연결 강화: 데이터를 단순히 저장하고 검색하는 것을 넘어, 데이터 사이의 연결을 통해 새로운 가치를 창출합니다.

GraphReady는 기존 RAG 기술의 강점을 이어받아 데이터를 더 똑똑하게 연결하고 활용하는 새로운 패러다임을 제시합니다. 이제 단순한 검색을 넘어 연결의 가치를 활용하여 관계와 의미를 발견하는 시대를 열어가고 있습니다.