개관 AI에 시험지를 건네면 어떤 일이 벌어질까요? 생성형 AI가 점점 더 똑똑해지면서 사람들은 AI 모델을 두고 정말 사람처럼 문제를 풀 수 있는지 궁금해합니다. 최신 모델이 실제로 어느 수준까지 발전했는지, 우리가 익히 아는 수능 같은 공식 시험 환경에서도 실력을 발휘하는지 알고 싶어하는데요. 네이버클라우드는 이러한 호기심을 실험으로 옮겼습니다. 2025 NAACL에서 발표한 논문 「Evaluating Multimodal Generative AI with […]