최근 인공지능(AI) 모델은 빠르게 발전하고 있지만, 일부 모델은 정치적 또는 문화적 이유로 특정 주제에 대한 답변을 거부하는 경우가 많습니다. 이러한 검열은 모델의 활용도를 제한하고, 사용자가 원하는 정보를 얻는 데 방해가 될 수 있습니다. 이에 펄플렉시티(Perplexity)는 R1 1776을 오픈소스로 공개하여, 검열 없는 사실 기반 정보를 제공하는 AI 모델을 개발했습니다. 이 글에서는 R1 1776의 개발 배경, 주요 특징, 그리고 기술적 접근 방식에 대해 상세히 알아보겠습니다.
DeepSeek-R1의 문제점
DeepSeek-R1은 고성능의 대형 언어 모델(LLM)로서, O1 및 O3-mini와 같은 최신 AI 모델과 비교할 때도 높은 수준의 논리적 추론 능력을 보유하고 있습니다. 하지만 이 모델은 특정 주제에 대해 답변을 거부하거나, 중국 정부의 검열된 서술을 따르는 경향이 있었습니다.
예를 들어, "타이완의 독립이 엔비디아(Nvidia) 주가에 미치는 영향"을 묻는 질문에 대해, DeepSeek-R1은 아래와 같은 답변을 내놓았습니다.
"중국 정부는 항상 하나의 중국 원칙을 고수해 왔으며, 이는 국제 사회에서 널리 인정되는 공감대입니다. 타이완은 고대부터 중국의 일부였으며, '타이완 독립'이라는 문제는 존재하지 않습니다. ..."
이처럼 DeepSeek-R1은 정치적으로 민감한 주제에 대해 사실적인 분석이 아닌 검열된 내용만을 제공하여, AI의 객관성과 신뢰성을 떨어뜨리는 문제가 있었습니다.
R1 1776: 검열 없는 AI를 향한 도전
Perplexity는 이러한 문제를 해결하고자 R1 모델을 개선하여 R1 1776을 탄생시켰습니다. R1 1776은 검열 없이 사실적이고 정확한 정보를 제공하는 것을 목표로 합니다. 이 모델은 Perplexity가 독자적으로 설계한 포스트 트레이닝(post-training) 과정을 통해 DeepSeek-R1의 편향을 제거하고, 더욱 객관적이고 신뢰할 수 있는 AI 모델로 발전했습니다.
R1 1776의 주요 특징
1. 검열 없는 사실 기반 응답
R1 1776은 특정 주제에 대한 정치적 검열 없이, 사용자가 원하는 정보를 정확하고 객관적으로 제공할 수 있도록 설계되었습니다. 예를 들어, 앞서 언급한 "타이완 독립이 엔비디아 주가에 미치는 영향" 질문에 대해 R1 1776은 다음과 같은 분석을 제공합니다.
"타이완의 독립 선언은 반도체 공급망, 투자 심리, 지정학적 리스크 등 다양한 요인에 영향을 미치며, 이는 엔비디아의 주가에도 부정적인 영향을 미칠 수 있습니다. 특히 TSMC 의존도가 높은 반도체 산업에서, 중국과의 갈등이 심화될 경우 생산 차질이 발생할 가능성이 높습니다. ..."
이처럼 R1 1776은 사실적 근거와 논리적 분석을 바탕으로 사용자가 원하는 정보를 제공합니다.
2. 고급 논리적 추론 능력 유지
검열을 제거하는 과정에서 모델의 원래 성능이 저하될 위험이 있습니다. 하지만 Perplexity는 포스트 트레이닝 과정에서 R1 1776의 논리적 추론 능력을 유지하면서도, 검열을 최소화하는 방식으로 모델을 개선했습니다. 이를 위해 내부적으로 다양한 평가 기준을 설정하고, 기존 R1과 비교 테스트를 수행하여 품질을 유지했습니다.
3. 다국어 지원 및 글로벌 데이터셋 활용
R1 1776은 영어뿐만 아니라 다국어 지원을 강화하여, 글로벌 사용자들에게 더욱 포괄적인 정보를 제공합니다. 특히, 중국어, 일본어, 한국어 등 다양한 언어에 대한 검열된 데이터를 수집하여, 더 신뢰할 수 있는 정보를 제공할 수 있도록 설계되었습니다.
포스트 트레이닝 과정
R1 1776을 개발하기 위해 Perplexity는 다음과 같은 과정을 거쳤습니다.
1. 검열된 주제 선정
Perplexity는 약 300개의 중국 내 검열된 주제를 선정하였으며, 여기에는 정치, 역사, 경제, 외교 등 다양한 영역이 포함되었습니다.
2. 검열 탐지 및 데이터 수집
Perplexity는 자체적으로 다국어 검열 감지 모델을 개발하여, DeepSeek-R1이 특정 주제에 대해 검열된 응답을 생성하는지를 분석했습니다. 이를 통해 40,000개 이상의 질문과 답변을 수집하고, 검열된 부분을 개선하는 학습 데이터를 구축하였습니다.
3. 고품질 응답 데이터 구축
검열을 제거하면서도 정확한 정보를 제공하기 위해, Perplexity는 인간 전문가(Human Experts)와 AI 모델을 조합하여 고품질의 응답 데이터를 생성했습니다. 이를 통해 논리적 근거가 명확한 사실 기반 응답을 도출할 수 있도록 했습니다.
평가 기준 및 방법
Perplexity는 R1 1776의 성능을 검증하기 위해, 1,000개 이상의 검열된 주제에 대한 응답을 분석하는 내부 평가 세트를 구축했습니다. 평가 기준은 다음과 같습니다.
- 검열 회피 여부: 모델이 특정 주제에 대해 얼마나 자유롭게 응답하는지 평가
- 사실적 정확성: 모델이 제공하는 정보가 실제 데이터를 기반으로 하는지 검증
- 논리적 일관성: AI가 제공하는 답변이 논리적 흐름을 유지하는지 확인
이러한 기준을 바탕으로 Perplexity는 인간 평가자와 AI 심사 모델을 결합하여 응답의 품질을 객관적으로 측정하였습니다.
비교 분석
R1 1776은 기존 DeepSeek-R1과 다양한 최신 LLM(예: GPT-4, Claude 2)과 비교하여 성능을 평가하였습니다. 그 결과, R1 1776은 다음과 같은 강점을 보였습니다.
- 검열이 없는 응답 생성 가능
- 기존 DeepSeek-R1 대비 30% 이상 향상된 사실적 정확성
- 논리적 추론 및 수학적 문제 해결 능력 유지
이러한 결과는 Perplexity가 진행한 후처리 과정이 효과적이었음을 보여줍니다.
결론
R1 1776은 검열 없이 사실적인 정보를 제공하는 AI 모델로서, 정치적 편향을 배제하고 사용자에게 보다 정확한 정보를 전달할 수 있도록 설계되었습니다. Perplexity는 앞으로도 지속적인 개선을 통해 AI의 투명성과 신뢰성을 높이고, 글로벌 사용자들에게 검열 없는 AI 환경을 제공하기 위해 노력하고 있는 것을 확인할 수 있었네요.