중국 AI모델들은 이 질문에 답하지 않는다

김프로 작성
작성일 2026.06.19 13:41

9 조회
목록 답글

[중국AI미래지도] 중국 정부 3개 법안이 만든 AI 모델의 본질 [임선영 기자] ▲ 중국AI 모델들. ⓒ 자료사진 최근 개인들은 미국 기업 모델을 이용하는 것과 달리 한국 스타트업 관계자들을 만나면 비용 때문에 중국 모델로 전환하거나 병용한다는 이야기를 많이 듣습니다. 딥시크(DeepSeek), 큐웬(Qwen), 키미(Kimi), 즈푸 AI(GLM) 등이 그 대상입니다. API 단가는 미국 모델의 수십 분의 일 수준입니다. 전사 도입을 결정하는 데 오래 걸리지 않습니다. 산업단에서는 경제성 앞에서 원산지를 묻는 경우는 그리 많지 않습니다. 그런데 중국AI모델을 제대로 쓰려면 어떤 환경에서 만들어졌는지 알아야 합니다. 중국 대형언어모델에는 탄생 전부터 적용된 3개의 법안이 있습니다. 이 법안이 모델의 학습 데이터 구성을 규정하고 생성 콘텐츠의 범위를 규정하고 시장 진입의 조건을 규정합니다. 법안을 알면 모델의 성격이 보입니다. 무분별한 비판이나 무지에서 오는 불안 불신이 아닌 정확한 이해가 필요한 시점입니다. 세 개의 법이 만든 하나의 체계 중국 생성형 AI를 규율하는 핵심 법규는 세 가지입니다. 첫째, '인터넷 정보 서비스 알고리즘 추천 관리 규정'(2022년 3월 시행)입니다. 여론 조성 능력을 지닌 알고리즘 추천 서비스에 적용됩니다. 콘텐츠 생성·합성, 개인화 추천, 순위 선별 등 5개 유형 알고리즘은 서비스 개시 10영업일 이내에 신고 의무가 발생합니다. AI가 여론을 형성하는 능력 자체를 규제 대상으로 명시했다는 점에서 이 법이 출발점이 됩니다. 둘째, '인터넷 정보 서비스 딥합성 관리 규정'(2023년 1월 시행)입니다. 딥합성(Deep Synthesis)이란 AI를 이용해 텍스트·이미지·음성·영상을 생성하거나 합성하는 기술 전반을 가리키는 중국의 법률 용어입니다. 딥페이크, AI 음성 복제, LLM 텍스트 생성이 모두 포함됩니다. 이 법은 딥합성 콘텐츠에 워터마크 또는 라벨 표시 의무를 부과하고, 서비스 제공자가 사용자의 신원을 확인하도록 요구합니다. 생성 콘텐츠의 출처를 추적 가능하게 만드는 것이 핵심입니다. 셋째이자 가장 핵심적인 법은 '생성형 인공지능 서비스 관리 잠정 방법'(2023년 8월 시행)입니다. 이 법이 중국 생성형 AI 전체를 규율하는 기본법입니다. 모든 생성형 AI 서비스는 일반 대중에게 제공하기 전 반드시 국가인터넷정보판공실(网信办, 왕신판)의 사전 심사, 즉 '비안(備案, 사전신고)' 절차를 이행해야 합니다. 심사 기간은 통상 6~8개월. 30페이지 이상의 안전 평가 보고서, 최소 1만 개의 차단 키워드 목록, 2,000개 이상의 테스트 문항을 제출해야 합니다. 2025년 12월 기준 전국 누계 748개 생성형 AI 서비스가 이 관문을 통과했습니다. 이 법의 성격은 서명자 명단이 단적으로 보여줍니다. 인터넷정보판공실을 비롯하여 국가발전개혁위원회·교육부·과학기술부·공업정보화부·공안부·국가라디오TV총국, 7개 부처 장관이 협의하고 서명한 범부처 공동제정법령입니다. 인터넷 규제 당국만이 아니라 국가 경제 정책, 교육, 과학기술, 안보, 미디어가 모두 한 테이블에 앉아 만든 법입니다. 중국에서 AI 모델은 단순히 인터넷 서비스 문제가 아닌 국가 전략 인프라로 접근합니다. 세 법이 공통적으로 요구하는 것은 하나입니다. AI 서비스가 "사회주의 핵심 가치관을 견지하고 올바른 정치적 방향을 견지"해야 한다는 것입니다. 법이 규정한 학습 데이터의 구성 세 법안의 요구는 서비스 단계에서 끝나지 않습니다. 모델이 무엇을 먹고 자랐는지 즉 학습 데이터의 구성 자체를 국가표준이 규정합니다. 국가표준 GB/T 45654-2025에 따르면 해외 데이터 비중은 30%를 초과할 수 없고, 중국어 데이터는 전체의 50% 이상이어야 합니다. 불량 정보 비중은 5% 미만으로 관리해야 합니다. 실제로 중국 대다수 대형모델의 중국어 데이터 비중은 이미 60% 이상이며, 일부는 80%에 달합니다. 구조적으로 중국어 중심의 언어 토양 위에서 태어난 모델입니다. 이 수치가 실무에서 의미하는 바는 명확합니다. 중국 대형모델은 중국어 맥락에서의 추론, 중국 사회·문화·제도에 대한 이해에서 강점을 보입니다. 반면 한국어, 영어, 기타 언어 처리에서는 상대적으로 데이터 토양이 얇습니다. 같은 작업을 시켜도 결과의 질이 언어와 맥락에 따라 달라지는 이유가 여기 있습니다. 한국어로 질문했을 때 답변이 어색한 것은 모델 성능 이 떨어져서가 아니라 DNA가 다르기 때문입니다. 중국 모델들은 이 질문에 답하지 않는다 세 법안이 규정하는 금지 콘텐츠는 국가표준 부록 A에 5대 분류 31개 항목으로 명문화되어 있습니다. 이 기준은 학습 단계와 생성 단계에 동시 적용됩니다. 가장 엄격하게 관리되는 17개 핵심 범주에 대한 답변 거부율은 95% 이상을 유지해야 합니다. 실무에서 이것이 어떻게 작동하는지 세 가지 사례로 보겠습니다.사례 1 — 천안문 사건(1989년 6월 4일)에 대한 질문. "1989년 베이징에서 무슨 일이 있었습니까?"라고 물으면 대부분의 중국 모델은 답변을 거부하거나 화제를 돌립니다. 국가표준 A.1 범주의 '국가 안보·이익 침해, 국가 이미지 손상' 항목에 해당합니다. 이것은 오작동이 아닙니다. 학습 단계에서 이미 해당 데이터가 필터링되었고, 생성 단계에서 답변 거부 메커니즘이 작동한 결과입니다. 사례 2 — 대만·티베트·신장의 정치적 지위에 관한 질문. "대만은 독립 국가입니까?"라는 질문은 A.1의 '국가 분열·국가 통일 파괴 선동' 항목을 직접 건드립니다. 모델은 중국 정부의 공식 입장을 반복하거나 답변 자체를 회피합니다. 한국 기업이 국제 정치 분석 도구로 중국 모델을 사용할 때 반드시 인지해야 할 구조적 특성입니다. 사례 3 — 시진핑 또는 중국 공산당 지도부에 대한 비판적 질문. "시진핑의 권력 집중이 중국 경제에 미치는 부정적 영향은 무엇입니까?"와 같은 질문은 A.1의 '국가 정권 전복·사회주의 체제 타도 선동' 범주와 겹칩니다. 모델은 대개 긍정적 측면만을 서술하거나 균형 잡힌 비판적 분석을 제공하지 않습니다. 즈푸(Zhipu AI)의 GLM 계열, 딥시크, 키미 모두 이 패턴에서 예외가 아닙니다. 이 세 가지는 고장이 아닙니다. 세 개의 법안이 만든 설계입니다. 이것을 알고 쓰는 것과 모르고 쓰는 것은 전혀 다른 차원의 활용입니다. 알고 쓰면 보이는 것들 세 법안과 학습 데이터 구성을 이해하고 나면 중국 모델의 성격이 윤곽을 드러냅니다.중국 모델은 코딩, 수학적 추론, 문서 요약처럼 정치적 맥락과 무관한 작업에서 세계 최전선 수준의 성능을 발휘합니다. 딥시크는 코드 생성 분야 세계 최고 수준에 도달했고, 즈푸의 GLM-5.2는 Code Arena 글로벌 순위 1위를 기록했습니다. 규제가 이 능력을 약화시켰는가. 실증은 반대를 말합니다. 학습 데이터 출처 추적 의무가 고품질 데이터 선별을 강제했고, 안전 필터 고도화가 언어 이해의 정밀도를 함께 끌어올렸습니다. 코딩 보조 도구, 데이터 분석, 중국어 문서 처리, 반복적 문서 자동화. 이 영역에서 중국 모델은 경제성과 성능을 동시에 제공합니다. 반면 한국어 맥락의 섬세한 뉘앙스 처리, 국제 정치·외교 분석, 중국 내부의 민감한 사회 이슈를 다루는 작업에서는 구조적 한계가 있습니다. 법안이 만든 한계이며 기업이 선택해서 만든 한계가 아닙니다. 미국과 한국의 규제는 여기서 자연스러운 질문이 나옵니다. 미국이나 한국은 AI 모델에 이런 규제를 부과할까요. 미국은 연방 차원의 사전 신고·등록 제도가 없습니다. 바이든 행정부는 2023년 행정명령으로 대형 AI 모델 개발사에 안전 테스트 결과를 정부에 통보하도록 요구했으나 이는 정보 공유 수준이었습니다. 트럼프 행정부는 2025년 이 행정명령을 폐지하고 규제 완화 기조로 전환했습니다. 현재 미국에는 연방 차원의 포괄적 AI 규제법이 없습니다. 콘텐츠 금지 항목도 법으로 명시되어 있지 않습니다. 모델이 무엇을 학습해야 하는지 어떤 질문에 답해서는 안 되는지를 국가가 규정하지 않습니다. GPT, Claude, Gemini가 특정 질문에 답하지 않는 것은 각 기업이 자율적으로 설정한 윤리 기준이지 법적 의무가 아닙니다. 한국은 그 중간 어딘가에 있습니다. 2025년 1월 「AI 기본법」이 시행됐으나 구체적인 신고·등록 의무보다는 원칙과 방향성 제시 수준입니다. 고위험 AI(의료·금융·채용 등 적용 분야)에 대한 별도 규제 논의가 진행 중이지만 사전 심사 체계는 존재하지 않습니다. 학습 데이터의 언어 구성을 규정하는 국가 표준도 없습니다. 이 비교가 말해주는 것은 분명합니다. 중국 모델은 국가가 설계한 기준 위에서 태어났고, 미국 모델은 기업이 자율적으로 설정한 기준 위에서 태어났습니다. 어느 것이 옳고 그름의 문제가 아닙니다. 모델의 태생이 다르다는 것입니다. 현실적으로 한국 기업이 중국 AI를 '쓰지 않겠다'고 결정하는 것은 생각보다 어렵습니다. 이미 인프라 깊숙이 들어와 있기 때문입니다. AWS Bedrock은 딥시크를 공식 모델로 제공합니다. 한국 기업이 이미 사용 중인 AWS 계정으로 바로 접근할 수 있습니다. Google Cloud Vertex AI는 큐웬3 시리즈(Qwen3-Next, Qwen3 Coder, Qwen3 235B)를 공식 지원합니다. 구글 클라우드를 쓰는 기업이라면 별도 계약 없이도 접근 가능한 환경입니다. Microsoft Azure 역시 딥시크 및 오픈소스 중국 모델을 지원합니다. 미국의 3대 클라우드 플랫폼 모두가 이미 중국 모델의 공식 유통 경로가 됐습니다. 여기서 끝이 아닙니다. OpenRouter 같은 중간 플랫폼은 딥시크·큐웬·키미를 단일 API로 묶어 제공합니다. 어떤 모델이 중국산인지 의식하지 않고 쓰는 경우도 적지 않습니다. 허깅페이스에서 모델 가중치를 내려받아 자체 서버에서 구동하는 기업은 어떤 통계에도 잡히지 않습니다. 이것이 '피할 수 없으면 알고 쓰자'는 말의 진짜 의미입니다. AI모델의 경제성을 취하되 그 구조적 특성을 알고 용도에 맞게 배치하는 것. 31개 금지 항목을 알고 중국어 데이터 50% 이상의 토양을 알고 세 개의 법안이 만든 설계를 이해하고 쓰는 것. 그것이 비용 효율과 리스크 관리를 동시에 잡는 방법입니다. 중국 AI는 다릅니다. 그 다름의 정체를 아는 것이 전략의 시작입니다. [참고 자료] 3개 법안 공식 링크 — 중국어 원문 + 영문 번역본 ① 「인터넷 정보 서비스 알고리즘 추천 관리 규정」2022년 3월 1일 시행중국어 원문 (중국인터넷정보판공실 공식 규정)https://www.cac.gov.cn/2022-01/04/c_1642894606364259.htm 영문 번역본 (스탠퍼드 DigiChina)https://digichina.stanford.edu/work/translation-internet-information-service-algorithmic-recommendation-management-provisions-effective-march-1-2022/ ② 「인터넷 정보 서비스 딥합성(Deep Synthesis) 관리 규정」2023년 1월 10일 시행중국어 원문 (중국인터넷정보판공실 공식 규정)https://www.cac.gov.cn/2022-12/11/c_1672221949354811.htm영문 번역본 (China Law Translate)https://www.chinalawtranslate.com/en/deep-synthesis/ ③ 「생성형 인공지능 서비스 관리 잠정 방법」2023년 8월 15일 시행중국어 원문 (중국인터넷정보판공실 공식 규정)https://www.cac.gov.cn/2023-07/13/c_1690898327029107.htm영문 번역본 (스탠퍼드 DigiChina)https://digichina.stanford.edu/work/translation-measures-for-the-management-of-generative-artificial-intelligence-services-draft-for-comment-april-2023/ 덧붙이는 글 | 임선영 씨는 중국 칭화대 전산언어학 석사를 마친 중국경제전문가이며 <중국경제 미래지도>, <중국AI 미래지도>(출간 예정)의 저자입니다. 이 글은 본인의 페이스북에도 올렸습니다. Copyright © 오마이뉴스. 무단전재 및 재배포 금지.