테크

美中 구도를 넘어선 '제3의 AI 로드맵'

인공지능(AI)의 미래가 미국이나 중국이 아닌 다른 곳의 '즉흥적 대응'에 의해 결정된다면?
기사이미지

/사진제공=Google DeepMind

2025.11.07 15:38

Noema
icon 20min
  • 0
kakao facebook twitter

AI 투자가 떠받치고 있는 미국과 세계 경제의 앞날에 대해서는 견해가 엇갈리지만 적어도 AI 기술이 미래의 핵심이라는 데는 거의 모두가 동의하는 편입니다. 기업 뿐만 아니라 각국 정부들도 AI 정책에 대해 고민이 많습니다. 현재 AI 기술의 패권을 놓고 다투는 미국과 중국 중 양자택일을 해야 하는 것처럼 보이기 때문입니다. 사실 두 나라를 제외한 그 어떤 나라도 자국 AI 기술의 주권과 미래를 다른 나라에 맡기고 싶지는 않을 겁니다. 한국 정부 또한 '소버린 AI'를 표방하면서 기반모델1(파운데이션 모델)부터 모든 것을 한국에서 직접 개발한다는 목표를 설정했습니다. 문제는 이렇게 만든 기반모델이 과연 그보다 훨씬 오래전에 더 많은 데이터를 빨아들이면서 개발된 미국과 중국의 모델과 경쟁할 수 있느냐는 겁니다. 기반모델을 처음부터 개발하고 훈련시키는 데는 수조 원의 비용이 들 전망입니다. 그런데 이렇게 만든 기반모델이 성능 문제로 아무도 쓰지 않게 될 가능성도 적지 않습니다.


베트남의 사례는 우리에게 큰 시사점을 제공합니다. 베트남 또한 미국도 중국도 아닌 '제3의 스택2'을 구축하겠다고 선언했는데 그 구체적인 계획이 한국보다 훨씬 절충적이고 유연하기 때문입니다. 베트남은 기반모델을 아예 독자적으로 개발하는 대신, 모델의 재훈련(미세조정)이 가능한 딥시크와 라마의 오픈웨이트 모델을 활용할 계획입니다. 이미 개발된 모델을 활용하기 때문에 시간과 비용이 크게 절약됩니다. 그러면서도 자국 내 서버에서 운영이 가능해 국내의 민감한 데이터를 국외에 노출시키지 않아도 됩니다. 물론 이러한 접근법에 단점이 없는 것은 아닙니다만 그럼에도 '패권'을 가질 수 없는 국가들의 선택지로는 가장 현명한 것으로 보입니다.


아래에 소개하는 노에마 매거진의 9월 16일자 기고문은 베트남이 어떻게 미국과 중국의 기술을 영리하게 '조합'하며 자신들만의 '제3의 스택'을 쌓아 올리고 있는지 구체적으로 보여주고 있어 AI 정책에 관심이 있는 모든 분들에게 일독을 권합니다. 사회과학 연구자 특유의 언어가 다소 난해하게 여겨질 수 있지만 '누구의 기술에 종속되지 않고, 우리 스스로 생각하고 결정하는 AI를 만든다'는 핵심 논지를 염두에 두고 읽으시면 되겠습니다. (AI 업계의 발전상은 과거 제국주의의 발전 양상과 매우 유사해 앞으로도 탈식민주의 관점에서 AI를 논의하는 글들을 많이 보게 될 것 같습니다.)


베트남의 접근법에서 두드러지는 것은 FPT라는 베트남 IT기업의 리더십입니다. 이미 세계적인 연구자들과의 협업과 일본 기업·자본과의 공조를 바탕으로 국가급 프로젝트를 주도하는 모습이 돋보입니다. 과연 지금 한국에는 이런 리더십을 가진 기업이 있는지 자문하게 됩니다.


베트남 하노이, 6월 20일. 벨벳 배경막이 드리워지고 청록색 LED 조명이 깜박이는 가운데, 새로운 국가 AI 연합의 출범을 알리는 거대한 현수막이 걸렸다. 베트남 유수의 IT 및 통신 기업 중 하나인 FPT 그룹의 쯔엉 자 빈 회장이 무대에 올랐다. 그는 "독립과 자유보다 더 소중한 것은 없다"는 전시戰時 슬로건을 인용한 뒤, 이어서 인공지능을 베트남의 미래를 위한 생사를 건 투쟁이자 차세대 격전으로 규정했다. 그의 주위에는 최고 대학 총장들, 매끈한 태블릿을 든 장관들, 그리고 통로에서 라이브 스트리밍을 하는 스타트업 창업자들이 자리했다.


모두가 예상하고 전 세계가 계속해서 던지는 질문이 현장에 감돌았다. "미국인가, 중국인가?" 베트남은 어느 AI 초강대국을 선택할 것인가?


하지만 빈 회장은 예상을 뒤엎었다. 빈 회장은 FPT가 언어 모델, 클라우드 인프라, 심지어 학습 데이터까지 포함하는 '핵심 기술 스택'을 이를 활용하고자 하는 모든 국내 파트너에게 개방할 것이라고 발표했다. 빈 회장은 세 가지 약속을 제시했다. FPT는 (1) 통제된 실험을 위한 국가적 샌드박스를 만들어 개방하고, (2) 이를 통해 연말까지 베트남 안에서 학습된 GPT 스타일의 언어모델(AI)을 만들 것이며, (3) 학교에서 AI 교육을 지원하는 정부 주도 정책을 지원할 것이다. 이 세 가지 약속은 일종의 거부 선언이다. "우리는 거인의 어깨 위에 서지 않습니다." FPT의 한 임원은 나중에 청중에게 말했다. "우리는 그들 곁에서 함께 걷습니다."


박수 소리가 커졌다.



컴퓨팅에서 '스택'이란 기술을 실행하는 계층적 아키텍처를 의미한다. 맨 아래의 칩과 회로에서부터 운영체제, 애플리케이션을 거쳐 사용자 인터페이스에 이르기까지다. 각 계층은 그 아래 계층을 기반으로 구축된다. 한 계층에서 내린 결정은 위로 연쇄적인 영향을 미친다. 이것이 바로 스택에 대한 선택이 단순한 기술적 문제를 넘어, 누가 권력을 쥐고 누가 따라야 하는지를 결정하는 이유다.


FPT 행사장의 현수막들은 개방적이고 포괄적이며 국가가 규제하는 전자 생태계를 약속했다. 실리콘밸리의 독점적 플랫폼과 중국의 중앙집권적 인프라라는 AI 정치의 익숙한 양극단이 직접 거론되지는 않았지만, 행사장의 모든 이들은 무엇이 쟁점이 되고 있는지 이해했다. 바로 누가 인공지능 자체의 조건을 정의할 것인가 하는 문제다. 이는 어떤 스택을 택하느냐의 문제다. 블랙박스에 의존할 것인가, 아니면 모듈식으로 즉흥 대응할 것인가? 불투명성을 택할 것인가, 아니면 판독 가능성을 택할 것인가? 타인의 로드맵을 따를 것인가, 아니면 우리 자신의 주권적 설계를 할 것인가? 현실적으로 이 결정은 오픈AI의 폐쇄형 API 접근에 비용을 지불하는 것과 카페의 공유 GPU 장비로 오픈웨이트3 모델을 미세조정하는 것의 차이다. 즉, 지능을 서비스로 소비하는 것과 주권행위로서 지능을 구성하는 것 사이의 차이다. 전자는 타인의 정신을 빌리는 것이고, 후자는 야생에서 자신만의 정신을 훈련하는 것이다.


이는 본질적으로 AI 주권에 대한 주장이다. 데이터, 인재, 컴퓨팅의 국경 간 흐름을 허용하면서도 베트남의 자체 조건에 따라 인프라를 구축하고 통제할 수 있는 능력이다. 여기서 AI 주권은 고립이 아닌 '저작권authorship'을 의미한다. 즉, 기계지능이 어떻게 구축되고 배포되는지를 결정하고 앞으로도 결정할 데이터, 모델, 규칙을 정하는 것이다.


요컨대 베트남은 미국과 중국 사이에서 편을 고르는 게 아니다. 제3의 스택을 구축하는 것이다.

인프라적 비동맹

많은 이들이 AI 지정학을 실리콘밸리의 자유지상주의적 개인주의 대 중국의 공동체주의적 권위주의 간의 문화전쟁으로 간주한다. 카우보이 같은 혁신가들과 국가가 지원하는 거대 기업들의 익숙한 대결 구도는 여전히 언론 기사에 남아있지만 이는 인프라 수준에서 더 조용히 일어나고 있는 영토 재편을 가린다. 오랫동안 중국 AI의 국가대표로 여겨졌던 바이두Baidu는 이전에 즈푸AI(Zhipu AI)로 알려졌던 Z.ai, 바이촨인텔리전스Baichuan Intelligence, 미니맥스MiniMax와 같은 더 기민하고 연구중심적인 중국 연구소들의 물결에 가려졌다. 이 새로운 주체들은 오픈웨이트 모델을 출시하고 외부의 검증을 자청하며, 권위주의적 불투명성과 민주적 투명성 사이의 기존 경계선을 모호하게 만들고 있다.


이제 더 첨예한 단층선은 국가 간이 아니라 인프라 간에 그어지고 있다. 독점시스템의 보호된 논리와 오픈웨이트 모델의 통제되지 않는 출현 사이의 대립이자 중앙집권적 명령과 분산된 즉흥성 사이, 그리고 안전성의 원칙과 검증의 규율 사이의 대립이다. 오픈AI, 앤스로픽, 구글 딥마인드의 프론티어 모델이 대체로 '봉쇄enclosure'의 논리를 대표했다면, 딥시크DeepSeek나 메타의 라마LlaMA와 같이 완전한 오픈소스는 아니지만 재훈련과 검증을 허용하는 방식으로 배포된 오픈웨이트 프로젝트들은 부분적이고 제한적이면서도 초국가적 확산에 있어 강력한 반대 흐름을 보여준다. 비록 오픈AI가 최근 '개방형 모델'을 출시했지만 오픈웨이트 확산이라는 더 큰 흐름은 국경을 초월하며 AI가 두 초강대국 중심의 블록으로 고착화될 것이라는 관념을 흔들고 있다.



다시 말해, 수출되는 것은 문화가 아니라 기술 스택이다.


국경을 넘는 것은 가치 그 자체가 아니라, 모델 가중치, 라이선스 체계, 데이터 규제, 클라우드 의존성, 개발자 생태계와 같은 인프라의 구성이다. 이것이 바로 AI 시스템을 판독 가능하고, 다루기 쉽고, 통제 가능하게 만드는 기반이다. 자유나 통제에 대한 거대 담론이 아니라, 바로 이러한 기반이 지식이 생산되고, 검증되며, 운용되는 방식을 형성한다.


이러한 지형에서 베트남의 위치는 시사하는 바가 크다. 미국이나 중국 어느 쪽에도 완전히 편승하지 않고, 양측으로부터 선별적으로 요소를 취하면서 자체적인 인프라 주권을 배양하는 제3의 스택을 구축하고 있다. FPT와 같은 국가 연계 기업, 국내 대형언어모델(LLM) 연구, 그리고 미국 기반 엔비디아, 일본 NTT 데이터 그룹, 중국 화웨이 등과의 지정학적 분열을 넘나드는 파트너십을 통해 베트남은 모듈식이고 적응력이 있으며 글로벌 AI의 비대칭성에 깊이 조율된 '인프라 비동맹infrastructural nonalignment' 방식을 보여준다. 자체 스택을 선언함으로써 베트남은 현실 자체가 기계가 읽을 수 있는 형태로 변환되는 방식, 즉 무엇이 AI 시스템에 보이게 되고, 알려지며, 실행 가능하게 될지를 결정할 권리를 주장한다.


FPT의 스택은 식별 가능한 형태를 갖추기 시작했다. 2024년 말 일본에서 공개된 FPT의 'AI 팩토리'는 대형 AI 모델을 훈련하고 배포하기 위해 설계된 고성능 컴퓨팅 허브로, 수천 개의 H100 및 H200 슈퍼칩을 갖춘 캘리포니아 소재 엔비디아의 가속 컴퓨팅 플랫폼을 기반으로 한다. 엔비디아 AI 엔터프라이즈 스위트와 NeMo 프레임워크로 구성된 이 인프라는 FPT가 확장하고 있는 베트남어 모델 및 비전 시스템 포트폴리오를 뒷받침한다. 이 모델들은 FPT의 소버린 클라우드 플랫폼인 'FPT 스마트 클라우드'를 통해 제공된다. 이 플랫폼은 온프레미스(사내 구축형), 데이터 생성 위치와 가까운 로컬 서버나 장치, 또는 국내 데이터센터 내 유연한 배포를 허용한다.


이 아키텍처는 설계상 모듈식으로, 스토리지와 컴퓨팅을 베트남의 관할권 내에 현지화하여 베트남의 데이터 상주 요건을 충족하는 동시에, 모델과 API를 컨테이너화하여 국경을 넘어 배포할 수 있도록 한다. FPT는 스미토모 상사와 도쿄 소재 금융서비스 그룹 SBI홀딩스 등 일본 자본의 지원을 받아, 동남아시아 전역의 저장 및 처리 용량을 확장하기 위한 역내 데이터 인프라에도 투자하고 있다. 이와 함께 의료, 금융, 운송과 같은 산업에서 모델을 사용할 수 있도록 조정하는 부문별 튜닝 프로그램도 진행 중이다. 여기에는 단일하고 통일된 스택뿐만 아니라 구성 가능한 시스템이 존재한다. 컴퓨팅, 가중치, 클라우드 서비스가 하나로 결합되어 국내외를 막론하고 의료, 금융, 모빌리티 등 어떤 관련 맥락에도 베트남의 자체 조건에 맞춰 조정될 수 있는 형태다.


스택의 최상단에는 FPT가 베트남 개발자들과 기업들이 AI 모델을 조정하고 배포하는 방식에 대해 더 큰 통제권을 가질 수 있도록 설계한 한 쌍의 플랫폼, 'AI 스튜디오'와 'AI 인퍼런스'를 도입했다. 지난 4월 출시된 이 도구들은 'AI 팩토리'의 영향력을 인프라를 넘어 애플리케이션과 저작권authorship 영역까지 확장한다. 'AI 스튜디오'는 엔비디아의 NeMo 프레임워크를 기반으로 구축된 미세 조정 환경을 제공한다. 이는 딥시크-R1, 라마 3.3과 같은 대형 모델을 내부 또는 특정 도메인 데이터셋으로 맞춤화하고 재훈련하기 위한 툴킷이다. 반면 'AI 인퍼런스'는 상용화production 계층의 역할을 한다. 4월 출시 당시 20개가 넘는 사전 훈련된 모델 카탈로그를 API를 통해 제공하여 기업 워크플로에 신속하게 통합할 수 있도록 지원한다. 두 플랫폼 모두 팩토리 자체와 동일한 GPU 백본 위에서 작동하여 실험과 실행 간의 연속성을 보장한다.


그 결과, 국내 플랫폼, 주권 클라우드, 고성능 컴퓨팅, 초국가적 연구가 모듈식 시스템에 통합된, 단일체가 아닌 '조립된' 스택이 탄생했다. 각 계층은 서로 다른 의존성을 지니지만 이들이 함께 베트남이 AI 인프라의 형태, 방향성, 도달 범위에 대한 저작권을 가질 수 있게 한다. 이는 공공배포를 정착시킬 만큼 안정적이면서, 적응하거나 이동할 수 있을 만큼 개방적이다. 이 플랫폼들은 함께 컴퓨팅에서 모델, 그리고 사용 사례에 이르기까지 전체 회로를 완성하며, 이 모든 것이 판독 가능하고, 통제 가능하며, 적응 가능한 아키텍처 내에서 이루어진다. 베트남의 야심은 단순한 기술적 성능이 아니라, 어떤 모델을 재훈련하고, 어떻게 조정하며, 누구를 위해 말하게 할 것인지를 결정할 수 있는 능력, 즉 '인식론적 재량권'이다.


플랫폼(FPT AI 스튜디오, FPT AI 인퍼런스)
↑모델(딥시크-R1, 라마 3.3)
↑데이터(공개, 특정 도메인)
↑컴퓨팅(AI 팩토리, FPT 스마트 클라우드)

제3 스택의 한 사례

이와 병행하여 FPT는 AI 선구자 요슈아 벤지오Yoshua Bengio가 설립하고 고문으로 있는 퀘벡 AI 연구소 '밀라Mila'와의 전략적 제휴를 지속적으로 심화해 왔다. 2020년에 시작되어 2023년에 갱신된 이 파트너십은 베트남 최대 테크 기업과 딥러닝 및 책임감 있는 AI 분야에서 세계 최고로 손꼽히는 연구 기관을 연결한다. 표면적으로 둘의 협력은 LLM과 자연어처리를 발전시키는 걸 중점으로 한다. 그러나 그 중요성은 더 깊은 곳에 있다. 이는 AI를 이데올로기적 전쟁터로 보는 지배적인 서사에 대한 조용한 반례다. FPT는 양자택일을 하는 대신, 베트남 연구자들을 밀라의 연구실에 파견하고, 국경을 넘어 지식을 순환시키며, 방어적이거나 파생적이지 않은 위치에서 거버넌스 표준을 형성하는 '연결 조직'을 구축하고 있다. 개방성이 선언되기는 하지만 상호적인 경우는 드문 환경에서, 이것이 바로 인프라 외교가 보여줄 수 있는 모습이다.


제3의 길을 개척하는 것은 베트남만이 아니다. 말레이시아와 인도네시아에서는 '누산타라Nusantara' 스타일의 AI 전략 개발이 진행 중이다. 이는 다국어 말뭉치와 현지 문화 지식을 우선시하여 인도네시아의 다원적 언어 및 문화 인프라를 중심으로 AI 설계를 구성하는 것으로, 이웃 국가들의 경이로운 언어적, 문화적 다양성에 맞춰진 시스템을 구축하려는 야망을 반영한다. 인프라적 프로젝트이자 상징적인 프로젝트이기도 하다. 한편 아랍에미리트(UAE)는 미국이나 중국 시스템에 의존하는 대신 자체 모델을 개발하고 라이선스를 부여하겠다는 주권적 의도와 기술적 역량을 모두 보여주는 일련의 오픈웨이트 언어 모델 '팔콘Falcon'을 출시하며 역내 선두주자로 자리매김했다. 종합해 보면, 이러한 구상들은 더 광범위한 변화를 시사한다. 이는 글로벌 AI 패러다임에 대한 거부가 아니라, 그 안에 완전히 갇히기를 거부하는 것이다.


이데올로기가 아닌 인프라가 이동하고 있다면, 수출 통제 대상인 칩, 데이터 상주 법률, 또는 안전 체제는 이 비동맹 스택에 어떻게 적용될까? 이 스택은 미중 양강 구도 밖에서 구축되었지만 양측 모두로부터 요소를 차용하고 현지에서 통제된다. 주권적 구성에 대한 열망이 물질적 상호의존이라는 엄혹한 한계에 부딪힐 때, 즉 클라우드가 현지에 없고, 칩이 금수 조치되거나, 라이선스 체제에 외국의 감독이 포함될 때 어떤 일이 발생할까? 필자가 '비동맹 구축자'라고 부르는, 즉 미중 양강 구도 외부의 제3국에서 활동하는 이들의 과제는 단지 작동하는 스택을 조립하는 것뿐만 아니라, 압력 하에서도 판독 가능성을 유지하는 스택을 통제하는 것이다. 그들의 임무는 기술적 차용과 인식론적 종속 사이의 공간을 열어두는 것이다. 이 새롭게 부상하는 질서 속에서 진짜 질문은 국가들이 독립적으로 구축할 수 있느냐가 아니라, 자국 시스템이 무엇을 알고, 기억하며, 행동하도록 허용될지 통제권을 유지할 수 있느냐이다. 제3의 스택은 절묘한 모순을 안고 있다. 기존 강대국들을 회피하는 동시에 그들과 얽혀 있다.


베트남의 이점은 자급자족이 아닌 '전략적 브리콜라주(조합)'에 있을 수 있다. 맞지 않는 부품들로 작동하는 스택을 조립하고, 부분적으로 일본 자본으로 구매한 GPU를 이용해 중국과 미국의 개방형 가중치를 미세 조정하며, 베트남 법을 준수하면서도 글로벌 표준을 차용하는 주권 클라우드 인프라에 배포하는 능력이다. 이런 식으로 제3의 스택은 봉쇄된 것이 아니라 선택적으로 투과된다. 경쟁하는 강대국들의 구성 요소를 결합하는 과정에서 기술 표준과 정치적 제약에 대한 끊임없는 협상이 필요할지라도, 빌려야 할 부분은 빌리되 빌려온 것을 통제한다.


제3의 스택은 미국이나 중국의 스택 규모와는 결코 필적하지 못할 수도 있지만 바로 그것이 핵심이다. 그 이점은 '비대칭적 확장asymmetrical scaling'에 있다. 맥락에 맞게 조정하고, 제약을 두고 라이선스를 부여하며, 시장을 지배하는 것이 아니라 그 이면으로 파고들어 영향력을 확장하는 것이다. FPT 소프트웨어, 실리콘밸리 기반의 에이토매틱Aitomatic, 그리고 도쿄 일렉트론 간의 협력을 통해 반도체 산업을 위해 개발된 오픈웨이트 대형언어모델 '세미콩SemiKong'을 예로 들어보자. 메타의 라마 3.1 아키텍처를 기반으로 구축된 세미콩은 특정 부문 과제에서 GPT와 같은 범용 모델을 능가한다. 이는 주권적 역량이 규모가 아닌 정밀함을 통해 발휘될 수 있음을 보여주는 사례다. 베트남은 자국의 산업적 우선순위에 부합하는 오픈소스, 초국가적 노력에 기여함으로써 주변부의 도입국이 아닌 글로벌 AI 인프라의 공동저자로서 자리매김하고 있다. 이것이 바로 전략으로서의 비대칭이다. 중심에서 경쟁하는 것이 아니라, 주변부에서 영향력을 축적함으로써 존재의 의미를 구성하는 것이다.


칩, 프레임워크, 툴킷과 같은 구성 요소가 외국산일지라도, 베트남은 '절차적 주권'을 통해 영향력을 유지한다. 즉, 데이터 이동 방식, 모델 훈련 장소, 시스템 배포 조건을 제약할 수 있는 능력이다. 스택의 하위 계층이 외국의 공급망 및 아키텍처와 얽혀 있더라도, 상위 계층은 통제권을 미묘하게 재조정하는 규칙, 정책, 마찰을 주장할 여지를 제공한다.


지난 6월 베트남 최초의 '디지털 기술산업법' 통과는 이러한 전략의 전환점이 되었다. 유럽연합(EU)이 시스템을 용납 불가, 고위험, 중간위험, 저위험 등급으로 분류하고 상응하는 의무를 부과하는 위험 등급을 통해 AI 체제를 구축하고, 미국은 기업들이 구속력 있는 규칙을 준수하기보다 투명성을 서약하는 자발적 공개에 의존하는 반면, 베트남의 접근 방식은 더욱 인프라 중심적이다. 디지털 시스템을 전략적 자산으로 분류하고 사전 승인 요건, 국내 데이터 처리, 부문별 감독을 의무화한다. 이 법은 가치나 규모를 통해 주도하는 것이 아니라, 구성을 통해 주도하는 것을 목표로 한다. 즉, 주권을 수사rhetoric가 아닌 배포의 메커니즘에 내재시키는 것이다.


그러나 캘리포니아 소재 기업 퀄컴이 6월 10일 하노이에 AI 연구개발(R&D) 센터를 설립한 것은 인프라 비동맹의 복잡하게 얽힌 논리를 드러낸다. 인도와 아일랜드에 이어 전 세계에서 세 번째로 큰 퀄컴 시설인 이 하노이 센터는 스마트폰과 XR(가상, 증강, 혼합 현실을 아우르는 용어)부터 자동차 시스템, 그리고 '사물 인터넷'으로 알려진 다양한 연결 기기에 이르기까지 광범위한 영역에서 생성형 및 에이전트 AI 개발 임무를 맡고 있다. 언뜻 보기에 이러한 움직임은 기술 이전, 생태계 개발, 인력 역량을 강조하는 베트남의 AI, 반도체, 디지털 전환에 대한 국가전략과 완벽하게 일치한다. 이 파트너십은 국내 주권을 배양하면서 외국인 투자를 유치하려는 베트남의 전략을 잘 보여준다.


그러나 이러한 협약의 익숙한 모순은 여전하다. 지식 교류라는 명목으로 들어온 것이 수입된 아키텍처, 답습된 표준, 내재된 설계 가정에 대한 의존성으로 굳어질 수 있다. 이러한 역학 관계는 지난 4월 퀄컴이 빈그룹Vingroup의 VinAI 연구소에서 분사한 베트남 생성형 AI 스타트업 모비안AIMovianAI를 조용히 인수하면서 더욱 분명해졌다. 모비안AI는 베트남어 모델과 모빌리티 시스템으로 가장 잘 알려진 곳이다. 현지 역량으로 보였던 것이 결국 미국 다국적 기업에 흡수된 것이다. 그렇다면 베트남이 이러한 코드와 자본의 유입을, 주변의 라이선스 및 안전 체제가 제3의 스택을 둘러싸거나 심지어 가두는 새로운 경계선으로 굳어지기 전에, 주권적 역량으로 변모시킬 수 있느냐 하는 것이 과제가 된다.


하지만 AI 주권이란 무엇인가? 자세인가, 당위인가, 아니면 현실적인 문제인가? 현재 미중 양강 구도 바깥의 공백 지대에서 전개되고 있는 AI 주권은 영토 통제에 대한 기치를 흔드는 주장이 아니다. 오히려 무엇이 지식으로 간주되고 그 지식이 세상에 어떻게 드러나는지를 결정할 조용한 권리로 나타난다. 다시 말해 '인식론적 주권'이다. 이 주권은 스택 안에 존재한다. 무엇이 판독 가능하게 되고 무엇이 보이지 않게 남을지를 결정하는 모델 가중치, 학습 데이터, 라이선스 체제, 클라우드 의존성에 대한 선택 속에 말이다. 실제로 AI 주권은 기계 추론에 대한 '상황적 저작권situated authorship'이다. 즉, 세계가 분석되고 실행 가능하게 만들어지는 방식에 대한 인프라적 주장이다. 하나의 국가가 자체 스택을 설계할 때, 그것은 사실상 AI의 인식론적 세계를 설계하는 것이다. 원본 세계 자체가 아니라, 그 세계가 사용자, 규제 당국, 이웃 국가들에게 드러나는 방식을 형성하는 것이다.


베트남 비동맹 모델이 실행하는 AI 주권은 인프라 설계를 통한 인식론적 거부 행위다. 오픈AI, AWS, 알리바바 클라우드로부터 현실에 대한 인식을 라이선스받기를 거부함으로써, 베트남은 자국의 기술-사회적 영역 내에서 무엇이 인식되고, 질문되며, 논쟁될 수 있는지에 대한 지평선을 설정할 권리를 보유한다. 제3의 스택은 주권적 실체, 즉 '스스로 저작한 현상의 아키텍처'가 된다. 선별된 모든 국내 말뭉치, 현지 라이선스 하에 배포된 모든 오픈웨이트 체크포인트는 하나의 '인식론적 헌법' 조항이 된다.


여기서 관건은 '현지화'나 '자력갱생'이라는 어휘의 범주를 넘어선다. 문제는 더 이상 베트남이 베트남어 GPT를 훈련할 수 있느냐가 아니라, 기계가 인식하게 될 베트남 현실의 윤곽을 베트남이 좌우할 수 있느냐이다. 다시 말해, 주권은 인식의 장 자체에 대한 저작권이다. 개발 담론에서 여전히 '현지 혁신'으로 치부되는 것은, 사실상 인식론적 자기 결정권에 대한 주장이다.


이 지점에서 모델의 사용, 수정, 공유 방식을 결정하는 세세한 라이선스 조항이 왜 중요한지 알 수 있다. 일반적으로 접근을 허용하거나 거부하는 API 키와 달리, 라이선스는 사용 체제를 명시한다. 라이선스는 출처 표기, 상업적 금지, 수정 등에 관한 규범을 코드화하여, 기술 인프라를 거버넌스의 장으로 변화시킨다.


크리에이티브 커먼즈 'CC-BY-NC'(저작자 표시-비영리)는 다른 사람이 출처를 밝히고 모델을 재사용하는 것은 허용하지만 상업적 사용은 금지한다. 오픈웨이트 모델은 단지 저렴한 것이 아니다. 인식론적으로 가소성plastic이 있다. 독점 코드가 표현할 수 없는 방언, 금기, 규제 요건을 수용하기 위해 재훈련, 감사, 또는 포크4fork가 가능하다. 결국 라이선스는 누가 AI의 의미를 재편할 수 있는지를 결정한다. 저작권이 창작자에서 시스템으로 이동한 생성형 모델에서, 라이선싱은 인식론적 통제 메커니즘이 된다. 라이선스를 통제하는 자는 단지 소프트웨어를 관리하는 것이 아니라, 기계가 인식할 수 있는 것의 경계를 그리고 있는 것이다.


이는 정책 영역으로까지 이어진다. 스택을 수출하는 것은 '인지적 관할권cognitive jurisdiction'을 둘러싼 투쟁이다. UAE가 모델의 추론 방식을 형성하는 수치 매개변수인 '팔콘' 가중치를 배포하거나, 인도네시아가 언어 분할 및 해석 방식을 결정하는 도구인 '누산타라' 중심 토크나이저에 자금을 지원할 때, 그들은 세계가 기계에 어떻게 보일지에 대한 템플릿을 수출하는 것이다. 더 나아가, 그 기계의 판단에 의존하는 모든 하위 사용자들에게도 영향을 미친다. 주권은 정책으로 표면화되기 훨씬 이전에 인식론적 인프라로서 이동한다.


독점적 안전 체제와 오픈웨이트 검증을 대조할 때, 단층선은 단지 코드가 어떻게 작성되고 보호되는지에 대한 기술적 문제가 아니다. 이는 시스템이 어떤 지식을 인코딩하고, 어떤 가정을 허용하며, 누구의 현실을 인식할 수 있는지에 대한 인식론적 문제다. AI에 대한 비판은 이미 잘 알려져 있다. 주류 에이전트 AI는 감시에서 태어났으며, 캘린더에서 암호화된 채팅에 이르기까지 모든 것을 파헤치고 그 결과물을 공급업체가 통제하는 클라우드로 보낸다. 독점 스택은 보호를 약속하지만, AI의 인식 기계, 즉 AI가 무엇을 보고, 처리하고, 기억할지 결정하는 시스템과 그 데이터 흔적을 계약의 벽 뒤에 가둔다. 오픈웨이트 모델은 (부분적으로) 감사가 가능한 코드, 현지에서 수행하는 미세 조정, 국내 데이터 경로를 통해 이러한 비대칭을 뒤집는다. 이는 인식론적 작업장을 내부에 둠으로써, 해당 시스템과 함께 살아가는 국가가 시스템이 알도록 허용된 것을 검사하고, 이의를 제기하며, 재구성할 수 있게 한다.


제3의 스택 운동은 본질적으로 누가 세계의 이해 가능성에 대한 다음 계층layer의 대본을 쓸 것인지를 둘러싼 경쟁이다. 이는 비계scaffolding(飛階)로서, 인프라가 현상의 조건을 설정하는 인식의 문턱에 서 있다. 칩, 가중치, 데이터 상주와 같은 모든 기술적 세부 사항은 더 깊은 주장의 한 조항으로 읽힌다. 주권이란 기계에 무엇이 나타날지, 그리고 기계를 통해 그들의 판단에 의존하는 인간과 기관에 무엇이 나타날지 결정하는 힘이다. 그리고 비동맹 스택은 미중 양강 구도 밖에서 저작권을 주장하는 제3의 길을 구현하기 때문에 바로 그 힘을 가시화한다.


여기서 AI 주권은 영토적 통제보다는 '인프라적 저작권'을 의미한다. 이는 어떤 종류의 지식이 인코딩되고, 어떤 모델이 말하며, 어떤 조건 하에서 말할지 결정하는 역량을 지칭한다. 이는 정치적 슬로건이라기보다, 가중치, 학습 데이터, 라이선스 체제, 의존성 등 스택 자체에서 구현된다. 이러한 의미에서 주권은 설계의 선택으로 실행되며, 기계에 무엇이 보이게 될지, 나아가 사회에 무엇이 보이게 될지를 형성한다.

인식론적 불협화음

이러한 전 세계적인 분기는 우리가 '인식론적 불협화음'이라 부를 수 있는 것을 생성하고 있다. 이는 단순히 가치나 거버넌스에 대한 불일치가 아니라, AI 시스템에 의해 알려지거나, 예측되거나, 실행 가능하게 만들어질 수 있는 것의 수준에서 발생하는 비호환성이다. 각 스택은 고유한 인식론적 자세를 인코딩한다. 이는 지식이 어떻게 구조화되고, 어떤 데이터가 관련성 있는 것으로 처리되며, 어떤 형태의 불확실성이 허용되거나 선제적으로 배제되는지를 결정한다.


예를 들어 독점 LLM은 방대하지만 불투명한 말뭉치(레딧 게시물, 스크랩된 웹 콘텐츠, 미공개 라이선스 계약 등)로 훈련되는 경우가 많다. 이 모델들은 종종 맥락적 충실도보다는 규모, 유창성, 법적 보호에 최적화되어 있다. 이 모델들은 현지 뉘앙스에 취약하고, 소수 방언 처리에 어려움을 겪으며, 보편성을 주장하면서도 지배적인 문화 논리를 인코딩하는 경향이 있다. 반면 베트남, 인도네시아, UAE 등에서 훈련된 신흥 현지화 언어 모델들은 종종 문화적으로 특정한 말뭉치(국가 기록, 현지어 매체, 소수 언어 집단의 주석 달린 발화 등)를 사용하여 작업한다. 이 모델들은 매개변수는 더 작을 수 있지만 인식론적 프레임은 더 견고하다. 단순히 덜 강력한 것이 아니다. '다르게 보정된' 것이다.


이는 단순히 편향이나 포용성의 문제가 아니다. 이는 구조적인 문제다. 모델이 어떤 종류의 질문에 답하도록 설계되었는지, 무엇이 유효한 입력으로 간주되는지, 그리고 누구의 인식론이 그 아키텍처 내에서 판독 가능한지에 대한 문제다. 우리는 각 스택이 서로 다른 '인식론적 어포던스(행동유도성)'를 제공한다고 생각할 수 있다. 이는 시스템이 가능하게 하거나 억제하는 행동의 범위를 설명하기 위해 디자인에서 차용한 용어다. 어떤 스택은 소비자 선호도를 예측하거나 콘텐츠 생성을 자동화하기 위해 구축된다. 다른 스택은 언어적으로 다양한 환경에서 거버넌스, 번역, 교육 과제를 지원하도록 조정된다. 다의성, 방언의 다양성, 역사적 불투명성 등 무엇이 배제되는지 역시 무엇이 인코딩되는지만큼이나 중요하다. 이러한 선택이 누구의 세계가 기계에 판독 가능하게 되고, 나아가 기계를 통해 미래 인간에게 검색 가능하게 될지, 그리고 누구의 세계가 망각 속에 묻힐지를 결정하기 때문이다.


스택 거버넌스 역시 이러한 인식론적 균열을 반영한다. 독점 스택은 은폐하는 경향이 있다. 가중치는 비공개이며, 의사결정 파이프라인은 API와 개인정보 보호 고지 뒤에 묻혀 있다. 이들은 자신들이 최종사용자를 판독할 수 있게 만드는 동시에 규제 당국과 대중에게는 스스로를 판독 불가능하게 만든다. 반면 오픈웨이트 또는 반개방형 스택은 시장을 파편화할 수 있다. 현지 행위자들이 이질성을 증가시키는 방식으로 모델을 분기, 미세 조정, 재배포하도록 허용하며, 이와 함께 인식론적 다원주의도 증가시킨다. 그러나 이러한 다원주의는 일관성, 상호운용성, 그리고 경우에 따라 중앙집권적 안전 감독을 희생하는 대가를 치른다. 이는 시스템을 불안정하게 만들고, 국경 간 마찰을 일으키며, 바로 조율5이 가장 필요한 지점에 거버넌스 공백을 야기할 수 있는 위험이다.


그 결과는 단일한 AI 세계가 아니라, 각각 고유한 진실, 배제, 추상화 형태를 생성하는 중첩된 인지 인프라들이다. 이것이 바로 베트남의 인프라적 즉흥 대응이 중요한 이유다. 이는 단순히 지정학적 헷징만을 반영하는 것이 아니다. 오히려 이는 새롭게 부상하는 '인식론적 설계의 정치'를 엿볼 수 있게 한다. 여기서 스택을 구축한다는 것은 지능이 어떻게 작동하는지뿐만 아니라, 그것이 누구의 세계를 인식할지를 결정하는 것을 의미한다.


예를 들어 베트남의 40억 매개변수 오픈소스 모델인 'PhoGPT'는 웹에서 긁어온 뉴스, 법률 문서, 서적, 위키피디아, 의학 저널 등을 포함한 1020억 토큰 규모의 베트남어 말뭉치로 처음부터 훈련되었다. 그 결과 레딧 중심의 영어 관용구가 아닌 베트남의 표현 방식, 거버넌스, 언어 규범에 맞춰진 모델이 탄생했다. 이와 대조적으로 오픈AI의 GPT-4와 같은 미국 모델들은 레딧, 위키피디아, 라이선스를 받은 출판사 등에서 스크랩한 방대한 영어 말뭉치로 훈련된다. 이는 글로벌 영어 유창성에 최적화되지만 현지 뉘앙스나 소수 방언에는 취약하게 만든다. 한편 바이두의 어니봇Ernie Bot은 톈안먼 광장에 대한 질의를 국가가 승인한 역사적 요약으로 리디렉션하는데 이는 해당 스택이 어떻게 중국의 국가 정보통제에 의해 보정되어 있는지를 반영한다. 이러한 차이점들은 서로 다른 스택이 문자 그대로 어떤 세계가 기계에 판독 가능하게 되고 어떤 세계가 지워지는지를 결정하는지 보여준다.

에이전트의 부상

이러한 불협화음은 AI 에이전트의 부상과 함께 더욱 첨예해진다. 이 에이전트 모델들은 단순히 프롬프트에 답하는 것을 넘어, 사용자를 대신해 목표를 추구하고, 결정을 내리며, 디지털 또는 물리적 환경과 상호작용한다. 이러한 에이전트들이 연구실 데모 수준을 넘어 현실의 워크플로workflow—업무 조정, 인터페이스 탐색, 자율적 행동—으로 이동함에 따라 스택 설계의 인식론적 중요성은 더욱 깊어진다.


독점적인 미국 스택에서 훈련된 에이전트는 개인의 주체성을 가정하고, 영어 문서를 기본으로 사용하며, 협상보다는 효율성을 우선시할 수 있다. 반면 현지화된 베트남 또는 인도네시아 모델을 기반으로 구축된 에이전트는 집단적 협력, 비공식적 위계질서, 또는 맥락에 민감한 제약에 맞춰진 다른 사전 전제들을 내재하고 있을 수 있다. 이는 단순한 행동적 특이점이 아니다. 이는 '인식론적 스크립트', 즉 세계가 무엇인지, 어떻게 작동하는지, 그리고 그 안에서의 행동이 어떻게 전개되어야 하는지에 대한 코드화된 가정이다.


에이전트 스크립트를 둘러싼 이 경쟁은 현지 AI 에이전트 개발이 빠르게 가속화되고 있는 중국에서 이미 전개되고 있다. 서구에서는 GPT-4o의 대화 유창성, 그리고 최근에는 GPT-5의 벤치마크 신기록 주장에 관심이 집중되어 있지만, 버터플라이이펙트Butterfly Effect, 알리바바, 즈푸, 바이트댄스와 같은 중국 기업들은 채팅을 완전히 뛰어넘는 시스템을 구축하고 있다. 이 에이전트들은 단순히 응답하는 것이 아니라 '실행'한다. 궁극적으로 긴밀하게 통합된 앱 생태계 전반에서 상호작용하도록 설계된 이들은 최소한의 사용자 입력으로 작업을 수행하고, 양식을 처리하며, 서비스 간을 조율한다. 인터페이스는 모바일 우선이며, 마찰이 없고, 대화보다는 행동 중심으로 구성되어 있다.


이러한 차이는 단순히 기능적인 것이 아니라 인프라적인 것이다. 이 에이전트들은 국내 데이터 체제로 훈련되고, 거버넌스 시스템 내에 내장되며, 미국 주도 스택의 설계 가정과는 확연히 다른 행동 규범에 맞춰 보정된다. 중국 모델에서 에이전트는 인공의 동료나 표현력이 풍부한 동반자가 아니다. 그것은 '작동하는 노드operative node'다. 상거래, 통신, 행정의 경계가 모호한 플랫폼 스택 내의 절차적 중개자다.

현실 세계의 에이전트

AI 에이전트의 준비 상태와 저항에 대해 몇 가지 짚고 넘어갈 필요가 있다. 에이전트가 실제로 어떻게 구현될 수 있는지 이해하려면, 먼저 에이전트가 자리 잡을 워크플로의 텍스처, 그리고 그 통합을 형성하는 디지털 인프라, 클라우드 도입, 프로세스 표준화의 불균등한 지형을 이해해야 한다. AI 에이전트는 기술적 상상과 상업적 상상 모두에서 새로운 욕망의 대상이 되었다. 이들은 주도권을 잡고, 시스템 간을 조율하며, 수동적 도구에서 목표지향적 협력자로의 전환을 약속한다. 그러나 이러한 전환은 특히 에이전트가 실제 워크플로를 가로지르기traverse 시작하면서 그 자체의 불협화음을 가져온다.


서구 기업계에서도 유사한 긴장감이 나타난다. 사모펀드 업계에서 에이전트는 시급성("포트폴리오 전반에 배포해야 한다") 또는 회의론("측정 가능한 투자수익률(ROI)이 없다")의 대상이 된다. 그러나 이 두 가지 입장 모두 세 번째 진실을 간과한다. 대부분의 기업이 구조적으로 준비되어 있지 않다는 것이다. 지속적으로 실행되고, 사일로화된 시스템 간에 상호작용하며, 자율적인 결정을 내리는 에이전트는 안정적인 API, 상호운용 가능한 데이터, 잘 매핑된 워크플로와 같은 기초적인 업그레이드를 필요로 한다. 이러한 기반 없이는 자율성이 오히려 짐이 된다. 시스템은 무너지고, 출처는 사라지며, 시범 사업은 중단된다.


컴퓨터 과학자 아르빈드 나라야난Arvind Narayanan이 지적했듯이, 기술자technologist들은 종종 저항과 미비 상태를 혼동한다. 세계가 에이전트를 대규모로 채택하지 않았다면 이는 비전이 부족해서가 아니라 대부분의 인프라가 지속적이고 자기 주도적인 컴퓨팅을 지원하도록 설계되지 않았기 때문이다. 그리고 그 이상으로, 대부분의 시스템과 마찬가지로 대부분의 직무는 개별적인 작업으로 환원될 수 없다. 자동화하기 가장 어려운 것은 종종 지침의 가장자리, 암묵적인 경계를 넘나들며 공식화를 회피하는 것들이다.


바로 이 지점에서 스택 설계가 다시 등장한다. 현지 워크플로로 훈련된 베트남 또는 인도네시아 에이전트는 명시적인 위임보다는 비공식적 합의, 엄격한 논리보다는 모호성을 용인하는 추론과 같은 다른 인식론적 가정을 인코딩할 수 있다. 이러한 차이점은 버그가 아니라 인프라 현실에 대한 적응이다. 이런 의미에서 비동맹 에이전트는 단순한 대안이 아니라, 현지에서 판독 가능한 시스템 내에서 작동하도록 설계된 '상황적 제약'의 산물이다.


그렇다면 과제는 실리콘밸리의 에이전트 패러다임을 모방하는 것이 아니라, 그것을 감당할 수 있는 아키텍처 위에서, 그리고 현지 시스템이 이해할 수 있는 언어로, 상향식으로 주체성agency을 스크립트하는 것이다. 이를 달성하기 전까지 지능적 위임에 대한 모든 주장은 자율성보다 더 큰 불투명성을 야기할 위험이 있다.


AI 모델이 지식을 인코딩한다면, 에이전트는 그것을 실행한다. 에이전트는 자신을 생성한 스택의 사절emissary이 된다. 문제는 단지 어떤 모델이 구축되느냐가 아니라, 어떤 에이전트가 배포되느냐, 그리고 '누구의 형상'으로 배포되느냐이다. 이러한 관점에서 볼 때, 베트남의 제3의 스택은 플랫폼 의존성에 대한 위험 회피 그 이상이다. 이는 현지에서 훈련되고 모듈식으로 통제되는 AI 에이전트가 실리콘밸리나 베이징이 아닌, 주권적 디지털 생태계의 세밀하고 상황적인 논리에 의해 정의되는 세계관을 실현하는 미래를 위한 리허설이다.

조각난 주권

베트남이 어느 블록을 선택할 것인가보다 더 나은 질문이 있다. 바로 조율이 어떤 모습일 수 있는지를 누가 결정하는가이다. 대부분의 국가는 AI 스택을 맨땅에서부터 구축하지 않을 것이다. 완전히 자신의 것이 아닌 구성 요소들로 지능을 조립하며 채택하고, 조정하며, 혼합할 것이다. '인프라 브리콜라주 작업자'로서 이렇게 하는 것은 어느 패권에도 속하지 않는 스택을 연결하는 작업이다. 블랙박스 의존과 인프라 거부 사이의 공간에서, 한 번에 하나의 가중치, 하나의 말뭉치, 하나의 분기를 통해 새로운 주권이 형성되고 있다. 제3의 스택은 현지의 호기심거리가 아니다. 이는 세계의 많은 부분이 앞으로 어떻게 구축해 나갈지를 보여주는 예고편이다.


AI의 미래는 가속주의적 슬로건이나 깔끔하게 계층화된 다이어그램으로 그려지지 않을 것이다. 그것은 적응의 마찰과 이질적인 시스템들을 대화로 이끌어내는 인내심 있는 노동 속에서 너저분하고, 고르지 못하며, 전술적인tactical 모습으로 드러날 것이다. 이 지형을 읽는다는 것은 과장광고와 절망 사이에서 방향을 잡고, 조율의 맥박에 주파수를 맞추는 것이다. 코드가 케이블에 연결되고, 비전이 현지어에 맞춰지며, 주권이 점진적으로 조립되는 과정이다. 여기저기 흩어진 중계기를 통해 라우팅되는 신호처럼, 다가오는 아키텍처는 언론 지면을 장식하는 일은 거의 없지만 조용히 지도를 다시 그리는 우회로들로 빛날 것이다.



당 응우옌은 AI, 문화, 미학에 대한 작가이자 연구자로, 동남아시아와 제약된 조건 하에서 나타나는 기술적 관행에 초점을 맞춰, 디지털 삶의 비공식적 인프라와 도덕적 마찰을 추적한다. 예일대 로스쿨의 '메이저리티 월드 스칼러Majority World Scholar이며, UC 버클리 정보대학School of Information의 벨웨더 스칼러Bellwether Scholar로 부임할 예정이다.



‘집 없는 억만장자’로 유명했던 투자가 겸 자선가 니콜라스 베르그루엔(이젠 집을 마련해서 살고 있다고 합니다)이 설립한 베르그루엔연구소에서 발행하는 매거진. 2014년 허핑턴포스트와 파트너십으로 발행했던 월드포스트가 그 시초로, 현재는 자체 웹사이트 위주로 발행되고 있습니다. 정치적 성향은 두드러지지 않으나 대체로 미래지향적인 관점에서 국제정세, 철학, 테크놀러지를 다룹니다.
 
close
comment
top