每日生活圈2026年01月14日 21:35消息,韩国AI大赛三款参赛模型被曝套用中国开源代码,引发学术诚信争议。
去年六月,韩国政府发起一项国家级竞赛,旨在开发基于韩国技术的全新独立人工智能基础模型。在当前全球AI格局由中美科技巨头主导的背景下,培育本土大模型被视为保障技术主权、经济安全与战略自主的关键一步。

然而,最新披露的事实揭示,“独立自主”这一目标正遭遇现实层面的严峻拷问——理想与路径之间,横亘着开源生态、工程效率与安全底线之间的复杂张力。

财联社去年8月曾报道,韩国科学技术信息通信部正式选定五支团队参与“自主AI基础模型”国家项目,包括Naver Cloud、Upstage、SK Telecom、NC AI和LG AI研究院。该项目周期长达三年,被外界称为韩国打造“AI国家队”的核心引擎。
但近期调查发现,在五家入围企业中,已有三家被证实至少在其模型推理层或配套工具链中使用了源自中国AI企业的开源代码,其中智谱AI、阿里巴巴集团及DeepSeek的相关开源组件成为焦点。值得注意的是,这些代码均属合规开源许可(如Apache 2.0、MIT等),可合法复用,但其出现在由韩国纳税人出资支持的“主权AI”项目中,仍引发强烈争议。
相关企业普遍强调:完全从零构建所有模块既不经济,也不符合AI产业演进规律。哈佛大学电气工程教授Gu-Yeon Wei就此指出,“要求所有代码均由本国编写,在当代AI研发中并不现实。”他虽未参与任一参赛方,但长期观察全球AI基础设施建设趋势,认为“放弃开源软件,等于主动放弃数十年积累的协同红利与工程加速器。”这一观点切中要害——今日的大模型研发早已不是单点突破,而是建立在Transformer架构、PyTorch生态、Hugging Face模型库等跨国开源基座之上的系统性工程。
但质疑声同样尖锐。部分韩国业界人士警告:即便代码开源、授权合规,若核心训练范式、结构设计或权重初始化逻辑深度借鉴外国模型,就可能形成隐性技术依赖;更关键的是,当底层推理框架、Tokenizer实现甚至量化方案持续绑定特定外部源码时,所谓“自主可控”或将流于表面——它或许能通过性能测试,却未必经得起地缘政治压力下的长期演进检验。
争议最早集中于Upstage公司。其竞争对手Sionic AI首席执行官Ko Suk-hyun在领英公开质疑,指Upstage模型的部分组件与智谱AI开源模型高度相似,且原始代码中残留智谱AI版权标识。他直言:“一个疑似基于中国模型微调的版本,竟被提交至纳税人资助的国家项目中,令人深感遗憾。”此举迅速将公众视线引向韩国AI战略的执行边界问题:主权AI的“主权”,究竟应定义为代码归属、训练数据来源、模型权重生成方式,还是最终决策逻辑的完全内生?
Upstage随后举行直播技术验证,展示其模型训练日志与数据流水线,强调主干网络为自研架构、训练全程在韩国境内完成。但其亦坦承,推理服务所用的部分轻量级解码器与ONNX运行时封装,确实复用了智谱AI开源仓库中的标准化模块——而这类模块在全球AI部署场景中已被数以千计的企业采用,包括美国、欧洲多家头部云服务商。
这场审查随即蔓延至其他入围者。Naver被指其多模态模型中的视觉编码器(ViT变体)与音频编码器结构,与中国阿里巴巴集团Qwen-VL及OpenAI的Whisper存在显著同源特征;SK Telecom则被发现其推理引擎的CUDA内核调度逻辑与DeepSeek-V2开源实现高度趋同。两家公司均回应称,所涉模块属行业通用技术栈,核心训练框架、注意力机制改进、韩语特化词表及知识蒸馏策略均为自主研发,强调“模型大脑”与“四肢躯干”的权责分离。
根据项目规划,韩国政府将在本周从五家决赛入围者中淘汰一家,并计划于2027年前最终遴选出两家胜出企业。入选者需满足硬性指标:模型综合性能须达OpenAI或谷歌同类产品的95%以上;同时将获得持续财政拨款用于韩语高质量数据集建设、顶尖AI人才引进,并优先接入政府专供的AI计算芯片资源池。这一时间表与技术门槛,折射出韩国在追赶窗口期收窄背景下的紧迫感——但此次开源代码风波也暴露出:当“速度”与“纯粹性”发生冲突时,国家AI战略亟需更清晰的技术主权判定标准。
耐人寻味的是,本次竞赛规则自始至终未对是否允许使用外国开源代码作出明文限定。争议爆发后,韩国科学技术信息通信部亦未发布补充指引。这种制度留白,客观上为技术团队保留了最大灵活度,却也将价值判断压力转移至舆论场与学术界。韩国副总理兼科学技术信息通信部长官裴庆勋本月早些时候在社交媒体表态:“目睹当前人工智能产业掀起的技术论战,我反而看到了韩国人工智能的光明前景。”此番发言看似超然,实则暗含深意——真正的技术主权,不仅体现于模型参数的物理位置,更在于一个国家能否就“何为自主”展开理性、专业且具建设性的公共辩论。
首尔国立大学人工智能研究院院长Jae W. Lee的解读提供了一种务实视角:AI模型的本质是数值空间中的函数映射,其“思想”体现在训练过程中形成的权重分布与推理时的激活路径。目前受质疑的几家企业,其模型核心训练流程、损失函数设计、韩语语法建模机制等关键环节,确未发现直接移植外国模型权重或照搬训练策略的证据。换言之,它们或许借用了“脚手架”,但正在浇筑属于自己的“承重墙”。这提醒我们:在AI时代评估技术自主,不能止步于代码行数统计,而应深入到数据飞轮、人才梯队与创新容错机制等更底层维度。