日本 “最大国产 AI 模型” 翻车：配置文件曝光，底层竟是 DeepSeek V3

流云昨天 59 0条评论

摘要： 3 月 17 日，日本乐天集团（Rakuten）高调发布Rakuten AI 3.0，对外宣称这是日本国内规模最大、性能最强的自研 AI 大模型。官方数据显示，该模型参数量约 70...

3 月 17 日，日本乐天集团（Rakuten）高调发布Rakuten AI 3.0，对外宣称这是日本国内规模最大、性能最强的自研 AI 大模型。官方数据显示，该模型参数量约 7000 亿，针对日语场景深度优化，采用 Apache 2.0 协议开源，还获得日本经济产业省与 NEDO 旗下 GENIAC 项目的资金支持。

然而这场声势浩大的发布会，仅维持不到 12 小时便遭遇 “光速打脸”。有开发者在 Hugging Face 模型仓库中，直接查看了 Rakuten AI 3.0 的配置文件，底层架构与参数完全指向中国大模型 DeepSeek V3，所谓 “日本自研” 的说法，瞬间陷入舆论争议。

一、实锤：一行 config.json，揭开模型真身

大模型发布后，权重文件按惯例上传至 Hugging Face 乐天官方账号。整个曝光过程没有任何技术门槛，只需进入文件页面，打开config.json即可看清全貌。

在核心配置项中：

architectures字段明确标注：DeepseekV3ForCausalLM
model_type字段直接写明：deepseek_v3
进一步核对参数，所有关键数值与 DeepSeek V3 原版完全一致：
hidden_size：7168
intermediate_size：18432
num_hidden_layers：61
n_routed_experts：256
vocab_size：129280

这意味着，Rakuten AI 3.0 并非从零研发的新模型，而是以 DeepSeek V3 为基座，仅在其基础上进行日语数据微调与名称包装。乐天对外宣称的 “约 7000 亿参数”，也与 DeepSeek V3 约 6810 亿的参数量高度吻合。更值得注意的是，Hugging Face 页面自动生成的标签中，直接带有deepseek_v3标识，这是系统根据配置文件自动识别，并非第三方添加。

从开源规则来看，DeepSeek V3 采用宽松开源协议，允许商业使用与二次微调，乐天的操作并未违规。但在所有官方宣传、新闻稿与对外口径中，乐天全程未提及 “DeepSeek” 任何字样，只模糊表述为 “基于开源社区优秀模型开发”，这种信息不透明的做法，引发行业与用户强烈不满。

二、舆论炸锅：从 “国产骄傲” 到 “贴牌争议”

Rakuten AI 3.0 配置文件的截图在社交平台快速传播，日本科技媒体 Impress Watch 的报道评论区迅速沦陷。有日本网友直言：“日本已经到了要用中国 AI，包装成国产 AI 的时代了吗？”

更多观点认为，即便基于开源模型二次开发，也应明确标注来源，隐瞒基座信息，有误导公众与政府补贴评审的嫌疑。这一事件之所以引发巨大反响，与 DeepSeek 在日本的特殊地位密切相关。

2025 年 DeepSeek 系列模型崛起时，日本媒体曾用 **“AI 界黑船事件”** 形容其冲击 —— 对应历史上美国舰队强行打开日本国门的标志性事件，态度充满警惕与抵触。此后日本官方与企业接连表态：

日本数字大臣公开要求公务员谨慎使用 DeepSeek；
丰田、三菱重工等企业全面禁止内部使用；
软银等集团限制访问并禁止工作设备安装。

一边严格限制、高调警惕，一边悄悄拿来包装成 “国产自研”，如此反差让事件持续发酵。

三、行业视角：开源微调不违规，但透明才是底线

在全球大模型行业，基于开源基座做领域微调是常规路径，日本乐天并非个例。但合规不等于合理，透明与诚信才是长期发展的关键。

开源不等于可以隐瞒

DeepSeek 等国产模型开放使用权，是为推动技术普惠，而非给企业 “贴牌换皮”、打造虚假自研形象提供便利。

政府补贴项目更应公开透明

Rakuten AI 3.0 获得日本经产省与 NEDO 项目支持，属于公共资金扶持项目，隐瞒核心基座来源，不符合科研与产业补贴的基本诚信原则。

日语优化有价值，但不应抹杀基座贡献

乐天针对日语、日本本地场景做微调与对齐，确实具备实用价值，但这不能等同于 “自研大模型”，更不应抹去底层基座的技术贡献。目前 DeepSeek 官方已迭代至V3.2 版本，初代 V3 因幻觉问题明显，已非最优选择。有开发者调侃，乐天即便要 “贴牌”，也应选择更新版本，可见其研发与迭代能力有限。

四、事件启示：国产大模型的全球影响力与行业规则

Rakuten AI 3.0 翻车事件，本质上折射出两大趋势：

第一，中国开源大模型已具备全球竞争力。DeepSeek 能被海外大型集团选为核心基座，证明国产模型在架构、性能、成本与开源友好度上，达到国际一线水准。
第二，全球 AI 行业亟需更明确的标注规范。基于开源模型二次开发，应强制披露基座来源、修改范围与训练数据，避免误导市场、用户与监管机构。

对国内开发者与企业而言，这一事件也提醒我们：开源不等于放任，需关注海外商用的合规与署名问题；坚持自研与开源并重，才能在全球 AI 竞争中掌握主动权；贴牌换皮模式不可持续，真实技术能力才是长期壁垒。

总结

Rakuten AI 3.0 的 “贴牌风波”，看似是日本企业的一场公关翻车，实则是国产大模型全球崛起的真实缩影。从被日媒称作 “黑船”，到成为日本 “最大国产 AI” 的底层基座，DeepSeek 用技术实力打破偏见。合规可以靠协议，信任只能靠透明。未来，无论中外企业，基于开源模型做二次开发，唯有坦诚标注、清晰溯源，才能赢得用户与市场的真正认可。

文章版权及转载声明：

作者:流云本文地址：https://www.sanwenge.com/post/758.html发布于昨天
文章转载或复制请以超链接形式并注明出处三文阁

标签：博主很懒，并没有设置标签