日本 “最大国产 AI 模型” 翻车:配置文件曝光,底层竟是 DeepSeek V3

流云 昨天 59 0条评论
摘要: 3 月 17 日,日本乐天集团(Rakuten)高调发布Rakuten AI 3.0,对外宣称这是日本国内规模最大、性能最强的自研 AI 大模型。官方数据显示,该模型参数量约 70...

3 月 17 日,日本乐天集团(Rakuten)高调发布Rakuten AI 3.0,对外宣称这是日本国内规模最大、性能最强的自研 AI 大模型。官方数据显示,该模型参数量约 7000 亿,针对日语场景深度优化,采用 Apache 2.0 协议开源,还获得日本经济产业省与 NEDO 旗下 GENIAC 项目的资金支持。

然而这场声势浩大的发布会,仅维持不到 12 小时便遭遇 “光速打脸”。有开发者在 Hugging Face 模型仓库中,直接查看了 Rakuten AI 3.0 的配置文件,底层架构与参数完全指向中国大模型 DeepSeek V3,所谓 “日本自研” 的说法,瞬间陷入舆论争议。

一、实锤:一行 config.json,揭开模型真身

大模型发布后,权重文件按惯例上传至 Hugging Face 乐天官方账号。整个曝光过程没有任何技术门槛,只需进入文件页面,打开config.json即可看清全貌。

在核心配置项中:
  • architectures字段明确标注:DeepseekV3ForCausalLM

  • model_type字段直接写明:deepseek_v3

  • 进一步核对参数,所有关键数值与 DeepSeek V3 原版完全一致:
  • hidden_size:7168

  • intermediate_size:18432

  • num_hidden_layers:61

  • n_routed_experts:256

  • vocab_size:129280

这意味着,Rakuten AI 3.0 并非从零研发的新模型,而是以 DeepSeek V3 为基座,仅在其基础上进行日语数据微调与名称包装。乐天对外宣称的 “约 7000 亿参数”,也与 DeepSeek V3 约 6810 亿的参数量高度吻合。更值得注意的是,Hugging Face 页面自动生成的标签中,直接带有deepseek_v3标识,这是系统根据配置文件自动识别,并非第三方添加。

从开源规则来看,DeepSeek V3 采用宽松开源协议,允许商业使用与二次微调,乐天的操作并未违规。但在所有官方宣传、新闻稿与对外口径中,乐天全程未提及 “DeepSeek” 任何字样,只模糊表述为 “基于开源社区优秀模型开发”,这种信息不透明的做法,引发行业与用户强烈不满。

二、舆论炸锅:从 “国产骄傲” 到 “贴牌争议”

Rakuten AI 3.0 配置文件的截图在社交平台快速传播,日本科技媒体 Impress Watch 的报道评论区迅速沦陷。有日本网友直言:“日本已经到了要用中国 AI,包装成国产 AI 的时代了吗?”

更多观点认为,即便基于开源模型二次开发,也应明确标注来源,隐瞒基座信息,有误导公众与政府补贴评审的嫌疑。这一事件之所以引发巨大反响,与 DeepSeek 在日本的特殊地位密切相关。
2025 年 DeepSeek 系列模型崛起时,日本媒体曾用 **“AI 界黑船事件”** 形容其冲击 —— 对应历史上美国舰队强行打开日本国门的标志性事件,态度充满警惕与抵触。此后日本官方与企业接连表态:
  • 日本数字大臣公开要求公务员谨慎使用 DeepSeek;

  • 丰田、三菱重工等企业全面禁止内部使用;

  • 软银等集团限制访问并禁止工作设备安装。

一边严格限制、高调警惕,一边悄悄拿来包装成 “国产自研”,如此反差让事件持续发酵。

三、行业视角:开源微调不违规,但透明才是底线

在全球大模型行业,基于开源基座做领域微调是常规路径,日本乐天并非个例。但合规不等于合理,透明与诚信才是长期发展的关键。

开源不等于可以隐瞒

DeepSeek 等国产模型开放使用权,是为推动技术普惠,而非给企业 “贴牌换皮”、打造虚假自研形象提供便利。

政府补贴项目更应公开透明

Rakuten AI 3.0 获得日本经产省与 NEDO 项目支持,属于公共资金扶持项目,隐瞒核心基座来源,不符合科研与产业补贴的基本诚信原则。

日语优化有价值,但不应抹杀基座贡献

乐天针对日语、日本本地场景做微调与对齐,确实具备实用价值,但这不能等同于 “自研大模型”,更不应抹去底层基座的技术贡献。目前 DeepSeek 官方已迭代至V3.2 版本,初代 V3 因幻觉问题明显,已非最优选择。有开发者调侃,乐天即便要 “贴牌”,也应选择更新版本,可见其研发与迭代能力有限。

四、事件启示:国产大模型的全球影响力与行业规则

Rakuten AI 3.0 翻车事件,本质上折射出两大趋势:

  • 第一,中国开源大模型已具备全球竞争力。DeepSeek 能被海外大型集团选为核心基座,证明国产模型在架构、性能、成本与开源友好度上,达到国际一线水准。
  • 第二,全球 AI 行业亟需更明确的标注规范。基于开源模型二次开发,应强制披露基座来源、修改范围与训练数据,避免误导市场、用户与监管机构。

对国内开发者与企业而言,这一事件也提醒我们:开源不等于放任,需关注海外商用的合规与署名问题;坚持自研与开源并重,才能在全球 AI 竞争中掌握主动权;贴牌换皮模式不可持续,真实技术能力才是长期壁垒。

总结

Rakuten AI 3.0 的 “贴牌风波”,看似是日本企业的一场公关翻车,实则是国产大模型全球崛起的真实缩影。从被日媒称作 “黑船”,到成为日本 “最大国产 AI” 的底层基座,DeepSeek 用技术实力打破偏见。合规可以靠协议,信任只能靠透明。未来,无论中外企业,基于开源模型做二次开发,唯有坦诚标注、清晰溯源,才能赢得用户与市场的真正认可。

文章版权及转载声明:

作者:流云本文地址:https://www.sanwenge.com/post/758.html发布于 昨天
文章转载或复制请以超链接形式并注明出处三文阁