3 月 17 日,日本乐天集团(Rakuten)高调发布Rakuten AI 3.0,对外宣称这是日本国内规模最大、性能最强的自研 AI 大模型。官方数据显示,该模型参数量约 7000 亿,针对日语场景深度优化,采用 Apache 2.0 协议开源,还获得日本经济产业省与 NEDO 旗下 GENIAC 项目的资金支持。
然而这场声势浩大的发布会,仅维持不到 12 小时便遭遇 “光速打脸”。有开发者在 Hugging Face 模型仓库中,直接查看了 Rakuten AI 3.0 的配置文件,底层架构与参数完全指向中国大模型 DeepSeek V3,所谓 “日本自研” 的说法,瞬间陷入舆论争议。
一、实锤:一行 config.json,揭开模型真身
大模型发布后,权重文件按惯例上传至 Hugging Face 乐天官方账号。整个曝光过程没有任何技术门槛,只需进入文件页面,打开config.json即可看清全貌。
architectures字段明确标注:
DeepseekV3ForCausalLMmodel_type字段直接写明:
deepseek_v3- 进一步核对参数,所有关键数值与 DeepSeek V3 原版完全一致:
hidden_size:7168
intermediate_size:18432
num_hidden_layers:61
n_routed_experts:256
vocab_size:129280
这意味着,Rakuten AI 3.0 并非从零研发的新模型,而是以 DeepSeek V3 为基座,仅在其基础上进行日语数据微调与名称包装。乐天对外宣称的 “约 7000 亿参数”,也与 DeepSeek V3 约 6810 亿的参数量高度吻合。更值得注意的是,Hugging Face 页面自动生成的标签中,直接带有deepseek_v3标识,这是系统根据配置文件自动识别,并非第三方添加。
从开源规则来看,DeepSeek V3 采用宽松开源协议,允许商业使用与二次微调,乐天的操作并未违规。但在所有官方宣传、新闻稿与对外口径中,乐天全程未提及 “DeepSeek” 任何字样,只模糊表述为 “基于开源社区优秀模型开发”,这种信息不透明的做法,引发行业与用户强烈不满。
二、舆论炸锅:从 “国产骄傲” 到 “贴牌争议”
Rakuten AI 3.0 配置文件的截图在社交平台快速传播,日本科技媒体 Impress Watch 的报道评论区迅速沦陷。有日本网友直言:“日本已经到了要用中国 AI,包装成国产 AI 的时代了吗?”
日本数字大臣公开要求公务员谨慎使用 DeepSeek;
丰田、三菱重工等企业全面禁止内部使用;
软银等集团限制访问并禁止工作设备安装。
一边严格限制、高调警惕,一边悄悄拿来包装成 “国产自研”,如此反差让事件持续发酵。
三、行业视角:开源微调不违规,但透明才是底线
在全球大模型行业,基于开源基座做领域微调是常规路径,日本乐天并非个例。但合规不等于合理,透明与诚信才是长期发展的关键。
开源不等于可以隐瞒
DeepSeek 等国产模型开放使用权,是为推动技术普惠,而非给企业 “贴牌换皮”、打造虚假自研形象提供便利。
政府补贴项目更应公开透明
Rakuten AI 3.0 获得日本经产省与 NEDO 项目支持,属于公共资金扶持项目,隐瞒核心基座来源,不符合科研与产业补贴的基本诚信原则。
日语优化有价值,但不应抹杀基座贡献
乐天针对日语、日本本地场景做微调与对齐,确实具备实用价值,但这不能等同于 “自研大模型”,更不应抹去底层基座的技术贡献。目前 DeepSeek 官方已迭代至V3.2 版本,初代 V3 因幻觉问题明显,已非最优选择。有开发者调侃,乐天即便要 “贴牌”,也应选择更新版本,可见其研发与迭代能力有限。
四、事件启示:国产大模型的全球影响力与行业规则
Rakuten AI 3.0 翻车事件,本质上折射出两大趋势:
- 第一,中国开源大模型已具备全球竞争力。DeepSeek 能被海外大型集团选为核心基座,证明国产模型在架构、性能、成本与开源友好度上,达到国际一线水准。
- 第二,全球 AI 行业亟需更明确的标注规范。基于开源模型二次开发,应强制披露基座来源、修改范围与训练数据,避免误导市场、用户与监管机构。
对国内开发者与企业而言,这一事件也提醒我们:开源不等于放任,需关注海外商用的合规与署名问题;坚持自研与开源并重,才能在全球 AI 竞争中掌握主动权;贴牌换皮模式不可持续,真实技术能力才是长期壁垒。
总结
Rakuten AI 3.0 的 “贴牌风波”,看似是日本企业的一场公关翻车,实则是国产大模型全球崛起的真实缩影。从被日媒称作 “黑船”,到成为日本 “最大国产 AI” 的底层基座,DeepSeek 用技术实力打破偏见。合规可以靠协议,信任只能靠透明。未来,无论中外企业,基于开源模型做二次开发,唯有坦诚标注、清晰溯源,才能赢得用户与市场的真正认可。
