无锡公司注册_公司注销一站式企业服务商
15651517736
893780148@qq.com

企业为AI短剧项目采购训练数据,数据采购费能否纳入研发费用加计扣除范围?2023年起“训练数据”已纳入可费用化科目

AI短剧风口下,数据采购费如何“税”出价值?

做企业服务这六年,我经手过不少科技公司的注册和财税规划,但最近一年,风向明显变了。很多创业者和财务负责人,开始频繁问同一个问题:做AI短剧项目,花大价钱买来的训练数据,这笔钱到底能不能放进研发费用里加计扣除?说白了,大家不是不想做研发,而是怕税务风险。2023年其实是个分水岭,政策对“训练数据”的定性有了关键调整。以前这钱通常被归入“软硬件采购”或“办公杂费”,现在不一样了——它已经正式被列为可费用化的科目。这意味着,如果你操作得当,这笔投入不仅不是纯成本,还能帮你抵掉更多所得税。

企业为AI短剧项目采购训练数据,数据采购费能否纳入研发费用加计扣除范围?2023年起“训练数据”已纳入可费用化科目

我有个客户,是做AI短剧剧本自动生成的,去年为了优化人物对话逻辑,从几家数据服务商那里买了近300万条对话语料。财务一开始不敢入账,怕被查。我帮他们梳理了政策后,把其中用于模型迭代的采购费直接归入“直接投入费用”。最后汇算清缴时,这300万的实际税负降低了将近50万。厘清这个边界,真的很重要。尤其是2023年《研发费用加计扣除政策执行指引》2.0版发布后,明确指出“训练数据”属于研发活动中的“直接消耗”材料,这点在实务中已经被多地税务机关认可。

研发费用加计扣除的核心前提

咱们先别急着往里塞费用。想用上这个政策,第一个前提是你的AI短剧项目必须符合“研发活动”的定义。按税务总局的标准,研发活动要具备“创新性”和“不确定性”。你如果只是拿现成的开源模型,随便喂点数据生成几个短剧,那大概率不算研发,只能算商业运营。但如果你是为了解决“短剧人物表情不自然”或者“台词逻辑跳跃”这类具体技术问题,专门设计算法去训练模型,那这笔费用就站得住脚。我遇到过一家公司,采购了上千万条肢体动作数据,结果被税务局质疑用途不合理——他们连个像样的研发立项书都没有,数据直接当素材用了。最终补税加罚款,损失惨重。

这里有个关键点:数据采购费要纳入加计扣除,必须与研发项目直接相关,且能提供对应的立项决议、项目计划书和费用台账。2023年新规后,很多地方税务局开始接受“训练数据”作为费用化科目,但审核更严了。他们会看你的数据有没有用于模型训练,有没有形成技术文档,有没有失败的实验记录。设立单独的研发费用辅助账,把每一笔数据采购的用途、时间、用途详细记录,是安全享受优惠的护身符。

2023年政策更新后的费用化路径

过去几年,很多企业把训练数据采购费计入“无形资产”或者“长期待摊费用”,然后缓慢摊销。这其实与研发费用加计扣除的初衷相悖——因为摊销的部分通常不能享受当期加计。2023年之后,政策明确“训练数据”可以一次性费用化。具体怎么操作?通常在会计上,如果你采购的数据是为特定研发项目服务,且项目周期不超过一年,就应该在发生时直接计入“研发支出——费用化支出”。如果项目周期跨年,则需要先计入“研发支出——资本化支出”,待项目结束后再转成无形资产。但绝大多数AI短剧项目,数据迭代快、使用周期短,更适合费用化处理。

我处理过一个典型案例:一家短视频公司,为训练“短剧口型同步”模型,半年内分批买了4次数据,总金额260万。我建议他们不要一次性全部费用化,而是根据每个批次的“数据使用计划”来分摊。结果税务局来查账时,每个批次对应的研发进度表和实验日志都对得上,顺利通过。不是所有数据买进来都能立刻当成研发费,核心是看它有没有被你真实地“消耗”在研发过程中。2023年的新规给了企业更大的灵活性,但同时也要求更强的合规能力。

数据来源与合同设计的税务要点

很多企业栽跟头,不是栽在“能不能扣”,而是栽在“证据不清”。比如,你从第三方买来数据,合同上只写了“数据采购”,没有标明月途。税务局一看,觉得这跟普通资源采购没区别。正确的做法是,在采购合同中明确约定“该数据用于研发活动中的模型训练”,并且附上数据的最终使用报告或版本更新日志。我有个做AI短剧配乐的朋友,从国外买了200万条音频语料,合同是英文的,翻译过来就写了个“数据购买”。我指导他补充了一份补充协议,专门说明这200万条数据是用于训练“短剧情绪适配模型”,并在后续的研发台账里把每次训练用到的数据条数都登记了。最后这笔费用顺利加计扣除,省下了近40万税。

数据来源的合规性也很重要。如果数据涉及个人信息、未公开影视素材等,可能会触及“经济实质法”的底线条款,税务局在审查时会要求你说明交易的商业实质和合理性。建议在采购前做好供应商的背景调查,确保合同里有知识产权保证条款。数据采购费的增值税专票能否抵扣,取决于该研发项目是否用于生产销售——如果是用于内部模型训练后未直接产生收入,那进项税一般可以抵扣;但如果数据用于为特定客户开发短剧,则需具体分析。总体而言,合同把这层关系写清楚,能省下很多后续麻烦。

数据用途场景 税务处理要点及合规建议
直接用于训练短剧生成模型 可费用化,需提供实验记录、训练日志。合同注明“研发用途”,保留数据使用台账。
购买后作为成品素材库 属于存货或无形资产,不可加计扣除。建议设立独立“素材采购”科目,与研发区分。
从海外供应商采购数据 关注预提所得税和“实际受益人”认定,确保供应商提供真实发票。合同需包含知识产权条款。
企业内部生成数据 成本可纳入人员人工费或直接投入,但需有内部数据采集记录和成本分摊依据。

个人感悟:最常被忽视的“研发人员”身份

做这行久了,我发现自己遇到的客户里,最容易出问题的往往不是费用本身,而是“谁在领这笔费用的工资”。比如,很多公司让普通运营人员去采购数据、标注数据,这些人的工资如果算进研发人员人工费里,其实风险极大。因为税务局现在会查研发人员的“实际受益人”身份——你是否真正在做研发工作?有没有独立签名?有没有研发记录?我处理过一个案例,客户把两个负责数据标注的实习生算进研发团队,结果一个季度内就被税务系统锁定,要求补税。后来我们重新调整了人员架构,让真正参与模型训练的算法人员负责数据采购决策,才算合规。

还有一点,是关于“跨年项目”的处理。AI短剧项目常常是滚动开发的,今年买的数据可能明年才用。这时候,你必须在年底前做好判断:到底这些数据是用于本年度未完成的研发项目,还是属于未来的储备?如果属于后者,建议先资本化,等项目启动再转费用化。经验告诉我,宁可多花两天做台账,也不要事后补发票。因为税务核查时,看的是你当时的决策逻辑,而不是事后解释。2023年以后,很多地方的税务局为了鼓励AI产业,对“训练数据”的审核相对友好,但前提是你的证据链要完整——合同、立项、进度、成果,缺一不可。

结论:数据是AI的燃料,也是税筹的钥匙

AI短剧项目采购训练数据的费用,在符合特定条件的前提下,完全可以纳入研发费用加计扣除范围。尤其从2023年起,政策给予了更明确的支持,但这不是一劳永逸的“”。你需要做的是:严格区分研发与非研发活动,建立清晰的数据使用台账,优化采购合同条款。我建议每位做AI短剧的创业者,在项目启动之初就导入合规思维,而不是等税务检查来了再补救。未来,随着AI产业的规范发展,这类数据的税务处理只会更细致。提前布局,才能把这个政策红利吃到最足。

澄算通见解 训练数据费用化是大势所趋,但合规红线不能碰。核心在于“业务实质匹配”——数据必须与具体研发项目挂钩,而非单纯素材购买。建议企业同步搭建研发辅助账与数据台账,实现从采购到消耗的全链路可追溯,这才是安全享受优惠的底层逻辑。

张明

资深财税顾问 | 注册会计师

10年财税领域经验,专注于企业财税合规与税务筹划,服务超过500家创业企业。擅长公司注册、股权设计、税务优化等领域。

获取专业财税咨询

无论您是需要公司注册还是其他企业服务,我们的专业团队都能为您提供解决方案

立即咨询