AI训练数据,个税与增值税的“暗流”
大家聊AI,总爱谈大模型、算力、算法,却很少提及支撑这些的“燃料”——训练数据。特别是那些需要人工标注的数据,从图片框选到文本分类,背后是一大群个人开发者、兼职学生在提供劳务。问题随之而来:2026年,境内个人给AI企业提供这类数据标注服务,企业支付劳务费时,到底要不要代扣代缴增值税?这个坑,我在帮客户做税务合规时,可没少踩。
很多人第一反应是“当然要扣”,因为企业是扣缴义务人。但这里有个微妙的点:增值税的扣缴义务,通常只发生在境外单位或个人向境内提供服务时。根据财税〔2016〕36号文附件1第十二条,境内单位和个人销售服务,一般由自己申报,而非支付方代扣。如果数据标注员是个中国人、在中国境内干活,理论上,企业支付的这笔钱是“境内个人提供境内服务”,企业没有法定的增值税代扣义务。
实操层面远没这么简单。税务局看的是“实质”。你支付的费用,说到底是个人的“劳务报酬”,个人所得税方面企业必须预扣预缴(这点跑不掉),但增值税的归属,常常因为“税务居民”身份被混淆。我去年就帮一个朋友的公司处理过类似案例。
税法逻辑的“红绿灯”
要搞清楚这个事,得先给服务做个“定性”。个人向你提供数据标注,在法律上属于“现代服务——信息技术服务”下的“业务流程管理服务”或“数据处理服务”。如果个人没有注册公司或个体户,他就是个自然人。
根据《增值税暂行条例》,自然人应纳税的,一般适用小规模纳税人标准,征收率3%(疫情期间可能有减免,但2026年大概率恢复常态化)。关键是《增值税暂行条例实施细则》第三十七条提到:自然人发生应税行为,其增值税的起征点为每次(日)500元。注意,这里是“每次”而不是“按月”。你给一个标注员一次支付300元,人家甚至都不用交税;你给他一次支付2000元,他就产生了纳税义务。
那企业要不要代扣?法条掰开揉碎了说:法律没有直接规定境内企业有代扣境内个人增值税的义务。税务局通常要求个人自行申报,或者由支付方在支付个税时一并关注。但我处理过的两个案子,结论截然不同。一个客户(化名“图灵数据”)给个人按月结算,单月超10万,税务局专管员明确要求企业必须扣缴增值税,理由是“防止税源流失”;另一个客户(化名“智标科技”)按次支付,每次800元,税务局则没提这茬。你看,实务中,规则经常被“金额大小”和“支付频率”重新定义。
现行规则与2026年的“微妙温差”
很多人会查国家税务总局的公告。现行规则很明确:境内单位支付给境外的服务费,必须代扣增值税;境内单位支付给境内个人的,原则上不用代扣增值税,个人自己报。但这一逻辑在2026年可能面临挑战。
原因有二。第一,金税四期乃至未来的五期系统,已经把“数据流”管得死死的。你企业公转私给个人打了劳务费,税务局系统里会生成“个税申报记录”和“银行流水比对”。如果个税报了,而增值税那边没有任何申报痕迹,系统可能会自动弹出比对异常。第二,个人开发者往往不知道要交增值税,或者故意不交。税务局查不到个人的话,会不会直接找企业?我遇到过这种情况:一家合作公司的财务总监跟我抱怨,被税务约谈,要求企业提供所有个人的“增值税完税证明”复印件,否则补税加罚款。最后他们没办法,把所有未代扣增值税的劳务费,自己掏腰包补了3%的增值税,理由是“为了维护合作关系,不想让开发票为难开发者”。
签约条款里的“暗门”与实操博弈
考虑到上述不确定性,明智的企业会在合作协议里埋下“防火墙”。我经手过的标准合同,现在都会加一条:“甲方(企业)无义务为乙方(个人)代扣代缴增值税,乙方应自行申报并承担相关税费”。这能帮企业规避“扣缴义务人职责缺失”的行政责任,但没法完全规避税务局的“吃不准式”追责。
具体操作上,我建议你按“金额大小”分情况处理。如果单笔支付金额超过500元,且一年内累计超过10万元(这阈值可能变动),最好主动联系主管税务机关确认当地口径。很多地方的12366会给你一个模糊的答复,但如果你追问“有没有书面文件”,他们往往说没有。这时,有个“土办法”:让个人去税务局代开“劳务费发票”给你。只要他开了票,增值税就在开票环节缴掉了,企业百分百合规。但代价是:个人要交3%增值税(可能享受减免),还要交个人所得税(通常1.5%左右),综合税负4.5%左右,很多人不乐意。
2026年可能的政策风向与实战案例
聊到2026年,我判断趋势是“从宽松转向精准监管”。2020年疫情后,小规模纳税人增值税有1%的优惠,甚至季度30万免税。但2026年,经济复苏背景下,优惠政策可能会全面收紧。届时,任何超过500元/次的劳务支付,都可能触发税务追踪。
我分享一个痛苦的教训。2023年,我帮一家“自动标注平台”做合规改造。他们平台上有800多个个人标注员,每人月均收入4000元。之前公司从不代扣增值税,2023年底被税务稽查,要求公司补缴从2021年到2023年所有标注劳务费的增值税,理由是“企业未能有效履行监管义务,导致税款流失”。那800多个人,公司连他们身份证号都不全。最后只能按照公司台账里记录的总额,自己掏了30多万补税和滞纳金。如果你的业务周期长、数据量大,2026年之前,必须把个人的“税务身份备案”做掉,至少做到“每一笔支付都有痕迹可查”。
结论:别让“数据标注”成税务黑洞
总结下来,境内个人给AI企业做数据标注,2026年,法律上企业大概率没有强制代扣代缴增值税的义务,但实务中,税务局有可能基于“税源控制”要求企业作为“代缴责任人”操作。安全路线只有两条:要么让个人全权自行申报并保留完税证明,要么企业主动承担起代扣代缴机制(尽管法律不强制),把所有风险“内部化”。
如果我是你,我会在2025年底,专门给公司的税务顾问打个电话,问清楚:“针对我们这种高频率、小额度公转私支付,2026年你们出了新文件没?” 一个好的顾问,能帮你避免“老板,我们被查了”这种恐怖对话。毕竟,技术上的创新是美好的,但配套的合规成本,真金白银。
澄算通见解总结
AI企业的数据标注劳务支出,正从小众操作变成规模性税务课题。核心矛盾在于:法律未强制,系统却追踪。澄算通建议将“个人税务身份采集”作为前置流程,并依据单次支付额(超500元触发起征点)及年度总量,判断是否需引导个人或由企业主动备案。别把别人该交的税,变成自己的“成本黑洞”。预则立,不预则废。