税务大数据解决方案-航天信息股份有限公司

在国家税务局提出的“互联网+税务”的号召下,增值税发票网络版上线、电子发票的开具,以及全国各地掀起的电子税务局建设,进一步加强了国家税务信息化建设。随着各种税务信息化系统的使用,信息系统中的数据增长量巨大,使用传统的数据库进行存储和查询逐渐不能满足需求。海量数据的存储,以及海量数据上的数据查询和统计的需求,使得税务数据分析业务需要从传统的数据库架构转换为可扩展、并行计算能力更强的大数据架构。使用增值税发票进行分析以往遇到的困境有:1)不能进行跨省的进销项数据比对;2)不能进行基于商品明细的数据分析;3)不能进行实时的数据分析。随着增值税发票系统升级版的上线,进项发票将以电子底账的形式清分到购货方所在的省份,使得跨省进销项分析成为可能;增值税发票实现了实时开票,票面信息采集更加齐全,其中包括了商品明细、购货清单等信息。在增值税纳税人数量急剧增加和税收管控风险加大的背景下,航天信息技术研究院基于航天信息在税务行业长期耕耘所积累下来的丰富的行业经验和海量的数据资源,提出了税务大数据解决方案,该方案的目标是充分地利用各税务信息化系统中的历史数据和新增数据,通过全量数据获得更加准确的数据分析结果,加强行政审批后续的税务管理,最终建设成为智慧电子税务局。未来电子税务局的发展,将由大厅业务操作,转变为后台业务控制与审查。通过一线税务工作人员不断添加税务业务规则和税务数据分析系统不断学习和迭代,系统将能提供实时的监控、预警、告警,并在一定程度上对新型违反税法行为进行识别。除此之外,充分运用税收大数据能从一个角度反映社会经济的发展情况,服务于社会经济发展的需要。各种不同的税务发票数据汇总,统计各个月的税收情况,获得税收指标完成情况。可以知晓已完成的税收,税收贡献率高的行业,税收贡献率高的地区,税收贡献率高的票种,便于税务局有针对性地指定税收政策。各地方税务机关面临的最主要的风险在于偷逃税款、虚开发票与走逃。通过对企业一段时间的进项销项差异分析,可以发现企业偷逃税款的风险,追补税款。通过对纳税人虚开发票行为的分析,可发现大量顶版开具的行为为虚开发票企业的普遍特征。顶版开具发票和走逃行为具有强关联性,提前发现大量顶版开具的纳税人,可进行及时监控,避免税款流失。a) 近十年的税务数据分析的业务优势,以及税务信息系统的几乎全量数据,税务数据具有完备性,可通过纳税人异常行为的历史经验标注,训练出较准确的机器学习模型,对纳税人的开票行为进行识别,及时快速响应。d) 分布式数据库系统为OLAP场景进行了深度的优化,例如列式存储、分布式优化器,块级别的数据压缩,并行的数据导入和导出,弹性扩容等。