青岛企业官网建设—基于自然语言理解理解处理

依据自然语言处理的手机上手机微信交税综合性综合服务平台 06:28:29 2020年5期

李庆峰 宗佳佳 唐善成 张镤月 李大娟 陈熊熊

摘  要: 移动互联网网网阶段,信息内容內容种类丰富多彩五彩缤纷,得到方法多种多样多种多样,税款信息内容內容对技术性技术专业性和精准性的要求特别是在苛刻。针对进而导致的搜索难度系数系数上升、搜索精准度减少的难点,结合在我国税款质监质监总局“互联网+税款”行动计划方案,确立明确提出依据时兴立即通信手机上手机软件的交税综合性综合服务平台,以人力资源智能化化技术性性辅助税款信息内容內容的搜索。
[标识:內容1]
应用以自然语言处理为重要的智能化化信息内容內容搜索技术性性,对搜索人输入文本进行文本获得、特性项获得、应用夹角余弦法进行词意相近度计算并搜索输出,进行税款信息内容內容的智能化化问答功效,提供交税人随着必须的各种税款服务信息内容內容。最终进行以交税人为因素要素管理方法管理中心,以实际难点为导向性性的税款服务,促进税款服务确当代化、信息内容內容化、智能化发展。

关键词: 手机上手机微信交税综合服务平台; 互联网+税款; 自然语言处理; 人力资源智能化化; 智能化化信息内容內容搜索; 词意相近度计算

中图分类号: TN911?34                         参照参考文献标示码: A                          文章内容內容编号: 1004?373X(2020)05?0019?03

WeChat tax payment platform based on natural language processing

—A case of tax service of Weinan city in Shaanxi province

LI Wenfeng, ZONG Jiajia, TANG Shancheng, ZHANG Puyue, LI Dajuan, CHEN Xiongxiong

(School of Communication and Information Engineering, Xian University of Science and Technology, Xian 710054, China)

Abstract: There are many types of information in the era of the mobile Internet and the ways to get the information are diversified. The requirements for professionalism and accuracy of tax information are particularly strict. In view of the resulting problem of difficulty increase and accuracy decrease of the retrieval, a tax service platform based on mainstream instant messaging software is proposed in combination with the "Internet + tax" action plan proposed by the State Administration of Taxation (SAT), which assists the tax information retrieval with artificial intelligence technology. The intelligent information retrieval technology which takes natural language processing as the core is utilized to exert the text extraction and feature item extraction upon the retriever′s input text, and semantic similarity calculation and retrieval output are performed with the included angle cosine method, thus realizing the intelligent question?and?answer function of tax information and providing various tax service information required by taxpayers for tax payment. Finally, the taxpayer?centered and practical issue?oriented tax service is realized, which promotes the modernization, informatization and intelligent of tax services.

Keywords: WeChat tax payment platform; Internet + tax; natural language processing; artificial intelligence; intelligent information retrieval; semantic similarity computing

0  引  言

稅收就是我国财政局局盈利的重要来源于于,随着着社会发展发展趋势发展趋势发展趋势,税收质监总局管理体系也进行着不断探索与改革创新自主创新。在中国现行标准规范增值税、消費税等十多种税款[1],随着指南信息内容內容涉及到到信息内容內容报告、税票申请办理申请办理、申请办理交税、优惠申请办理申请办理、确认申请办理申请办理、进出口退(免)税、国际性性税款、清税注销、本人个人信用评价、权益维护保养、涉税技术性技术专业服务等多方面面面,针对不一样交税个人行为行为主体的不一样税款服务信息内容內容规定,精准信息消息推送申请原材料、申请办理申请办理方法、申请办理申请办理限期、注意事项及相关现行标准现行政策依据等交税服务信息内容內容,简易化提高交税人随着流程,务必十分关注。

同时,伴随着互联网技术性性的不断发展趋势发展趋势健全,立即通信手机上手机软件早就变为广泛的平常通信方法,根据2017年十一月腾讯官方网网发布的《2017手机上手机微信数据信息信息内容报告》,截至那时候候手机上手机微信日登录顾客已超9亿,较前一年提升[2]17%。极大的顾客总数为依据手机上手机微信开发设计设计方案的各种综合性综合服务平台提供了可能,催产出率多种多样多种多样产业链链在互联网阶段下新的运营发展趋势发展趋势方法,充裕应用互连网资源,构建智能化化化、一体化的综合性综合服务平台。

而目前,陕西省省省渭南市市市国税地税税款服务系统软件手机软件重要采用税款行政部门服务站现场咨询和税款系统软件手机软件官方网网站查询,在税款服务厅放置的二维码虽然还能够为交税人提供手中机端查询得到都有必须的随着信息内容內容的方法,如图所示所显示1所显示信息,但是,经粗略地地统计分析剖析,省税款局“随着指南二维码”上便会有110个二维码,交税人来扫描仪仪二维码得到必须税款服务信息内容內容時刻常会遇到“选择艰辛症”而沒有适从,无法马上高效率率地得到有效税款服务信息内容內容。

针对上述情况,原文中确立明确提出了依据自然语言处理的手机上手机微信交税综合性综合服务平台,依据智能化化搜索进行模糊不清不清匹配的自动式问答系统软件手机软件,在大大的的降低了对顾客技术性技术专业性的规定、减少了交税人许多时间成本费费的同时,还可以针对顾客规定,为智能化化信息消息推送定制化的税款服务信息内容內容提供依据和方法,以降低征纳成本费费、提高税款服务质量、构建智能化化化税款确保管理体系。

1  自然语言处理

信息内容內容的搜索本质上是顾客的信息内容內容搜索规定和数据信息信息内容库存量量储信息内容內容正中间的匹配整个过程[3]。随着着互联网技术性性的跨越式发展趋势发展趋势,综合性性应用互联网技术性性、通信技术性性、数据信息信息内容库技术性性进行信息内容內容的搜索得到了广泛关注,如何在很多的多媒體信息内容內容中过滤掉无用一一部分,搜索到合理信息内容內容,相关搜索技术性性的科学研究科学研究得到了丰硕成果,在这其中就包含了对于自然语言的处理。

自然语言处理就是计算机对大家所运用的口头上上或书面形式方式方法确当然语言进行各种各样各种各样处理、生产制造生产加工的技术性性,这种技术性性能够将自然语言中文汉语翻译为计算机语言,有利于计算机更十分非常容易地接受和推行大家以自然语言方法输入的指令,是发展趋势发展趋势人力资源智能化化技术性性的基本[3]。将自然语言处理应用于信息内容內容的搜索,促进搜索技术性性迈入了智能化化搜索的方向,搜索的高效率率和精准性将得到进一步的提升。智能化化信息内容內容搜索的重要在于文本相近度的计算。文本相近度计算重要从词性标明、去终止应用词、特性项获得、权值计算、相近度考量等方面着手,以得到高些效、更精确的处理结果[4]。

1.1  词性标明处理

中文差别于英文的很大特点在于中文没有建立的分割符,仅仅依据字与字正中间的不一样构成来描述词意,甚至没有怜悯境中,一样的字词还会继续再次说明不一样的词意,极大提升了自然语言掌握的复杂性。进行词性标明处理可以将文本提高为更具有有结构化的说明后再进行过后处理。目前时兴的中文词性标明方法重要有依据字串匹配的词性标明方法、依据统计分析剖析的词性标明方法和依据掌握的词性标明方法[5?7]。

1.2  去终止应用词

终止应用词便是指文本广州市中山市高校量出现的但没有实际具体实际意义或对句子词意掌握作用其实不大的词,如叹词、连词、冠词等均属在这其中。终止应用词对句子词意的无私奉献十分小,在词性标明结束后过滤掉这类终止应用词能够更强地提高提升优化算法。

1.3  特性项获得

文本的特性项是能够判定剖析文本含义的控制模块。从特性项的级别来说,由小于较高能够分为字、词、句子等。在大部分分情况下,级别高的特性项能够叙述更详尽的文本含义,但相对性性来说,也会对词性标明等处理确立明确提出高些要求。同时,文本的特性说明,能够帮助计算机将自然语言变换为有利于计算的特性室内空间空间向量[8],对于计算机处理和掌握自然语言有极大简易化作用。现如今,独热序号(One?Hot Encoding)、词频?逆文本文档頻率(TF?IDF)技术性性[9?10]等多种多样多种多样方法都可以以以应用在文本的特性项获得中。

1.4  词意相近度计算

依据特性项获得,文本早就被变换为房间内室内空间室内空间空间向量说明,文本的词意相近度计算也就被变换便于室内空间空间向量正中间的相近度考量。一般室内空间空间向量计算相近度有下列方法:室内空间空间向量内积、欧氏间隔、夹角余弦和毫无疑问值间隔等[11]。

2  手机上手机微信交税综合性综合服务平台

在互联网技术性性极大发展趋势发展趋势的阶段状况下,开发设计设计方案依据立即通信手机上手机软件的交税综合性综合服务平台是适应很多人运用习惯性性、合乎信息内容內容阶段发展趋势发展趋势规范下税款服务信息内容內容化、智能化发展要求的一项工作中中。原文中确立明确提出的依据自然语言处理的手机上手机微信交税综合性综合服务平台的重要功效是提供税款企业与交税个人行为行为主体正中间的税款服务信息内容內容互动交流方法,以人力资源智能化化技术性性具体指导交税人对必须税款服务信息内容內容的智能化化模糊不清不排查找,提供税款业务流程步骤描述、申请办理申请办理流程、现行标准现行政策依据、申请办理申请办理限期、申请原材料、申请办理申请办理详尽详细地址等信息内容內容的自助式式问答,挑选其困惑,也可以为未来针对性信息消息推送缴税提醒、相关法律法规政策法规现行政策政策法规升級、税款信息内容內容查询等服务信息内容內容提供方法和依据,充裕应用互联网+的服务方法优势,使交税人能更方便快捷、方便快捷、高效率率地得到税款服务信息内容內容。

原文中确立明确提出的依据手机上手机微信消费者端的交税综合性综合服务平台的系统软件手机软件管理方法管理体系结构如图所示所显示2所显示信息。顾客提交给交税综合性综合服务平台的信息内容将会最开始传输到腾讯互联网网络服务器,再共享至交税综合性综合服务平台的互联网网络服务器,在互联网网络服务器接纳到乞求后,将进行信息内容文档文件格式的剖析,根据顾客信息内容内容和设定的互联网网络服务器逻辑性性,计算务必返回的信息内容,再封裝历经手机上手机微信后台管理管理方法共享至顾客的手机上手机微信移动app,在我国交税指南Web互联网网络服务器、陕西省省省税款互联网网络服务器作为目前互联网网络服务器,可以为手机上手机微信智能化化交税综合性综合服务平台互联网网络服务器提供Web服务。

交税综合性综合服务平台进行智能化化模糊不清不排查找时的技术性性方案计划方案如图所示所显示3所显示信息,重要由手机上手机微信交税综合性综合服务平台网页页面、文本获得操纵控制模块、文本特性项获得操纵控制模块、数据信息信息内容库、词意相近度计算操纵控制模块和数据信息库数据库索引操纵控制模块组成。

在特性项获得操纵控制模块,手机上手机微信交税综合性综合服务平台运用One?Hot序号进行特性项的获得,将文本变换为计算特性可以了解调解决的二进制序号;而在词意相近度计算操纵控制模块,手机上手机微信交税综合性综合服务平台运用夹角余弦法计算室内空间空间向量的相近度。

对于室内空间空间向量[x=(x1,x2,…,xn)],[y=(y1,y2,…,yn)],相近度[Sim(x,y)]的计算公式计算测算下列[3,12]:

[Sim(x,y)=i=1nxi?yii=1nx2i?i=1ny2i]

数据信息库数据库索引操纵控制模块的重要功效就是对计算得到的词意相近度值进行顺接排序,将在这其中相近度值较大的三项作为搜索结果顺序输出,若相近度值高过设置的阈值0.8,看作精确搜索,将唯一输出此项搜索结果,而当相近度值低于所设阈值0.1时,则看作搜索不了功。手机上手机微信交税综合性综合服务平台的搜索结果呈现如图所示所显示4所显示信息。

当今电子器件器件技术性性的别的文章内容內容

内容版权声明:除非注明,否则皆为本站原创文章。

转载注明出处:http://zxzztp.cn/ganhuo/4243.html