NLPIR汉语分词实现自动智能挖掘语义信息-巴西华人网

当前位置：首页信息商业服务正文

信息未审核或下架中，当前页面为预览效果，仅管理员可见

微信扫一扫分享

虚假信息违法信息联系方式无效分类错误

顶NLPIR汉语分词实现自动智能挖掘语义信息

ljrj123 于 2019/04/24 11:36:34 更新信息编号：201904247 1798 次浏览

上一个下一个

不限区域 -
位置
个人
属性
商业服务
类别

小技巧：联系说来自巴西华人网将会获得更好的效果

张先生

IP属地：未知

加我微信

微信号：

查看电话

电话号码：

扫码打电话

电话接通率：96%

打开手机扫一扫

本信息已过期，联系方式已隐藏

免责声明

本平台仅作为同城便民信息发布和查询平台，没有能力去审核保障每条信息和发布人的真实性、有效性、以及交易的安全性，不提供任何形式的担保，不对任何产生的纠纷承担连带责任。您若发现信息含有任何不实可向本平台举报，我们将进行删除处理。如遇到法律纠纷请及时向公安机关、工商部门报警处理，感谢您的支持理解。

NLPIR汉语分词实现自动智能挖掘语义信息

信息内容

全部评论

张先生于 2019/04/24 11:36:34 更新

扫码打电话电话接通率：96%

打开手机扫一扫

加我微信

微信号：

查看电话

电话号码：

本信息已过期，联系方式已隐藏

信息内容

随着信息时代的到来，可供人们查阅和检索的中文信息越来越多，如何在浩如烟海的中文信息世界里找到自己需要的资料成为一个越来越重要需要研究的课题。在当今时代，要处理迅猛增长的信息，手工处理已经变得不太现实。因此出现了自动化出来方法，自动化处理方法帮助人们检索、管理信息，来解决现在社会信息丰富而知识贫乏的现状。目前已经出现了很多自动化的工具诸如自动摘要、自动文件检索等语言处理技术，在这些技术内的一个核心关键是主题词，对于主题词的提取有助于简化此类工作，而如何找到主题词是需要中文分词技术的。此外中文分词也是搜索引擎，翻译等技术的基础。

中文分词，顾名思义，就是借助计算机自动给中文断句，使其能够正确表达所要表达的意思。中文不同于西文，没有空格这个分隔符，同时在中文中充满了大量的同义词，相近词，如何给中文断句是个非常复杂的问题，即使是手工操作也会出现问题。中文分词是信息提取、信息检索、机器翻译、文本分类、自动文摘、语音识别、文本语音转换、自然语言理解等中文信息处理领域的基础研究课题。对于中文分词的研究对于这些方面的发展有着至关重要的作用。可以这样说，只要是与中文理解相关的领域，都是需要用到中文分词技术的。因此对于中文分词技术的研究，对于我国计算机的发展有着至关重要的作用。

北京理工大学大数据搜索与挖掘实验室张华平主任研发的NLPIR大数据语义智能分析技术是满足大数据挖掘对语法、词法和语义的综合应用。NLPIR大数据语义智能分析平台是根据中文数据挖掘的综合需求,融合了网络精准采集、自然语言理解、文本挖掘和语义搜索的研究成果,并针对互联网内容处理的全技术链条的共享开发平台。

NLPIR大数据语义智能分析平台十三大功能：

精准采集：对境内外互联网海量信息实时精准采集，有主题采集(按照信息需求的主题采集)与站点采集两种模式(给定网址列表的站内定点采集功能)。

文档转化：对doc、excel、pdf与ppt等多种主流文档格式，进行文本信息转化，效率达到大数据处理的要求。

新词发现：从文本中挖掘出新词、新概念，用户可以用于专业词典的编撰，还可以进一步编辑标注，导入分词词典中，提高分词系统的准确度，并适应新的语言变化。

批量分词：对原始语料进行分词，自动识别人名地名机构名等未登录词，新词标注以及词性标注。并可在分析过程中，导入用户定义的词典。

语言统计：针对切分标注结果，系统可以自动地进行一元词频统计、二元词语转移概率统计。针对常用的术语，会自动给出相应的英文解释。

文本聚类：能够从大规模数据中自动分析出热点事件，并提供事件话题的关键特征描述。同时适用于长文本和短信、微博等短文本的热点分析。

文本分类：根据规则或训练的方法对大量文本进行分类，可用于新闻分类、简历分类、邮件分类、办公文档分类、区域分类等诸多方面。

摘要实体：对单篇或多篇文章，自动提炼出内容摘要，抽取人名、地名、机构名、时间及主题关键词;方便用户快速浏览文本内容。

智能过滤：对文本内容的语义智能过滤审查，内置国内最全词库，智能识别多种变种：形变、音变、繁简等多种变形，语义精准排歧。

情感分析：针对事先指定的分析对象，系统自动分析海量文档的情感倾向：情感极性及情感值测量，并在原文中给出正负面的得分和句子样例。

文档去重：快速准确地判断文件集合或数据库中是否存在相同或相似内容的记录，同时找出所有的重复记录。