010-82060331
新浪微博 微信

核心产品与技术

销售咨询
  • 华北
  • 电话:010-82060331
  • QQ:549874349
  • 手机:13693250844
  • 联系人:刘先生

世软科技舆情监测系统核心技术

世软科技软件在舆情领域有多年的研发经验,具备业内领先的技术,核心技术包括全文检索技术、语义分析技术、机器学习技术、自动分类技术等。

全文检索

全文检索是对海量文本数据进行检索的重要而基础的技术手段。全文检索技术是世软科技软件挟多年积累的中文信息处理的技术精华,以多年信息检索经验为基础,融合最新的人工智能、信息检索、数据挖掘的研究成果,用以帮助用户解决海量信息的智能检索。具备字词混合索引模型,分段索引技术,扩展布尔检索等特点。

语义分析

世软科技软件研发出一套先进的中文自然语言处理引擎(包括:中文智能分词、语义分析算法、自动化学习机制,对海量的、非结构化的信息进行搜集、抽取、归类、索引,从海量数据中为用户自动提供精准匹配出的用户需求内容。语义分析具有独创的高精度中文智能分词技术,基于词汇化概率模型的语义分析技术,基于自学习机制的统计系统。

机器学习

世软科技软件研发出拥有自主知识产权的具备机器学习能力的情感训练系统。通过系统自动判断的舆情的准确度可以达到60-70%,通过情感训练后准确度可以达到80%以上,对系统训练越多,准确度就越高。世软科技软件最早服务的部分客户系统自动判断的准确度可以达到95%以上。

自动分类

自动分类技术将基于学习的自动分类与基于规则的自动分类有机地结合起来。在基于学习的自动分类方面采用文档向量空间模型与分类算法的概率统计模型。世软科技软件的自动分类技术具有领先的速度与准确性。可实现对新闻、论坛、博客等内容的自动分类,大大减少手工劳动的工作量,提高处理的准确性。

文本挖掘

文本挖掘技术可挖掘文本的特征信息,包括关键词(高频词)提取、术语(词组、短语)提取、基于模板的信息抽取、基于语义词典的概念转换、基于浅层句法分析的语法特征提取、基于浅层语义分析的语义特征提取、基于文本分类的文本类别信息获取等操作。 Cleaning)、数据转换(Data Transform)、数据整合和数据筛选等数据准备工作。

话题追踪

话题追踪是指在信息来源中追踪那些与目标话题相关的信息。话题追踪技术采用了最新的国际研究成果,引入新的特征抽取算法,是结合我们在中文信息处理方面的优势而实现的核心技术,它对中英文文章均具有很好实用性能。实际应用系统中,可实现对互联网热点事件的快速识别与追踪、辅助进行专题报道、关联资料整理等。

联系方式:总部:010-82060331    
北京世软科技有限责任公司/专业舆情监测解决方案提供商
京ICP备11032150号-1  京公网安备11032150号-1

友情链接

网站设计来源于网络资源,如有版权冲突及时联系