专利名称:一种基于大数据的观点抽取方法专利类型:发明专利发明人:肖会
申请号:CN201510459157.5申请日:20150730公开号:CN104965823A公开日:20151007
摘要:本发明提出了一种大数据的观点抽取方法,所述方法包括:步骤S100,数据采集,基于分布式云计算方式对网络数据进行数据采集;步骤S200,数据预处理,对步骤S100采集的网络数据进行预处理,首先对采集的网络数据进行分词和词性标注处理,然后进行标点符号处理、表情字符处理和停用词处理,最后得到用于表示文本的特征项;步骤S300,话题抽取,基于预处理后的网络数据,从中抽取出话题;步骤S400,对话题的评论进行情感分析,得到话题的正向情感和负向情感,从而确定对于话题的观点。本发明采用分布式的云计算方式,能够对大规模采集的各种网络数据进行挖掘、分析。
申请人:成都鼎智汇科技有限公司
地址:610000 四川省成都市高新区天府大道中段1388号1栋7层772号
国籍:CN
代理机构:北京天奇智新知识产权代理有限公司
代理人:郭霞
更多信息请下载全文后查看
因篇幅问题不能全部显示,请点此查看更多更全内容