专利名称:搜索引擎的中文搜索词自动纠错方法专利类型:发明专利发明人:高翔
申请号:CN201610361654.6申请日:20160526公开号:CN106095778A公开日:20161109
摘要:本发明涉及搜索引擎的中文搜索词自动纠错方法,属于计算机应用技术领域。本发明包括数据模块、离线建库端及在线检索端,数据模块的主要作用是为后面的离线建库端和在线检索端提供数据。本发明使用搜索日志,爬虫系统等模块挖掘丰富的离线数据,用于多种纠错策略使用。针对不同的领域,使用专有领域词典用于系统纠错。本发明使用多种独立纠错策略相结合的方式,面对复杂的query错误,多种策略相互补充相互比较,最终取得较好的结果。加上二次纠错的使用,使得纠错范围更加广泛,成功率更高。本发明纠错策略可灵活独立配置,纠错场景更加广泛,能更好适应各种不同的垂直搜索领域。
申请人:达而观信息科技(上海)有限公司
地址:200000 上海市浦东新区浦东张江祖冲之路2305号1208室
国籍:CN
代理机构:北京卓唐知识产权代理有限公司
代理人:龚洁
更多信息请下载全文后查看
因篇幅问题不能全部显示,请点此查看更多更全内容