• 忻州 端午节假期旅游收入达59962万元--黄河新闻网 2019-07-22
  • 人民日报为人民,70年办报不容易,办报人付出了心血和汗水,记录了中国的发展过程,祝愿办得越来越好! 2019-07-20
  • 最美逆行!高速隧道突发火灾  交警三次逆行穿火线撤离400多名群众 2019-07-17
  • 《陕西省县域经济社会发展监测考评办法》解读 2019-07-17
  • 一切都是老板炒工人的鱿鱼 2019-07-14
  • 赏花不用跑远 宗角禄康开得正艳 2019-07-14
  • 车俊会见毛里求斯代总统 2019-07-14
  • 除了杨崇勇,“2亿元贪官俱乐部”至少还有这些人 2019-07-09
  • [民生热线]咸安西大街烤鸭店每天油烟扰民 区政府:已责令整改 2019-07-09
  • 海淀:得天独厚的自然条件 2019-07-09
  • 进京通行证限次数!70.9万辆本地化使用外埠号牌车或将受影响 2019-07-06
  • 6月14日凤凰直通车:茅台再开市场化招聘大门,32个部门要285人葡萄 种植 2019-07-05
  • 东京湾产业转型启示录 2019-07-05
  • 中国三星获第十二届人民企业社会责任奖年度扶贫奖 2019-06-30
  • 一个语文基础都没有的人就喜欢指手画脚, 2019-06-30
    • / 6
    • 下载费用:20 金币  

    广西11选5奖池: 基于查询扩展的有限数据源数据获取方法.pdf

    摘要
    申请专利号:

    广西11选5大小走势图 www.fnjpv.tw CN201510437403.7

    申请日:

    2015.07.23

    公开号:

    CN105005620A

    公开日:

    2015.10.28

    当前法律状态:

    授权

    有效性:

    有权

    法律详情: 授权|||实质审查的生效IPC(主分类):G06F 17/30申请日:20150723|||公开
    IPC分类号: G06F17/30 主分类号: G06F17/30
    申请人: 武汉大学
    发明人: 陆伟; 乐兴虎; 程齐凯
    地址: 430072湖北省武汉市武昌区珞珈山武汉大学
    优先权:
    专利代理机构: 武汉科皓知识产权代理事务所(特殊普通合伙)42222 代理人: 张火春
    PDF完整版下载: PDF下载
    法律状态
    申请(专利)号:

    CN201510437403.7

    授权公告号:

    ||||||

    法律状态公告日:

    2018.04.20|||2015.11.25|||2015.10.28

    法律状态类型:

    授权|||实质审查的生效|||公开

    摘要

    本发明公开了一种基于查询扩展的有限数据源数据获取方法,本发明通过查询扩展技术执行多次查询以获取尽可能多的记录,可以有效地避开返回记录数的限制;以最少的查询次数穷尽此类数据源中的相关文档,本发明通过多次查询直至穷尽有限数据源中所有相关文档;本发明将该方法应用与实际的信息检索中,能以较少的查询扩展次数从有限数据源中获取所有相关的数据。

    权利要求书

    权利要求书
    1.  一种基于查询扩展的有限数据源数据获取方法,其特征在于,包含以下步骤:
    步骤1,用初始查询表达式Q在总文档数为N的有限数据源中检索,获取前n篇文档S,构成初始查询的结果集R,对前n篇文档S进行正文提取、分词和词性标注,对所有词进行词性过滤,从所有词中选取概念词集C,按公式(1)计算概念词集C中每个概念词ci与查询词wi之间的共现度,根据概念词ci与查询词wi之间的共现度f(c,Q),对所有概念词进行逆向排序,选取前k个概念词作为扩展词集;
    f(c,Q)=Πwi∈Q(λ+co_degree(c,wi))idf(wi)]]>     公式(1)
    其中,共现度计算公式中idf(wi)为查询词wi的逆文档频率,λ为常量;co_degree(c,wi)为每个查询词wi与概念C之间的贡献数,概念C与初始查询表达式Q之间的共现度为概念C与初始查询表达式Q所有的查询词wi的共现数的成积和;idf(wi)为查询词wi逆文档频率,Sum(d)为有限数据源中的文档中数,dwi为有限数据源中包含词wi的文档总数,idf(wi)词语普遍重要性的度量;
    步骤2,根据扩展词集构造查询表达式,查询表达式为S+ti,然后进行k次查询得到k个查询结果集;
    步骤3,判断k次查询累积返回的不重复文档总数是否超过总文档数N,如果未达到,则按照步骤1从每个初始查询的结果集R中选取m个扩展词,进行第二层查询扩展,此时总共查询k×m次,此时的查询表达式为S+tii;其间,如果累积返回的文档总数超过总数N,则停止;
    步骤4,按照步骤2和步骤3迭代进行查询扩展,直到累计返回的文档总数等于总数N;此累计返回的文档总数N指不重复的文档数。

    2.  根据权利要求书1所述基于查询扩展的搜索引擎数据获取方法,其特征在于:在步骤2中,共现度计算公式中λ默认为1。

    关 键 词:
    基于 查询 扩展 有限 数据源 数据 获取 方法
      专利查询网所有资源均是用户自行上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作他用。
    0条评论

    还可以输入200字符

    暂无评论,赶快抢占沙发吧。

    关于本文
    本文标题:基于查询扩展的有限数据源数据获取方法.pdf
    链接地址://www.fnjpv.tw/p-6376025.html
    关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服客服 - 联系我们

    [email protected] 2017-2018 www.fnjpv.tw网站版权所有
    经营许可证编号:粤ICP备17046363号-1 
     


    收起
    展开
  • 忻州 端午节假期旅游收入达59962万元--黄河新闻网 2019-07-22
  • 人民日报为人民,70年办报不容易,办报人付出了心血和汗水,记录了中国的发展过程,祝愿办得越来越好! 2019-07-20
  • 最美逆行!高速隧道突发火灾  交警三次逆行穿火线撤离400多名群众 2019-07-17
  • 《陕西省县域经济社会发展监测考评办法》解读 2019-07-17
  • 一切都是老板炒工人的鱿鱼 2019-07-14
  • 赏花不用跑远 宗角禄康开得正艳 2019-07-14
  • 车俊会见毛里求斯代总统 2019-07-14
  • 除了杨崇勇,“2亿元贪官俱乐部”至少还有这些人 2019-07-09
  • [民生热线]咸安西大街烤鸭店每天油烟扰民 区政府:已责令整改 2019-07-09
  • 海淀:得天独厚的自然条件 2019-07-09
  • 进京通行证限次数!70.9万辆本地化使用外埠号牌车或将受影响 2019-07-06
  • 6月14日凤凰直通车:茅台再开市场化招聘大门,32个部门要285人葡萄 种植 2019-07-05
  • 东京湾产业转型启示录 2019-07-05
  • 中国三星获第十二届人民企业社会责任奖年度扶贫奖 2019-06-30
  • 一个语文基础都没有的人就喜欢指手画脚, 2019-06-30
  • 湖北快三跨度表 摩纳哥足球 漂亮猫咪投注 吉林快3开奖遗漏数据 最新码报结果 澳洲幸运10开奖app 搞笑斑马官网 十一运夺金开奖现场 南昌麻将晒月亮规则 富勒姆vs诺维奇