• 人民日报为人民,70年办报不容易,办报人付出了心血和汗水,记录了中国的发展过程,祝愿办得越来越好! 2019-07-20
  • 最美逆行!高速隧道突发火灾  交警三次逆行穿火线撤离400多名群众 2019-07-17
  • 《陕西省县域经济社会发展监测考评办法》解读 2019-07-17
  • 一切都是老板炒工人的鱿鱼 2019-07-14
  • 赏花不用跑远 宗角禄康开得正艳 2019-07-14
  • 车俊会见毛里求斯代总统 2019-07-14
  • 除了杨崇勇,“2亿元贪官俱乐部”至少还有这些人 2019-07-09
  • [民生热线]咸安西大街烤鸭店每天油烟扰民 区政府:已责令整改 2019-07-09
  • 海淀:得天独厚的自然条件 2019-07-09
  • 进京通行证限次数!70.9万辆本地化使用外埠号牌车或将受影响 2019-07-06
  • 6月14日凤凰直通车:茅台再开市场化招聘大门,32个部门要285人葡萄 种植 2019-07-05
  • 东京湾产业转型启示录 2019-07-05
  • 中国三星获第十二届人民企业社会责任奖年度扶贫奖 2019-06-30
  • 一个语文基础都没有的人就喜欢指手画脚, 2019-06-30
  • 匹夫有责之一百一十二—道义大义的博客—强国博客—人民网 2019-06-25
    • / 19
    • 下载费用:20 金币  

    体彩广西11选5最高奖金: 一种挖掘核心用户的方法及装置.pdf

    摘要
    申请专利号:

    广西11选5大小走势图 www.fnjpv.tw CN201510002653.8

    申请日:

    2015.01.05

    公开号:

    CN105824813A

    公开日:

    2016.08.03

    当前法律状态:

    授权

    有效性:

    有权

    法律详情: 授权|||实质审查的生效IPC(主分类):G06F 17/30申请日:20150105|||公开
    IPC分类号: G06F17/30 主分类号: G06F17/30
    申请人: 中国移动通信集团江苏有限公司
    发明人: 戴洁; 郑建兵; 顾强; 陈宇阳
    地址: 210029 江苏省南京市虎踞路59号
    优先权:
    专利代理机构: 北京同达信恒知识产权代理有限公司 11291 代理人: 郭润湘
    PDF完整版下载: PDF下载
    法律状态
    申请(专利)号:

    CN201510002653.8

    授权公告号:

    ||||||

    法律状态公告日:

    2018.12.07|||2016.08.31|||2016.08.03

    法律状态类型:

    授权|||实质审查的生效|||公开

    摘要

    本发明涉及数据处理领域,特别是涉及一种挖掘核心用户的方法及装置,能够有效地识别需要消息的用户,避免了大量信息浪费,该方法为:获取用户历史操作数据,分别针对每一个用户筛选出在设定历史时段内与相应用户关联度最高的N个其他用户;分别针对每一个用户,从其对应的N个其他用户中筛选出业务属性特征符合预设关联条件的其他用户,以及将每一个用户和对应的筛选后的其他用户组成关联用户组;分别在每一个关联用户组中,挑选出被叫等级最高的用户作为所在关联用户组的核心用户,因此极大地提高了信息发送的针对性。

    权利要求书

    1.一种挖掘核心用户的方法,其特征在于,包括:
    获取用户历史操作数据,分别针对每一个用户筛选出在设定历史时段内与
    相应用户关联度最高的N个其他用户;
    分别针对每一个用户,从其对应的N个其他用户中筛选出业务属性特征符
    合预设关联条件的其他用户,以及将每一个用户和对应的筛选后的其他用户组
    成关联用户组;
    分别在每一个关联用户组中,挑选出被叫等级最高的用户作为所在关联用
    户组的核心用户。
    2.如权利要求1所述的方法,其特征在于,获取用户历史操作数据,分
    别针对一个用户筛选出在设定历史时段内与所述一个用户关联度最高的N位
    其他用户,包括:
    获取用户历史操作数据,分别针对一个用户筛选出在设定历史时段内与所
    述一个用户通话时间最长的N位其他用户,或者,筛选出与所述一个用户通话
    次数最多的N位其他用户,或者,筛选出与所述一个用户之间使用指定业务次
    数最多的N位其他用户。
    3.如权利要求1或2所述的方法,其特征在于,在获取用户历史操作数
    据之前,进一步包括:
    在预处理阶段,确定若干测试用户,以及获取所述若干测试用户对应的海
    量数据样本,其中,所述若干测试用户中设定比例的用户之间的关联关系符合
    指定需求,且一个数据样本中记录有一个测试用户的基本信息或测试用户之间
    的至少一次业务行为;
    将所述海量数据样本按照关联关系整合划分为训练集合和验证集合;
    基于所述训练集合包含的数据样本,提取出测试用户的业务属性特征,以
    及确定各个业务属性特征在满足测试用户之间的关联关系的前提下所需满足
    的关联条件;
    采用所述验证集合包含的数据样本,对关联条件进行验证,确定验证通过
    后,对所述关联条件进行加载配置。
    4.如权利要求3所述的方法,其特征在于,基于所述训练集合包含的数
    据样本,提取出测试用户的业务属性特征,以及确定所述各个业务务属性特征
    在满足测试用户之间的关联关系的前提下所需满足的关联条件,包括:
    基于所述训练集合包含的数据样本对预设的M个业务属性特征进行检测,
    筛选出非显著业务属性特征,并删除所述非显著业务属性特征,其中,非显著
    业务属性特征包含有满足所述关联关系的至少两种取值,且所述至少两种取值
    的占比差达到设定阈值;
    基于所述训练集合包含的数据样本在剩余的业务属性特征中进一步筛选
    出符合预设的特征选择标准的业务属性特征;
    采用决策树算法筛选出P个业务属性特征作为测试用户的业务属性特征,
    将所述P个业务属性特征满足关联关系的取值设置为所述关联条件。
    5.如权利要求1或2所述的方法,其特征在于,针对任意一个用户,从
    其对应的N个其他用户中筛选出业务属性特征符合预设关联条件的其他用户,
    以及将所述任意一个用户和对应的筛选后的其他用户组成关联用户组,具体包
    括:
    针对任意一个用户,从其对应的N个其他用户中筛选出至少一个业务属性
    特征符合至少一条预设的关联条件的其他用户,以及将所述任意一个用户和对
    应的筛选后的其他用户组成关联用户组。
    6.如权利要求1或2所述的方法,其特征在于,在任意一关联用户组中,
    挑选出被叫等级最高的用户作为所在关联用户组的核心用户,具体包括:
    在所述任意一关联用户组中,采用网页排名PageRank算法计算每一个用
    户在设定时长内的被呼叫等级,所述被呼叫等级表征呼叫用户的不同用户的数
    目,将被叫等级最高的用户确定为所述任意一关联用户组中的核心用户。
    7.如权利要求1所述的方法,其特征在于,进一步包括:
    将预设的推送消息发送给各个核心用户。
    8.一种挖掘核心用户的装置,其特征在于,包括:
    获取单元,用于获取用户历史操作数据,分别针对每一个用户筛选出在设
    定历史时段内与相应用户关联度最高的N个其他用户;
    筛选单元,用于分别针对每一个用户,从其对应的N个其他用户中筛选出
    业务属性特征符合预设关联条件的其他用户,以及将每一个用户和对应的筛选
    后的其他用户组成关联用户组;
    确定单元,用于分别在每一个关联用户组中,挑选出被叫等级最高的用户
    作为所在关联用户组的核心用户。
    9.如权利要求8所述的装置,其特征在于,获取用户历史操作数据,分
    别针对一个用户筛选出在设定历史时段内与所述一个用户关联度最高的N位
    其他用户,所述获取单元具体用于:
    获取用户历史操作数据,分别针对一个用户筛选出在设定历史时段内与所
    述一个用户通话时间最长的N位其他用户,或者,筛选出与所述一个用户通话
    次数最多的N位其他用户,或者,筛选出与所述一个用户之间使用指定业务次
    数最多的N位其他用户。
    10.如权利要求8或9所述的装置,其特征在于,进一步包括:
    预处理单元,在获取用户历史操作数据之前,用于在预处理阶段,确定若
    干测试用户,以及获取所述若干测试用户对应的海量数据样本,其中,所述若
    干测试用户中设定比例的用户之间的关联关系符合指定需求,且一个数据样本
    中记录有一个测试用户的基本信息或测试用户之间的至少一次业务行为;
    将所述海量数据样本划分为训练集合和验证集合;
    基于所述训练集合包含的数据样本,提取出测试用户的业务属性特征,以
    及确定各个业务属性特征在满足测试用户之间的关联关系的前提下所需满足
    的关联条件;
    采用所述验证集合包含的数据样本,对关联条件进行验证,确定验证通过
    后,对所述关联条件进行加载配置。
    11.如权利要求10所述的装置,其特征在于,基于所述训练集合包含的
    数据样本,提取出测试用户的业务属性特征,以及确定所述各个业务务属性特
    征在满足测试用户之间的关联关系的前提下所需满足的关联条件,所述预处理
    单元具体用于:
    基于所述训练集合包含的数据样本对预设的M个业务属性特征进行检测,
    筛选出非显著业务属性特征,并删除所述非显著业务属性特征,其中,非显著
    业务属性特征包含有满足所述关联关系的至少两种取值,且所述至少两种取值
    的占比差达到设定阈值;
    基于所述训练集合包含的数据样本在剩余的业务属性特征中进一步筛选
    出符合预设的特征选择标准的业务属性特征;
    采用决策树算法筛选出P个业务属性特征作为测试用户的业务属性特征,
    将所述P个业务属性特征满足关联关系的取值设置为所述关联条件。
    12.如权利要求8或9所述的装置,其特征在于,针对任意一个用户,从
    其对应的N个其他用户中筛选出业务属性特征符合预设关联条件的其他用户,
    以及将所述任意一个用户和对应的筛选后的其他用户组成关联用户组,所述筛
    选单元具体用于:
    针对任意一个用户,从其对应的N个其他用户中筛选出至少一个业务属性
    特征符合至少一条预设的关联条件的其他用户,以及将所述任意一个用户和对
    应的筛选后的其他用户组成关联用户组。
    13.如权利要求8或9所述的装置,其特征在于,在任意一关联用户组中,
    挑选出被叫等级最高的用户作为所在关联用户组的核心用户,所述确定单元具
    体用于:
    在所述任意一关联用户组中,采用PageRank算法计算每一个用户在设定
    时长内的被呼叫等级,所述被呼叫等级表征呼叫用户的不同用户的数目,将被
    叫等级最高的用户确定为所述任意一关联用户组中的核心用户。
    14.如权利要求8所述的装置,其特征在于,进一步包括:
    发送单元,用于将预设的推送消息发送给各个核心用户。

    关 键 词:
    一种 挖掘 核心 用户 方法 装置
      专利查询网所有资源均是用户自行上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作他用。
    0条评论

    还可以输入200字符

    暂无评论,赶快抢占沙发吧。

    关于本文
    本文标题:一种挖掘核心用户的方法及装置.pdf
    链接地址://www.fnjpv.tw/p-6299433.html
    关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服客服 - 联系我们

    [email protected] 2017-2018 www.fnjpv.tw网站版权所有
    经营许可证编号:粤ICP备17046363号-1 
     


    收起
    展开
  • 人民日报为人民,70年办报不容易,办报人付出了心血和汗水,记录了中国的发展过程,祝愿办得越来越好! 2019-07-20
  • 最美逆行!高速隧道突发火灾  交警三次逆行穿火线撤离400多名群众 2019-07-17
  • 《陕西省县域经济社会发展监测考评办法》解读 2019-07-17
  • 一切都是老板炒工人的鱿鱼 2019-07-14
  • 赏花不用跑远 宗角禄康开得正艳 2019-07-14
  • 车俊会见毛里求斯代总统 2019-07-14
  • 除了杨崇勇,“2亿元贪官俱乐部”至少还有这些人 2019-07-09
  • [民生热线]咸安西大街烤鸭店每天油烟扰民 区政府:已责令整改 2019-07-09
  • 海淀:得天独厚的自然条件 2019-07-09
  • 进京通行证限次数!70.9万辆本地化使用外埠号牌车或将受影响 2019-07-06
  • 6月14日凤凰直通车:茅台再开市场化招聘大门,32个部门要285人葡萄 种植 2019-07-05
  • 东京湾产业转型启示录 2019-07-05
  • 中国三星获第十二届人民企业社会责任奖年度扶贫奖 2019-06-30
  • 一个语文基础都没有的人就喜欢指手画脚, 2019-06-30
  • 匹夫有责之一百一十二—道义大义的博客—强国博客—人民网 2019-06-25
  • pc蛋蛋不翻倍挂机模式 巴拉多利德西班牙城市 全部手机吃鸡游戏大全 图卢兹四月天气 女皇之心援彩金 财富发发电子 狼队vs布莱顿 比利亚雷亚尔皇家社会 权杖女王游戏 北京11选5玩法