• 忻州 端午节假期旅游收入达59962万元--黄河新闻网 2019-07-22
  • 人民日报为人民,70年办报不容易,办报人付出了心血和汗水,记录了中国的发展过程,祝愿办得越来越好! 2019-07-20
  • 最美逆行!高速隧道突发火灾  交警三次逆行穿火线撤离400多名群众 2019-07-17
  • 《陕西省县域经济社会发展监测考评办法》解读 2019-07-17
  • 一切都是老板炒工人的鱿鱼 2019-07-14
  • 赏花不用跑远 宗角禄康开得正艳 2019-07-14
  • 车俊会见毛里求斯代总统 2019-07-14
  • 除了杨崇勇,“2亿元贪官俱乐部”至少还有这些人 2019-07-09
  • [民生热线]咸安西大街烤鸭店每天油烟扰民 区政府:已责令整改 2019-07-09
  • 海淀:得天独厚的自然条件 2019-07-09
  • 进京通行证限次数!70.9万辆本地化使用外埠号牌车或将受影响 2019-07-06
  • 6月14日凤凰直通车:茅台再开市场化招聘大门,32个部门要285人葡萄 种植 2019-07-05
  • 东京湾产业转型启示录 2019-07-05
  • 中国三星获第十二届人民企业社会责任奖年度扶贫奖 2019-06-30
  • 一个语文基础都没有的人就喜欢指手画脚, 2019-06-30
    • / 18
    • 下载费用:20 金币  

    广西11选5中拖但: 基于问答网站知识的软件配置故障自动修复方法和系统.pdf

    摘要
    申请专利号:

    广西11选5大小走势图 www.fnjpv.tw CN201610202074.2

    申请日:

    2016.04.01

    公开号:

    CN105824718A

    公开日:

    2016.08.03

    当前法律状态:

    授权

    有效性:

    有权

    法律详情: 授权|||实质审查的生效IPC(主分类):G06F 11/07申请日:20160401|||公开
    IPC分类号: G06F11/07; G06F11/30; G06F17/30 主分类号: G06F11/07
    申请人: 北京大学
    发明人: 李影; 贾统; 岳阳; 吴中海
    地址: 100871 北京市海淀区颐和园路5号
    优先权:
    专利代理机构: 北京万象新悦知识产权代理事务所(普通合伙) 11360 代理人: 张肖琪
    PDF完整版下载: PDF下载
    法律状态
    申请(专利)号:

    CN201610202074.2

    授权公告号:

    ||||||

    法律状态公告日:

    2018.10.19|||2016.08.31|||2016.08.03

    法律状态类型:

    授权|||实质审查的生效|||公开

    摘要

    本发明公布了一种基于问答网站知识的软件配置故障自动检测与修复的方法和系统,包括在线阶段和离线阶段;离线阶段对问答网站数据进行爬取,得到问题网站中的问题和答案;记录问题和答案的对应关系,建立问题日志库;将提取得到的修复方法和指令存入修复指令仓库;在线阶段收集用户系统数据,包括用户系统运行日志和用户系统文件目录;通过计算用户系统运行日志和问题日志的相似度定位用户系统故障,通过搜索修复指令仓库得到相应修复指令,生成相应的故障修复脚本。本发明可实现对基于开源软件构建的云计算系统进行软件配置故障诊断与修复,提高云计算系统的可靠性和可用性。

    权利要求书

    1.一种基于问答网站知识的软件配置故障自动修复方法,包括在线阶段和离线阶段;
    离线阶段对问答网站数据进行爬取,提取得到问题网站中的问题和答案;问题包括问题
    日志数据,答案包括修复方法和指令;记录问题和答案的对应关系,建立问题日志库;将提
    取得到的修复方法和指令存入修复指令仓库;
    在线阶段收集用户系统数据,用户系统数据包括用户系统运行日志和用户系统文件目录;
    通过计算用户系统运行日志和问题日志的相似度,定位用户系统故障,通过搜索修复指令仓
    库得到相应修复指令,生成相应的故障修复脚本;根据故障修复脚本实现修复用户系统故障。
    2.如权利要求1所述基于问答网站知识的软件配置故障自动修复方法,其特征是,所述
    离线阶段具体执行如下步骤:
    21)对问答网站数据进行爬取,提取得到问答网站中的问题和答案,具体是:首先通过
    过滤问答网站数据得到与故障配置相关的可用问题页面,再从所述可用问题页面中提取得到
    故障包含的问题日志数据和对应的答案数据;
    21a)每一个问题包括一条或多条问题日志信息,针对步骤21)得到的问题日志数据进
    行过滤清洗,提取问题日志特征生成问题日志特征向量,获得问题与问题日志特征向量的对
    应关系,将问题、问题日志特征向量和对应关系存储,生成问题日志库;
    21b)针对步骤21)得到的答案数据,通过文本分析提取答案数据中的指令和文件操作,
    具体是:对答案数据进行切分,对切分成的每一部分进行归类并标注相应标签,所述标签类
    型分别是:描述,文件路径,命令,配置,日志和代码;所述切分是使用解决方案和文件路
    径作为分隔符,将答案数据划分为多个部分,每个部分被标注为上述标签类型中的一种类型;
    由此将所述答案数据转换为标签的有序组合;
    21b1)针对步骤22)转换后得到的答案内容,设置三种修复模式:第一种修复模式为{文
    件路径,配置};第二种修复模式为{文件路径,配置,配置};第三种修复模式为{命令,配
    置};
    21b2)利用修复模式匹配算法将问题修复方法从答案数据中提取出来,每个答案数据提
    取得到一个或多个问题修复方法;针对提取得到的问题修复方法设置操作类型;针对提取出
    的每个问题修复方法确定相应的操作类型;由此,将每个答案数据转换成为由设置操作类型
    的一个或多个问题修复方法组成的一个修复指令;将修复指令存入修复指令仓库,供修复用
    户系统配置故障使用。
    3.如权利要求2所述基于问答网站知识的软件配置故障自动修复方法,其特征是,步骤
    21)所述通过过滤问答网站数据得到与故障配置相关的可用问题页面,所述问答网站数据为
    爬虫收集到的HTML页面;通过过滤具有以下特征的页面,得到与故障配置相关的可用问题
    页面:
    2a)无回答的页面;
    2b)未含有解决方案的页面;解决方案指问题回答中的代码片段,包括程序代码、可执
    行命令、文件路径配置文件内容,包括html文件中<code></code>标签包含的内容;
    2c)未含有文件路径的页面;
    2d)未含有配置内容的页面,所述配置内容为xml格式。
    4.如权利要求2所述基于问答网站知识的软件配置故障自动修复方法,其特征是,步骤
    21a)所述提取问题日志特征生成问题日志特征向量,具体通过基于文本挖掘的特征提取方法,
    包括如下步骤:
    首先,针对每一条日志以标点符号为分隔符,分离出若干日志文本词汇;
    然后,删除所有标点符号,获取由若干词汇组成词汇序列;
    之后,将词汇大小写归一化生成问题日志文本特征向量,其形式表征为{word1,word2,
    word3,…,wordn},其中,wordi(i=1..n)表征由标点符号作为分隔符的将整个日志拆分成的一
    个字符串;
    最后,将日志数据和日志文本特征向量存储,生成问题日志库。
    5.如权利要求2所述基于问答网站知识的软件配置故障自动修复方法,其特征是,步骤
    21b2)所述具体执行如下操作:
    首先,仿照情感词典建立操作词典,操作词典中收录了答案信息中的描述中出现的各种
    修改操作词语作为关键词,并将这些关键词映射到上述的三种修改类型,如果描述中不存在
    关键词,则默认为增加操作;
    然后,对描述中的每个关键词的权重通过式1进行计算得到:
    weight(keyword)=1/edistance(keyword,FilePath)(式1)
    式1中,keyword为关键词;FilePath为问题页面包含的相关答案中的标注为文件路径的
    部分内容;distance(keyword,FilePath)为标注为描述部分的关键词到标注为文件路径内容
    的文本距离;weight(keyword)为关键词keyword的权重;
    之后,根据计算出的各个关键词的权重,利用式2投票的方式得到修复类型:
    weight(OperationTypei)=∑weight(keywordj)(式2)
    OperationTypei∈{add,delete,update}(式3)
    式2~3中,keyword为关键词;OperationType为操作类型,add为增加操作,delete为删
    除操作,update为更新操作;weight(OperationTypei)为相应操作类型的权重,该权重的值
    表示当前问题页面中相关答案的含义建议提问者使用该操作类型的可能性;keywordj为映射
    到该修复操作的关键词;
    最后,取权重最大的作为修复操作中的操作类型,由此生成一个修复操作,表示为式5:
    Operationi={OperationType,RecoveryFilePath,ConfContent}(式5)
    所述一个修复操作由三项信息组成,分别为操作类型、提取修复模式识别算法生成的修
    复方法中的文件路径、配置;
    最终,一系列修复操作组成修复指令,所述修复指令用式4表示:
    EditScript={Operation1,Operation2,…,Operationn}(式4)
    式4~式5中,EditScript为修复指令;Operation为修复操作;OperationType为操作类型;
    RecoveryFilePath为需修复的文件的文件路径;ConfContent为配置内容;
    将修复指令存入修复指令仓库,作为提取的原始指令信息。
    6.如权利要求1所述基于问答网站知识的软件配置故障自动修复方法,其特征是,所述
    在线阶段具体执行如下步骤:
    11)当有用户系统日志输入时,获取用户系统文件目录信息和用户系统运行日志,分别
    转换为目录特定格式和系统日志特定格式;
    12)对用户系统运行日志进行预处理,提取得到用户系统日志的特征向量;
    13)当系统出现故障或者用户提交故障片段日志时,通过查询所述问题日志库索引获取
    问答网站日志数据和问题日志文本特征向量,通过计算得到用户日志与问答网站问题日志之
    间的相似度,通过相似度匹配的方法定位用户系统的配置故障,获得用户故障定位信息;
    14)根据用户故障定位信息,从所述修复指令仓库中提取得到修复该故障的修复指令,
    所述修复指令中的动态部分是从用户的系统文件目录信息提取得到的文件路径;
    15)根据步骤14)得到的修复指令包含的待修复配置文件,查找得到用户系统中相应的
    配置文件,生成修复脚本,所述修复脚本是能够对用户系统中的配置文件进行修改的可执行
    脚本;
    16)运行修复脚本,修复软件配置故障。
    7.如权利要求6所述基于问答网站知识的软件配置故障自动修复方法,其特征是,步骤
    11)所述系统日志特定格式包括五个属性,分别为:用户ID、日志ID、日志内容、日志时间
    戳、日志文件路径;所述用户ID用于表示日志所属用户;日志ID表示日志序列,用以建立
    索引,查询等;日志时间戳记录当前日志的系统时间,用以表征用户日志集的时间序列特征;
    日志文件路径保存当前日志来源;所述目录特定格式包括三个属性,分别为:目录ID、上级
    目录、当前目录;所述目录ID用于标识每个目录;上级目录表示该目录的上级目录名称;当
    前目录为当前目录名称。
    8.如权利要求6所述基于问答网站知识的软件配置故障自动修复方法,其特征是,步骤
    13)所述用户日志与问答网站问题日志之间的相似度,具体为采用相似度匹配方法计算得到
    的用户日志与问答网站日志之间的编辑距离;所述编辑距离为两文本之间相互转换的最小编
    辑操作数目;所述编辑操作类型分为:增加、删除、替换;所述相似度匹配方法通过比对用
    户系统日志与问答网站日志库中的编辑距离,将日志片段定位到一个或多个问答网站中的问
    题,由此得到用户故障定位信息。
    9.如权利要求6所述基于问答网站知识的软件配置故障自动修复方法,其特征是,步骤
    15)具体使用linuxshell语法生成所述问题修复脚本;步骤15)所述查找得到用户系统中相
    应的配置文件,具体执行如下操作:
    首先,定义文件名的相似度函数similar(file1,file2),该相似度函数以一个范围为0到1
    的数字表示file1和file2文件名的相似度;
    然后,将用户目录结构数据以树结构存储,从根目录开始逐层遍历每层的所有文件名,
    每次遍历都选出与所述修复指令中的文件名相似度最高的文件作为候选文件;
    如果当前目录下的候选文件相比上一层的候选文件更相似,则该文件为候选文件,否则
    候选文件不变;
    最后,遍历到无下级目录时停止,将此时的候选文件作为需要修复的文件。
    10.利用权利要求1~9所述基于问答网站知识的软件配置故障自动修复方法实现的基于
    问答网站知识的软件配置故障自动修复系统,其特征是,所述软件配置故障自动修复系统以
    问答网站数据和用户系统数据作为输入,包括双线数据收集???、在线日志分析与故障定位
    ??楹凸收闲薷唇疟旧赡??;
    所述双线数据收集??榘ㄎ蚀鹜臼菔占骱陀没低呈菔占髁礁鲎幽??,用
    于收集问答网站和用户系统日志的数据,为另两个??樘峁┦葜С?;所述问答网站数据收
    集器用于从问答网站上收集配置故障问题相关的日志数据及答案数据,所述用户日志收集器
    用于从用户系统中收集用户日志数据;所述用户日志数据和问题的日志数据传递给在线日志
    分析与故障定位???,所述答案数据传递给故障修复脚本生成???;
    所述在线日志分析与故障定位??榘ㄈ罩驹ご砥骱陀没Ч收先罩径ㄎ黄髁礁鲎幽??,
    用于对获取的日志数据进行预处理,并将用户故障匹配到一个或几个问答网站的问题上;所
    述日志预处理器以问答网站的问题日志数据和用户系统日志数据作为输入,对日志数据进行
    预处理;经过预处理后,用户故障日志定位器通过相似度匹配的方法计算用户日志和问答网
    站问题日志间的距离,将用户日志中的故障问题匹配到问答网站的问题,并将结果传递给所
    述故障修复脚本生成???;
    所述故障修复脚本生成??榘薷粗噶钐崛∑?、修复指令仓库和修复脚本生成器子模
    块,用于自动生成用于修复用户配置故障的脚本;所述修复指令提取器以问答网站答案数据
    为输入,通过分析网站答案数据,将答案中的指令或文件操作提取出来,作为该问题的解决
    方案;所述修复脚本生成器根据用户故障定位结果,提取相应问题的解决方案,并根据用户
    系统文件目录,生成该问题的修复脚本;最后将脚本提供给用户用于解决用户系统的软件配
    置故障。

    关 键 词:
    基于 问答 网站 知识 软件 配置 故障 自动 修复 方法 系统
      专利查询网所有资源均是用户自行上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作他用。
    0条评论

    还可以输入200字符

    暂无评论,赶快抢占沙发吧。

    关于本文
    本文标题:基于问答网站知识的软件配置故障自动修复方法和系统.pdf
    链接地址://www.fnjpv.tw/p-6299413.html
    关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服客服 - 联系我们

    [email protected] 2017-2018 www.fnjpv.tw网站版权所有
    经营许可证编号:粤ICP备17046363号-1 
     


    收起
    展开
  • 忻州 端午节假期旅游收入达59962万元--黄河新闻网 2019-07-22
  • 人民日报为人民,70年办报不容易,办报人付出了心血和汗水,记录了中国的发展过程,祝愿办得越来越好! 2019-07-20
  • 最美逆行!高速隧道突发火灾  交警三次逆行穿火线撤离400多名群众 2019-07-17
  • 《陕西省县域经济社会发展监测考评办法》解读 2019-07-17
  • 一切都是老板炒工人的鱿鱼 2019-07-14
  • 赏花不用跑远 宗角禄康开得正艳 2019-07-14
  • 车俊会见毛里求斯代总统 2019-07-14
  • 除了杨崇勇,“2亿元贪官俱乐部”至少还有这些人 2019-07-09
  • [民生热线]咸安西大街烤鸭店每天油烟扰民 区政府:已责令整改 2019-07-09
  • 海淀:得天独厚的自然条件 2019-07-09
  • 进京通行证限次数!70.9万辆本地化使用外埠号牌车或将受影响 2019-07-06
  • 6月14日凤凰直通车:茅台再开市场化招聘大门,32个部门要285人葡萄 种植 2019-07-05
  • 东京湾产业转型启示录 2019-07-05
  • 中国三星获第十二届人民企业社会责任奖年度扶贫奖 2019-06-30
  • 一个语文基础都没有的人就喜欢指手画脚, 2019-06-30
  • 绝地求生年兽模式 河北快三销售平台 山寨手机捕鱼大师 内蒙古时时彩app 内蒙古11选5前三组 斗牛在线客服 棒球英豪国语版 梦幻西游电子 中艺竞技麻将 比基尼派对