足球比分直播

基于转导推理思想的一致性预测器.pdf

返回
基于转导推理思想的一致性预测器.pdf_第1页
第1页 / 共78页
基于转导推理思想的一致性预测器.pdf_第2页
第2页 / 共78页
基于转导推理思想的一致性预测器.pdf_第3页
第3页 / 共78页
基于转导推理思想的一致性预测器.pdf_第4页
第4页 / 共78页
基于转导推理思想的一致性预测器.pdf_第5页
第5页 / 共78页
点击查看更多>>
资源描述:
谨以此论文献给所有关心和帮助过我的人一王莉基于转导推理思想的一致性预测器学位论文完成日期指导教师签字答辩委员会成员签字㈣必28㈥1 64帆\Y1 9独创 声 明本人声明所呈交的学位论文是本人在导师指导下进行的研究工作及取得的研究成果。据我所知,除了文中特别加以标注和致谢的地方外,论文中不包含其他人已经发表或撰写过的研究成果, 也不包含未获得≤洼;翅逡查墓丝噩噩缱型重踢的奎拦亘窒≥或其他教育机构的学位或证书使用过的材料。与我一同工作的同志对本研究所做的任何贡献均已在论文中作了明确的说明并表示谢意。学位论文作者签名王莉 签字日期卫。J}年5,9 zg EI学位论文版权使用授权书本学位论文作者完全了解学校有关保留、使用学位论文的规定,有权保留并向国家有关部门或机构送交论文的复印件和磁盘,允许论文被查阅和借阅。本人授权学校可以将学位论文的全部或部分内容编入有关数据库进行检索,可以采用影印、缩印或扫描等复制手段保存、汇编学位论文。同时授权中国科学技术信息研究所将本学位论文收录到中国学位论文全文数据库,并通过网络向社会公众提供信息服务。保密的学位论文在解密后适用本授权书学位论文作者签名王莉签字日期2口j J年歹月z形El基于转导推理思想的一致性预测器捅 妥当前存在的一些机器学习分类算法多是建立在归纳、演绎逻辑推理的方法基础之上,面对一批数据总是试图从中提取一个适用的通用分类模型,并期望此分类模型有较高的预测性能;但是这种分类模式在高风险、小样本领域却有一定的局限性首先基于数量有限的小样本数据,用于归纳一个通用规则的训练样本数据较少,造成分类模型的准确度较低,而且忽略了测试集样本的信息,从而不能充分利用所有样本数据信息;其次分类预测结果通常只是简单的将样本划分为某一类,对样本多大程度上属于这一类没有一个量的概念,且预测结果没有置信度衡量,在高风险领域的应用尚有不足。本文对基于转导推理的一致性预测算法的研究就是针对此局限性而展开的。转导推理是基于整个样本所拥有的全部信息直接进行分类识别的原则方法,分类过程中不需归纳分类模型,而是通过探索待测数据和样本序列之间的内在联系而进行推理判别;算法是通过Kolmogorov算法随机性理论建立一种置信度机制,通过随机性检测函数对置信度进行估算,且随机性检测函数的结果就是预测结果的可信度,同时在置信度控制下其算法预测结果是域的形式。一致性预测算法的核心部分是非一致性度量函数的设计,设计非一致性度量函数可以融合现有分类算法进行。本文首先对k近邻一致性预测算法和支持向量机一致性预测算法进行研究,并在k近邻一致性预测算法的基础上进行改进,提出用测地线距离来代替欧式距离度量样本间相似性;然后基于逻辑回归模型实现了基于Logistic回归的一致性预测算法;本文所有算法都是基于MatlabR2007b平台实现,并基于多种标准数据集和实际应用领域的烟草行业数据进行仿真实验,同时和Weka平台下的一些分类算法的分类预测率进行比对分析,来验证一致性预测算法的性能。本文最后对研究工作进行了总结,并指出了今后进一步的研究方向。关键词一致性预测器;转导推理;算法随机性理论;非一致性度量;测地线距离;Logi stic回归IICona I Pred i ctor Based on Transduct i onAbstractSome classification algorithm in machine learning are based on induction anddeduction,when facing to a batch of data,they are always trying to extract a generalclassification model for those data,and expect the classification model has higherprediction perance;But in high-risk and small sample fields,this classificationmodel have some limitationsfirstly,because of the limitation of the number of smallsaiilpie data,this classification model not only didn’t have enough data used forextract a general role,but also Call not make full use of all the ination of sampledata;Secondly the results of classification prediction are just simple to us,and theresults have no confidence or believability to measure.In this paper the research and application of conal predictor based on缸.,msduction is aimed at this defect to launch.Transductive inference is directly toclassify and recognize f.or me data sets with the whole sample ination,and itdoesn·t need to build classification model in the process of classification,its target isto explore the inner relation between tested sample data and sample sequence;Theconal predictor build a confidence mechanism through the Kolmogorovalgorithrn randomness theory,and use the detect function of randomness whoseresults are the reliability of prediction,to measure the confidence,and the ofresults predicted by algorithm under the control of confidence are domain.The mainly part of conal predictor is to design the function ofnonconity measure,which Can be integrated classification algorithm in traditionalmachine learning.In this paper,firstly the conal prediction algorithm based onk-nearest neighbor and support vector machine are discussed,and the conalprediction algorithm based on k-nearest neighbor is improved,through using geodesicdistance to replace Euclidean distance to measure the similarity between samples;Then the conal prediction algorithm based on logistic regression model can beachieved;All algorithms in this paper are progranuned on the plat ofMatlabR2007b,and be used to the data sets from UCI and tobacco industry,andI¨through the comparison of accuracy rate predicted by conal prediction algorithmand other algorithm used usually to test the perance of conal predictionalgorithm.In the end,the thesis summarizes the research and indicates the future work.KeywordsConal Predictor,Transduetion,Algorithm Randomness Theory,Nonconity Measure,Geodesic Distance,Logistic RegressionIV
展开阅读全文
收藏
下载资源

加入会员免费下载





足球比分直播