足球比分直播

基于GPU的高真实感集群渲染系统.pdf

返回
基于GPU的高真实感集群渲染系统.pdf_第1页
第1页 / 共64页
基于GPU的高真实感集群渲染系统.pdf_第2页
第2页 / 共64页
基于GPU的高真实感集群渲染系统.pdf_第3页
第3页 / 共64页
基于GPU的高真实感集群渲染系统.pdf_第4页
第4页 / 共64页
基于GPU的高真实感集群渲染系统.pdf_第5页
第5页 / 共64页
点击查看更多>>
资源描述:
浙江大学硕士学位论文 Abs打actAbstractWiⅡIⅡIe f瓠t deVelopment of computcr蛐d伊aphic tcchnology,gfaphics rcrIdcringteclIlIologies盯e widcly used iII 3d gimulation,Virtllal reality etc,protcction 0f cultIIralrclics.SofhⅣa佗锄d h甜dwa托tccllIIology of graphics updatc eVery day,h伽峨,%siIIgle Pc c锄putcr stin c锄10t舶rd higlI rcalistic real-time r%d“ng of highcomplex scenc.Tll】rce嬲pects about parallel r姐d砸ng b嬲ed on clustcr arc discussedilI order to imp咖Ive rcaltinle pcrfb皿弛ce as bel嘶rFi埽t,me fr锄铡旧出of rcal-tilne ray乜陷ciIIg b嬲ed on GPU clustcr is prcsented觚d implem%ted.It e伍ci%tly坯plorcs nIe p盯allel powcr of G】PU锄d impr0Ves mea伍ci姐cies 0f rcal·time proccssing 0f huge dada,Ⅵ,hich rcduccs ⅡIe‰1e ofr‘痢.mg.Scc叩d, iII ordcr t0 resolvc load imbal锄cc p重|obI锄of common son-fi礴t础itectIIrc,a dyn锄ic load bal觚ce s缸ategy using f BT is proposed,which enh雅cesr姐de血g e伍ciency.Realtime image compregsi∞metIlod b懿ed傩G】U is implemcnted iIl omcr toreduce廿Ie仃ansmissi∞time锄0ng GPU clustcr,which impr0Ves nle p酬Fom粕ce 0fme whole system.At l嬲t,a high rcalistic s翎se parallel r吼Ic血g systI锄b勰ed∞GPU clustcr i8inlplementcd f研digital museum cultIlml heritage display.Clust%Ray衄aciIIg,Parallel r姐de渤g,Load bal锄cc,Sort-first浙江大学硕L学位论文目录目录摘要iAbshctii第l 章绪论研究背景.研究内容和意义.本文组织结构.章技术背景图形渲染流水线.并行渲染技术.................................1....1......................................2...............................}2.5本章小结l 5第3章基于PBT树的动态负载均衡策略163.1并行绘制和负载均衡一163.1.1负载不均衡现象一163.1.2 sortfirst架构与负载均衡一173.2负载均衡算法分类一183.2.1负载均衡问题数学定义一1 83.2.2静态负载均衡算法一l 83.2.3动态负载均衡算法一193.33.3.3.3.43.5 本章小结章集群环境下基于G1U的实时光线跟踪光线跟踪算法概述4.2相关工作一284.2.1 0penRT光线跟踪引擎一294.2.2 0ptix光线跟踪引擎294.3集群环境下基于GPU的实时光线跟踪3lI556●●●●●123212LLL第ZZ~一一一染nnn渲孙;;【;;行123并&文文mmnU绍~~~一~觚一染简眦舱渲乩.Hh群阳mm集毗∞随有123现钆乱色殂殂龙M笱¨一一¨『~~~~~~~~一~~~一~~~~~~~~~~~~一~~~~一~|{~~~;|~~一一~~~~~~~~~~~~~~~~一~一一一~一~~~~~||3;~~~介什∞~吼稍%~策托舰珂~衡T肚m~均珂n肚~载m.加n~负乩廿加~态nnn~动¨M以~的吐归托~树n酬和艮佛甜始新果Br丌.一日一圭日飓阶初更结于123验基cr5文实拍”“|;基~41第色浙江大学硕士学位论文 目录4.3.1总体设计..324.3.2节点间并行一324.3.3节点内部并行~334.4实验结果344.5本章小结..36第5章基于GPu的实时图像压缩编码..375.1集群渲染系统中的数据传输一375.2 CUDA技术..385.3 JPEG图像压缩编码技术一415.4基于GPU的实时图像编解码425.4.1颜色空间变换一425.42 DCT计算.435.4.3量化445.4.4霍夫曼编码一445.5实验结果445.6本章小结~47第6章系统设计与实现..486.1开发平台一486.1.1硬件平台一486.1.2软件平台一496.2系统架构一496.2.1管理节点设计一506.2.2渲染节点设计5l6.2.3应用节点设计一526.3同步机制一526.4实验结果..546.5本章小结一57第7章总结与展望..58参考文献60致谢....63作者简历。..64Ⅱ浙江大学硕士学位论文 图目录图目录图2.1 opeIlGL渲染管线..5图2.2 Sonfist.8图2.3 Sonmiddle.9图2.4 Soft-l嬲t.10图2.5 Equalizcr发展历程12图2.6 Equalize堪本框架13图3.1负载均衡问题..16图3.2屏幕空问划分出现几何分布不均匀现象..17图3.3静态负载均衡连续块划分..19图3.4一棵8个节点的PBT21图3.5一个宽度为12的子块第一次划分的例子23图3.6通过PBT计算C,,,25图3.7负载均衡性能比较一26图4.1光线跟踪算法一28图4.2 Opti【各个结构关系【2】一31图4.3集群环境下的并行光线跟踪一32图4.4渲染节点内部的通信机制一33图4.5光线跟踪速率对比一34图4.6光线跟踪渲染效果图一...35图4.7光线跟踪渲染效果图二一35图5.1缸d、block和吐们ad关系【31J39图5.2 cuDA内存模型3l】一40图5.3脱G压缩编码.解压缩算法框图42图5.4压缩效果图..45图5.5压缩效率对比一46图5.6压缩比对比..46图5.7不同分辨率下有无压缩时FPs对比47图6.1包含16个节点的集群系统48图6.2系统架构一49图6.3执行流程图一50图6.4同步机制一53图6.5 DirtyBits53图6.6帧率变化55图6.7渲染效果图一图中红线划分出的区块表示不同节点56图6.8渲染效果图二..57m浙汀大学硕士学位论文1.1研究背景近年来,计算机图使用计算机图形学技术产,为相关领域科学研究者提供了科学依据,另外,使用虚拟展示技术,可以减少实物展示过程中游客和其他一些客观因素对文物造成的损害。将图形学和虚拟现实技术应用于文物展示需要解决两个基本问题1真实感问题即渲染质量问题。真实感的涵义包含几何真实感、光照真实感和行为真实感j为了最大化地重现和还原历史文物,渲染出的效果必须要尽可能地接近实物模型,这需要对其中种类繁多,构造复杂的信息作出准确、完整的描述。2实时性问题即渲染速度问题。文物展示时必须要保证用户与文物展示系统交互的自然性。实时的涵义包括对运动对象位置和姿态的动态绘制和实时计算,保证画面刷新达到肉眼察觉不到闪烁的程度,并且系统对于用户的输入能够立即做出反应并同步产生相应场景以及事件的更新。为了尽可能地保存文物的细节,通过三维扫描或其他方式生成的文物模型非常复杂,对于复杂对象的渲染算法,能达到高真实感渲染效果的渲染算法往往需要消耗较长的渲染时间,无法满足实时性的要求,而另一方面,满足实时性要求的渲染算法渲染出来的图像质量却不能满足高真实感的要求,复杂对象渲染的真实感和实时性是一对矛盾。集群渲染技术在一定程度上解决了上述矛盾,但是仍然存在很多问题需要研究 一‘1集群渲染体系架构问题。集群渲染体系结构是并行渲染系统最核心的问题,它直接决定了整个系统的功能和行为方式。’ 2任务划分和负载均衡问题。负载均衡问题对于集群渲染系统的整体性能起到至关重要的作用,因为集群渲染系统中渲染过程中渲染时间最长的浙江大学硕I学位论文 第l章绪论节点直接决定了系统整体性能,所以必须要有一个好的任务划分和负载均衡策略。3网络传输问题。集群渲染系统各节点问存在大量的实时数据传输,特别, 是图像数据,当性能提高到一定程度时,图像数据传输将成为系统性能瓶颈。本文的研究是在国家教育部教育科研基础设施脚6技术升级和应用示范项目大学数字博物馆的项目背景下展开的。大学数字博物馆集群渲染系统作为其中一个子项目,它的研发目标是开发一个应用于高真实感海量文物的实时三维展示的集群渲染系统。为此,在现有实时真实感渲染相关工作的基础之上,结合本项目的应用需求,针对当前集群渲染技术存在的问题和不足,构建并实现了基于GIU的高真实感集群渲染系统。1.2研究内容和意义针对复杂文物对象的高真实感实时展示需求,本文的研究工作主要包含以下三方面1研究和设计基于sortfirst架构和GPU运算的支持实时光线跟踪。现有的一些集群渲染系统都是基于cPU的,而且只支持普通的0penGL管线渲染。基于并行渲染库EqualizerⅢ,集成了0ptix心3光线跟踪引擎,利用GPU进行并行计算,大大增强渲染的真实感。2分析和研究基于sortfirst架构集群渲染系统中普遍存在的负载均衡问题,提出一种基于PBT树的动态负载均衡策略。普通的sortfirst按屏幕空间平均划分任务的策略会导致负载不均衡现象,本文的负载均衡策略可以实时地根据场景的变化而动态调整,分利用系统资源,提高系统整体性能。3研究基于GPU的实时图像压缩编解码方法。由于各集群系统各个节点之间单位时间内大量的图像数据传输在一定程度上限制了系统的实时性,2浙江大学硕士学位论文 第l章绪论为了减少单位时间数据传输量,利用GPU对传输的图像进行实时压缩,从而提高系统性能。本文从真实感和渲染速度.卜提升复杂文物对象的实时渲染性能,在技术上解决复杂对象展示中的实时性和真实感的矛盾问题,在应用上解决文物虚拟展示领域的实时高真实感需求问题。本文的研究具有如下意义1本文的研究和应用对于文物保护具有非常深远的意义。历史文物是我们中华民族宝贵的历史文化遗产,对于研究我国整个历史发展过程具有重大作用,也可以把历史文物作为实物例证来研究人类在各个历史时期社会发展的规律。然而随着时间的迁移,保存的文物不可避免地会受到来自外界的侵蚀,比如太阳光的照射,氧化,微生物,人为的损害等等,从而导致文物褪色,变形甚至毁坏等,这些因素都给文物保护增加了难度,如今留传下来的文物越来越少。计算机图形学以及虚拟现实技术的引入给文物保护指明了另一个方向。通过计算机图形学以及虚拟现实技术,可以把文物通过三维扫描保存到计算机磁盘中,在需要时再通过三维渲染技术展示出来。集群渲染技术的应用使得实时展示和重现这些复杂文物模型成为了可能。2本文的研究对于计算机图形学、虚拟现实技术以及集群渲染技术的发展有促进作用。渲染速度的提高使得和外部的交互成为可能,并且有利于集成虚拟现实、人机交互等技术的最新研究成果。复杂对象的实时渲染技术的研究有利于促进计算机图形学真实感实时渲染技术的改进和提高,促进图形学实时渲染技术进步和发展。1.3本文组织结构本文详细分析和讨论了集群渲染系统中的关键技术问题,具体组织如下第一章对集群渲染技术产生的背景,应用领域,发展方向以及研究意义做了分析和阐述。第二章对并行技术发展现状做了研究,分析和比较了并行渲染技术以及并浙江大学硕L学位论文 第l章绪论行渲染体系三种架构sortfirst,Sortmiddle和sort一1ast的优缺点。介绍了目前几款集群渲染系统,特别分析了Equalizernl并行渲染库。第三章在分析和研究了sortfirst架构中存在的负载不均衡现象和产生这一现象的原因,比较了当前负载均衡策略的各自优缺点,提出了一种基于PBT树的动态负载均衡策略,很好地提高了系统性能。第四章介绍了光线跟踪算法,并对现有的实时光线跟踪引擎openRTbl和OptiX心1做了分析和比较。针对现有实时光线跟踪引擎存在的问题和不足,结合系统应用需求,实现了集群环境下的基于GPU的实时光线跟踪。第五章分析了集群渲染系统中存在的大量图像传输导致的性能下降问题,提出了基于GPU的实时图像压缩编码方法。各节点之间单位时间内大量的图像数据传输在一定程度上限制了系统的实时性,为了减少单位时间数据传输量,本文利用GPU对传输的图像进行实时压缩,从而提高了性能。第六章介绍了基于以上各项技术的基于GPU的高真实感集群渲染系统的实现,并对系统性能做了测试和分析。第七章对本文实现的基于GPU的高真实感集群渲染系统中运用的各项技术进行了总结,并对未来的应用扩展与技术发展趋势进行了展望。4浙江大学硕二f学位论文 第2章技术背景第2章技术背景近年来,计算机图形学技术飞速发展并在各个领域得到了广泛的运用,但是与此同时,人们对于图形渲染的高真实感和高实时性需求也日益增加,往往超出了单个图形硬件的处理能力,因此有了集群渲染技术的出现。本章介绍了图形渲染技术以及并行图形渲染技术,并分析和比较了现有集群渲染系统及各自优缺点,重点分析和研究了Equalizcr并行渲染库。2.1图形渲染流水线渲染流水线又称渲染管线,它用来描述图形数据处理过程,可以根据处理的不fi4阶段将图形处理分成多个流水阶段。工业上应用比较多的基于流水线的图像编程接口主要有oIp∞GL和Dhct3D,他们的基本流水线都很相似。图2.1展示了Op饥GL完整的流水线图2.1 openGL渲染管线该流水线主要包含以下操作顶点操作PeI.-vel.tex operations顶点操作将顶点转换为图元,一些顶点数据如空间坐标等将使用4X4的浮点矩阵进行转换。从而将三维空间坐标投影到屏幕坐标。另外,如果启用纹理映射,则可能生成纹理坐标,并进行转换。如果启用了光照功能,还将进行光照计算。浙江大学硕士学位论文 第2章技术背景图元装配Primitive缸sembly图元装配阶段的主要部分是裁剪操作,它将几何体中位于半空间之外的部分删除掉。有时会需要投影除法,使得远处的几何体看起来比近的小。接着就是视点操作和深度操作。如果剔除功能己启用,而且图元又是多边形,那么该多边形可能会因为未通过剔除测试而丢弃。该阶段最后生成完整的几何图元,包括经过变换和裁剪后的顶点以及相关颜色、深度、纹理坐标等信息。像素操作口ixeI operations该阶段对内存中的像素数组中的每个像素进行拆分,取得各个分量值。然后对拆分后的数据进行缩放、偏移和像素映射等操作。接着再对得到的结果数据进行截取,并写入纹理内存或者转向光栅化操作。光栅化RasteI.ization光栅化的作用是将几何数据和像素数据转换成片元。片元是帧缓存中的一个像素。在把顶点连接成直线或者填充多边形时,需要考虑到反走样的情况。光栅之后,每个片元的颜色和深度值得以确定。片元操作Per-Fmgment operations片元操作中,对每个片元从纹理内存中选取一个纹素应用于该片元,接着可能执行雾计算、裁剪测试、alpha测试、模板测试和深度测试等。在经过这一系列操作之后,片元最终变成像素并绘制到合适的缓存中。2.2并行渲染技术并行渲染parallel rendering,是用来改进计算机图形渲染性能的一种方法,它的基本思想是将渲染任务划分成可以并行执行的任务块,从而达到加速的目的。对于大规模复杂场景或者一些复杂的图形学算法,普通单机渲染极其缓慢,并行渲染技术就是在这些背景下应运而生的。随着近几年的发展,集群渲染技术越来越多应用到科学计算,医学可视化,文物保护以及动漫影视等领域。随着计算机图形学的发展,越来越多的图形渲染领域引入了并行渲染,比如多边形渲染,地形渲染,体渲染,光线跟踪以及辐射度算法,虽然他们的需求和应用不一样,但是总的出发点却是一致的。主要有三种并行方式功能并行FUnctional Parallelism、数据并行Data6
展开阅读全文
收藏
下载资源

加入会员免费下载





足球比分直播