面向高分辨率遥感图像分类的小样本增强方法探讨

论文价格:150元/篇 论文用途:硕士毕业论文 Master Thesis 编辑:硕博论文网 点击次数:
论文字数:52144 论文编号:sb2022022111033843698 日期:2022-02-24 来源:硕博论文网
本文是一篇计算机论文,本文基于 ENVI,eC ognition,ArcGis 等遥感图像处理软件手动选取极少的初始训练样本,提出一种以初始样本为中心构造自适应区域,探索初始样本周围潜在可利用的样本。由自适应区域构造的原理可知,自适应区域可以巧妙地避开噪声像素,以初始样本为中心像素构造自适应区域,自适应区域内的像素作为候选训练样本其标签准确率是可靠的。其次自适应区域内的像素根据均值漂移理论逐渐修正中心训练样本的位置,为避免选择到地物边界模糊像元。

1  绪论

1.1  研究背景及意义
探索浩瀚的宇宙是人类数百年来美好的愿望,但由于科学技术的限制,上个世纪前人类对茫茫的太空一无所知。自 1957 年世界第一颗人造卫星“伴侣 1 号”发射以来[1],人类迈出了认识太空,勘探地球的第一步。此后,遥感技术得到世界各国的迅速关注,遥感领域的飞速发展开启了人们认识地球的“新视角”。遥感,顾名思义指的是通过远距离的感知来获取地表覆盖信息。从拍摄角度来讲主要分为航空遥感和航天遥感,航空遥感指的是航空飞机或无人机等平台通过搭载相机设备,对地表进行拍摄成像。航天遥感即指的是通过发射卫星到太空周期性地对地进行监测。据美国 UCS 统计(截至 2020.11.01),全球在轨卫星数量 3300 颗,其中美国拥有在轨卫星 1850 颗,位居世界第一。我国大约有 400 颗,俄罗斯在轨卫星大约 200 颗,其他国家约 850 颗。中国是航天领域的后起之秀,50 年来在我国科学家不断的探索和努力下,我国航天事业打破了 70 年代 0 颗卫星的沉寂,上升到了约 400 颗卫星,航天事业成为我国国防力量和资源利用的重要保障。直至 2020 年,我国长达 20 年的北斗卫星导航系统工程全面建成[2-4],开始为全球用户提供全天候,全天时,高精度的定位服务[5-8] 。
目前国内外在轨的高分卫星主要包括:由美国发射的WorldView系列高分卫星,法国的Pleiades系列卫星,以及俄罗斯的Resurs-DK卫星。近年来,我国的航天事业也进入了跨时代的发展,我国的高分卫星基本可以达到自给自足的状态。高分系列卫星的发射标志着我国卫星空间分辨力进入亚米级时代,如2014年发射的GF-2卫星可提供空间分辨率为0.8米的全色波段,光谱分辨率为3.2米的高空间分辨率遥感图像。国内外常见高分卫星及其参数如表一和表二所示。
卫星按照功能用途可以分为军事卫星,资源卫星、通讯卫星、气象卫星、导航卫星等。不同卫星的发射目的在于解决不同的实际问题,在军事,民用,资源勘探等方面等发挥着不可替代的作用。随着传感器技术的更新,成像技术的提高,卫星可搭载多个传感器,多种成像模式,因此海量的遥感图像具有传输速率快,多角度拍摄,存储数据容量大,回访周期速度快等特点。通过对遥感图像的高精度解译不仅能够为地籍调查、精准农业、城市发展规划、海洋生态保护、灾害检测提供实时监测;也可以为科技工作者,政策制定者提供重要的科学依据和指导作用。目前遥感图像已成功应用于雷达监测[9-11]、目标检测[12-14]、灾害评估[15-18] 和土地覆盖分类制图[19-22] 等实际应用。为人类解决实际问题,资源利用,预防灾害等提供了重要的实际意义。
................................

1.2  国内外研究现状
高分遥感图像的精确解译是人类及时获取地表覆盖信息,认识地球、造福人类的重要前提。然而,对于监督分类来说训练样本的选择是高分图像监督分类另一个重要前提,足够量的训练样本通过学习才可以提供一个识别率准确稳健的分类模型。通常训练样本的选择是需要耗费大量的时间和经济成本,因此训练样本的收集是目前高分遥感图像监督分类面临的一个重大挑战,如何获取大量的、可靠的、有价值的,丰富的训练样本是一个值得深入研究的重大科学问题。国内外学者针对高分遥感图像训练样本标记少的问题展开了一系列研究,主要分为基于空间尺度,基于主动学习,基于深度学习等三类。
1.2.1 基于空间尺度的样本增强方法
遥感图像空间分辨率的提高使得地物目标纹理结构更加清晰,空间信息更加丰富,从而为大幅度提高高分图像解译精度提供了一定的潜力。为充分利用高分图像丰富的空间信息来增强训练样本,国内外学者给出了大量的方案。如通过建立简单的单一规则尺度探索地物像素之间的邻域关系:Richards 等利用有限的标记样本,以每个标记训练样本为中心像素通过建立简单的规则窗口模型来搜索其邻域像素[34],度量其和中心像素的空间距离和光谱相似性来确定候选样本从而增强训练样本。Edoardo Pasolli 等引入空间域上的 Parzen 窗口方法[35],将空间和光谱信息相结合,训练样本的选择准则只考虑与最近的支持向量机相关的像素值,从而改进样本采集的过程。此外,高分图像由于受定位设备、拍摄设备、人工因素等会引入错误标签训练样本。然而错误标记的训练样本会对分类器造成极大的干扰,导致分类模型变差,尤其是在训练样本极小的时候。因此,Tu等提出一种基于局部窗口考虑每个训练样本周围的邻域样本,利用其空间上下文信息,使用所有样本度量其相关系数,通过 DP 聚类算法计算每个训练样本的局部密度,最后通过决策函数去除异常标签样本来提纯训练样本[36]。Kang[37]等使用约束能量最小化(Constrained Energy Minimization)对训练样本集进行目标检测,根据平均概率检测标签异常的训练样本并纠正,从而达到增强样本的目的。
............................

2  基于自适应邻域的小样本增强方法研究

2.1  方法动机
针对高分图像标记样本数量有限,噪声像元增多的现实问题,本章提出了一种基于自适应区域邻域的训练样本增强方法。所提出的方法有两个目的:(1)基于极少的初始训练样本,求解自适应区域,挖掘其邻域中潜在的候选样本增强初始训练样本。(2)优化训练样本的地理位置,避免在样本增强的过程中引入噪声像元和地物边界混合像元。图 2-2展示了该方法的整体流程,下面展开详细的叙述:
计算机论文参考
计算机论文参考
............................

2.2  自适应邻域求解机制
高分遥感图像通常包含着诸多尺度大小不同的地理场景,为了充分挖掘不同地物目标空间信息,Lv 等提出了一种自适应邻域获取遥感图像的空间邻域信息[62],其可以适应不同场景地物目标的大小、形状。然而,目前通过固定规则窗口、多尺度分割,数学建模等多种方式获取像素的空间邻域信息等主要目的是为了提取空间特征来增强地物的表征能力。本文则使用自适应区域的邻域信息获取未知像素的类别信息,增强初始训练样本,从而提高图像解译精度。下面具体给出自适应区域的求解过程:
首先以像素????????????为中心像素,寻找其八邻域像素????????????????,根据△ d = ‖????????????????− ????????????‖计算邻域像素与中心像素的光谱差异值,其中????????????????是中心像素????????????的八邻域像素,△ d值越小表示邻域像素与中心像素的光谱差异越小,那么将该像素扩展为自适应区域内像素。若  △ d >????1,或者自适应区域内的像素个数???? ≥ ????2,那么自适应区域搜索结束。图 2-1 展示了一个自适应区域的构造过程,自适应区域求解机制是本研究的基础性研究内容,后面不再赘述。
计算机论文怎么写
计算机论文怎么写
.............................

3  顾及高分图像类内异质性的小样本增强方法研究 .............................. 27
3.1  方法动机 ........................................ 27
3.2  相关技术理论 ................................... 27
4  动态平衡土地覆盖分类精度方法研究 .......................... 39
4.1  方法动机 ..................................... 39
4.2  像素级-动态增强样本以平衡土地分类精度方法研究 ............................ 39
5  小样本下自适应多尺度特征增强的分类方法研究 ..................................... 61
5.1  方法动机 ........................................ 61
5.2  自适应多尺度特征提取 ...................................... 61

6  高分辨率遥感图像应用实例

6.1  研究区域
研究区域一选自江苏苏州国家高新技术产业开发区,苏州高新区是首批入选国家级高新区,我国典型的江南水乡。地理位置位于我国江苏省苏州市区西部,  其东依靠历史悠久的苏州古城,西邻浩瀚无际的太湖。典型的亚热带季风气候,气候宜人,风景秀丽,一个无数游客向往的风水宝地。该图像由 Quickbird 卫星获取,全色光谱分辨率为 0.61-0.72米,多光谱分辨率为 2.44-2.88 米,空间分辨率 2.44 米。图像包含近红外,红,绿,蓝四个光谱波段。实验中我们分别选择了城市区域,乡村区域等两个地理覆盖范围最广泛的区域作为本章研究对象。
研究区域二选自江西上饶市,其位于我国江西省东部,北纬27°48′~29°42′,东经116°43′~118°29′,全市东西宽 210 千米,南北长 194 千米,占地面积 22791 平方千米,其中陆地面积主要为丘陵,平原,山地。该地区名山众多,吸引了无数的文人墨客。此外该地区气候为亚热带季风性湿润气候,气候适宜,曾经被评为“中国最具幸福感城市”。实验中选用江西上饶市一个经典的农村区域为研究对象,该图像由无人机拍摄获取。
为方便描述本章中分别将研究对象苏州高新区的城市区域和乡村区域定义为 Data-A,Data-B,江西上饶市的农村区域定义为 Data-C,详细描述如下:
Data-A:该区域为我国经典的城区建筑风格,分别包含 Building  ,Road,River,Farmarland  ,Trees 等地物。其中 Building 像素数量覆盖范围多达 70%以上。5 个地物场景涵盖了2520 × 1260个像素。图 6-1 为 Data-A 的真实图像和地面参考真值及图例。
Data-B:图 6-2 展示了 Data-B 的真实的俯视图和地面参考真图。从图中可以看出该区域为我国典型的农村建设风格,包含 5 种有趣的地物场景,分别为 Building,Road,River,Farmarland,Trees。5 种经典的地理场景包含2621 × 1512个像素,其中农田覆盖面积高达 80%以上。
.........................

7  总结与展望

7.1  全文工作总结
本文的工作主要分为以下几点:
针对高分图像监督分类标记样本有限,噪声像元增加,对训练样本的标记造成一定的干扰。本文基于 ENVI,eC ognition,ArcGis 等遥感图像处理软件手动选取极少的初始训练样本,提出一种以初始样本为中心构造自适应区域,探索初始样本周围潜在可利用的样本。由自适应区域构造的原理可知,自适应区域可以巧妙地避开噪声像素,以初始样本为中心像素构造自适应区域,自适应区域内的像素作为候选训练样本其标签准确率是可靠的。其次自适应区域内的像素根据均值漂移理论逐渐修正中心训练样本的位置,为避免选择到地物边界模糊像元。最后以修正后样本为中心求自适应区域挖掘可利用的训练样本。实验结果表明该方法可以自动挖掘初始训练样本周围的潜在可利用的训练样本,从而提升高分图像解译精度。
针对高分图像类内异质性差异大特点。本文提出一种顾及图像类内异质性的样本增强方法。首先基于极少的初始训练样本通过监督分类器获取初始分类图,其次根据直方图分布特征构造不同灰度级下的像元旨在覆盖类内光谱差异性,双窗口动态搜索置信度高的样本所在的地理区域,最后使用箱线图技术检测并去除异常像元,选择位于箱线图中最大值,最小值,四分位上的像素点作为新挖掘的代表性样本。实验结果表明该方法可以有效增强初始训练样本的数量,顾及地物类内异质性,丰富训练样本的多样性。在三个真实的高分遥感数据上证明了所提出方法的有效性,定量结果表明整体精度,平均精度显著提升,尤其是平均精度提升明显,背后原因是所提出方法丰富了同类地物的样本多样性。
针对高分遥感图像数据量自身分布不平衡特点。不平衡的训练集将导致分类模型发生倾向性现象,致使分类模型性能欠优。鉴于此问题,本文基于像素和对象两个角度,提出了两种动态调整训练样本以平衡用户精度的方案。实验结果表明,本文所提出的样本增强方法,不仅可以有效增强训练样本的数量和多样性,而且可以有效的平衡用户精度,克服训练样本不平衡造成分类中某些地物类别精度降低现象。特别地,为了评估所提出方法的性能,引入了类别用户精度偏差指标(SDUA),通过实验结果表明所提出算法在显著提升分类精度的同时平衡用户精度。
参考文献(略)

QQ 1429724474 电话 18964107217