地理学在数据库中如何储存? (geography 在数据库中如何存储)

随着社会的发展和经济的快速发展,大量的数据信息被记录并使用。数据库技术和地理信息技术的融合也逐渐成为一种趋势。那么如何将地理学在数据库中储存?本文将会详细介绍在数据库中存储地理数据的原理,分类,规范和存在的问题。

一、地理学在数据库中储存的原理

存储地理数据涉及到两个重要的概念:空间数据和属性数据。空间数据指的是地理位置相关的数据,例如地图、卫星遥感影像等,可以用二维或三维的坐标描述。属性数据是指有关空间数据所描述的对象或现象的相关信息,例如人口、产业、标志等。

在数据库中储存地理学数据的原理是将空间数据与属性数据进行关联,并且通过一个统一的空间参考系统(SRS)来定位不同数据之间的空间关系。

二、地理学在数据库中储存的分类

根据数据类型和储存方式,地理学在数据库中储存的分类有:

1、空间数据类型

在数据中存储的空间数据类型通常是点、线、面和体结构。为了便于管理,它们可以按照它们所处的层次结构进行分组,如基础铁路线网模型、公路模型、楼房模型等等。

2、属性数据类型

属性数据可以分为定性数据和定量数据。定性数据是指包含字母、词语等特殊符号和描述的数据,在地理学应用场景中常见的有土地利用、土地覆盖类型等。定量数据则是指具有实际数值意义的数据,例如产业的经济价值、人口数量等。

3、空间索引类型

空间索引类型分为网格索引(Grid Indexing)和树形索引(Tree Indexing)。网格索引是将整个地图分成若干个网格,每个网格都有一个编号,将地图上的数据存储在这些网格里,以便于查询时快速定位到数据所在位置。树形索引则是将不同的区域划分成一个个的矩形,并将这些矩形构成一个树型结构,每个矩形对应着一些数据,通过树形结构快速定位数据位置。

三、地理学在数据库中储存的规范

地理数据存储在数据库中需要遵循一些常用的规范和标准,以确保数据的完整和一致。不同类型的数据需要遵循的规范也有区别。

1、数据模型规范

在数据模型方面,主要涉及统一的数据结构和数据存储的数据类型。常见的数据模型有关系型、面向对象和属性关系三种模型。

2、SRS标准规范

SRS标准规范是指空间参考系统的制定和使用规范,从而确保地理数据在空间上的正确位置。

3、元数据规范

灵活的数据关联机制使得在存储地理数据时,数据库内新建索引时需要对数据元信息进行记录,包括空间数据的名称、类型、座标系、属性数据的名称、类型、单位、编码等元信息。

四、地理学在数据库中储存的问题

尽管地理数据的数据库应用已经取得了很大的成功和推广,但是在实际应用中也存在一些问题和挑战。

1、数据格式的统一

由于不同地理学数据产生的时间和环境的不同,使得数据格式和内容十分的复杂,这也给数据库的设计和查询带来了困难。

2、数据的可视化呈现

地理学数据的可视化呈现既要满足科学的要求,还要满足普通人的视觉效果,如何在地理学数据的数据库中实现合理的可视化呈现也是一个重要的问题。

3、数据的高效查询

地理学数据通常在大数据集中分散,这也给大规模空间数据查询带来了很大的挑战,包括数据的选择、数据的组合、数据的查询等问题。

地理学在数据库中的储存技术能够有效地帮助人们获取和共享更加准确和丰富的地球信息,但同时也面临一些具体的问题和挑战。科学家们需要通过不断努力和实践,寻找更加有效和成熟的数据储存和查询方法,以满足地理学数据研究的要求。

相关问题拓展阅读:

地质-生态环境空间数据库建库标准

一、范围

本标准定义了山东半岛城市群地质-生态环境空间数据库的数据结构框架、数据实体及实体之间的相互关系,定义了成果图件空间数据的要素集、要素类、要素分类代码及属性数据项,可用于山东半岛城市群项目数据的采集、存储、管理、共享及数据库建设。

二、规范性引用文件

下列标准所包段基含的条文,通过在本标准中引用而构成为本标准的条文。本标准出版时,所示版本均为有效。所有标准都会被修订,使用本标准的各方应探讨使用下列标准最新版本的可能性。

GB / T 1. 1—2023 标准化工作导则 第 1 部分: 标准的握族谨结构和编写规则

GB / T 13923—92 国土基础信息数据分类代码

GB / T 2260—1999 中华人民共和国行政区划代码

GB / T 2659 世界各国和地区名称代码

GB / T 9649—88 地质矿产术语分类代码

DZ / T 0160—95 1∶地质图地理底图编绘规范及图式

DZ / T 0197—1997 数字化地质图图层及属性文件格式

GB 958—99 区域地质图图例 ( 1∶ 50000)

DZ / T 0179—1997 地质图用色标准及用色原则

DDB 9702 GIS 图层描述数据内容标准

GB 17108—1997 海洋功能区划技术导则

中国地质调查局 地质图空间数据库建设工作指南 ( 2. 0 版)

中国地质调查局 1∶ 20 万区域水文地质图空间数据库图层及属性文件格式工作指南

三、术语和定义

本标准涉及的主要术语如下:

1. 地理信息数据库 ( geodatabase)

采用标准关系数据库技术来管理、表现地理信息的空间数据库。

2. 数据包 ( data package)

逻辑相关数据实体的,本标准中将山东半岛城市群项目数据整体视作一个数据包。

3. 数据实体 ( data entity)

描述专业领域同一类型数据的数据元素的,如地质构造数据实体,概念上等同于UML 的类。数据实体可通过一个或多个相关的数据元素及相关的数据实体定义。

4. 数据集 ( dataset)

逻辑相关数据组成的数据,如一幅地图可视作一个数据集,数据集是一个逻辑上的整体。

5. 数据子集 ( subdataset)

按一定规则划分的数据集中逻辑相关数据的,本标准中的一个数据子集对应一个地图要素类,数据子集类别对应地图上的图层划分。

6. 空间数据 ( spatial data)

用来表示空间实体的位置、形状、大小和分布特征诸方面信息的数据。空间数据不仅具有实体本身的空间位置及形态信息,而且还有实体属性和空间关系 ( 如拓扑关系)信息。

7. 空间参照系 ( spatial reference)

对地理信息数据的空间范围和投影的描述。

8. 地图 ( map)

地理信息的图形描述,包括地理信息数据和地图元素,如标题、图例和比例尺等。本标准中将一幅地图视作一个数据集进行管理,并通过一组要素集 ( 要素类、关系类、属性表的) 、空间参照系、地图样式定义地图的数据内容及显示方式。

9. 图层 ( layer)

地图上特定区域范围内按一定规则划分的相似要素类的,如水系、城镇。图层为要素类的专题组合及表现,一个图层定义了它包含地理信息数据的地理位置和显示方法。

10. 要素 ( feature)

现实世界中的对象在地图图层中的表示,如地图中表示道路的一条线。

……

四、缩略语和符号

1. 缩略语

ARD 图外整饰要素 ( Elements Around Map)

BMAP 地理底图 ( Basemap)

BOU 境界、边界 ( Bourn)

CD 代码 ( Code)

COL 综合柱状图 ( Colomnar Chart)

DT 日期 ( Date)

ELE 地形高程 ( Elevation)

……

2. UML 类图穗派符号

山东半岛城市群地区地质-生态环境与可持续发展研究

3. ER 图符号

山东半岛城市群地区地质-生态环境与可持续发展研究

五、基于 UML 的 Geodatabase 的空间数据模型

构建地质数据的空间数据模型是建立地质信息数据库的一项关键工作,是数据库建设的基础。Geodatabase 数据模型作为 ArcGIS 软件平台的一种通用数据形式,目前已被国内外众多地质空间数据库的建设所采用。数据建模也已经成为地质数据库建立的一项主要内容。

目前针对地质、水文、矿产、海洋等多个领域的专业 Geodatabase 数据模型都已存在,国内目前应用于区域地质 - 生态环境调查的综合地质 - 生态环境空间数据模型还比较少见。因此,本项目在分析国内外目前比较通用的各专业数据模型的基础上,提出了专门面向山东半岛城市群地质 - 生态环境空间数据库建设的 Geodatabase 数据模型。

在 Geodatabase 数据模型中,允许定义要素之间类型的关联,Geodatabase 对空间数据管理以关系数据库为基础,利用商用关系数据库成熟的数据处理能力对空间数据和非空间数据进行统一管理。Geodatabase 使用面向对象的方法,使得要素可以具有自己的行为和属性,并且要素类具有继承性、多态性和封装性。这样,以更加适合自然的行为和人的思维方式去组织数据,更精确地模拟真实世界。

1. Geodatabase 数据模型的结构体系

Geodatabase 数据模型作为一种新型的面向对象的数据模型,融入了面向对象的核心技术,如类 ( Class) 、对象 ( Object) 、封装 ( Encapsulation) 、继承 ( Inheritance) 和多态( Polymorphi) 等思想和技术。Geodatabase 数据模型的目的就是为了让用户能更容易、更自然地表示 GIS 数据特征和更容易地建立特征之间的各种关系。Geodatabase 空间数据库数据模型如表 12 -1 所示。

表 12 -1 Geodatabase 内部结构

续表

2. Geodatabase 数据库模型的特点

Geodatabase 有两种,即个人与多用户 Geodatabase。

1) 个人 Geodatabase 支持内置于 ArcGIS 系统并提供对本地数据的访问,适用于面向项目的 GIS,在 Microsoft Access 数据库平台上实现,提供生成和更新 Access 数据库的服务,可处理小型或适中的 Access 数据库。但个人 Geodatabase 的存储容量有不能超过 2GB的限制。

2) 多用户的 Geodatabase 是通过 ArcSDE ( ARC 空间数据库引擎) 实现的。ArcSDE可以生成和访问从小型到大型的 Geodatabase 并提供关系型数据的开放界面。

与标准的关系数据库相比,Geodatabase 简化了地理数据建模的工作,因为它包含有用于建模地理信息的通用模型。

此外,Geodatabase 还同时支持两个视图,即对象视图和关系视图。这样就综合了对象视图和关系视图两者的优点。对象视图在 Geodatabase 中占据主导地位,其目的是提供一个接近于逻辑数据模型的数据模型,因而更接近于现实。关系视图则用于一些 Geodata-base 数据的常规处理,它表示的是一些简单地理对象的特征。

3. 基于 UML 的 Geodatabase 数据模型的设计

( 1) Geodatabase 数据库设计的方法

在 ArcGIS 中,建立地理数据库可以有多种方法。借助 ArcCatalog,可以通过 3 种方式建立新的地理数据库。

之一种方法是建立一个新的地理数据库。

第二种方法是移植已经存在的数据到地理数据库中去。

第三种方式是用 CASE 工具来建立地理数据库。

( 2) 面向对象和 UML ( 统一建模语言)

面向对象是软件程序设计中的一种新思想,它能使程序设计更加贴近现实,并且花费更小的精力。面向对象方法学包含了对象 ( object) 、类 ( classification) 、继承 ( inherit-ance) 、聚集和消息 ( messages) 的概念。

UML ( Unified Modeling Language,统一建模语言) 是一种基于面向对象方法的建模语言,具有创建系统的静态结构和动态行为等多种结构模型的能力,是一种通用的建模语言。在 Geodatabase 的设计中,主要用到描述系统静态结构的类图。类图的节点表示系统中的类及其属性和操作。类图的边表示类之间的联系,包括继承、关联、依赖、聚合等。

类的表示由 3 个部分方框组成,上面部分给出了类的名称; 中间部分给出了该类的单个对象的属性; 下面部分给出了一些可以应用到这些对象的操作。类的表示如图 12 -5。

图 12 -5 类的表示

关联是对类的实例之间联系的命名,与关联有关的内容有关联元数 ( Degree) 、关联角色 ( Role) 和重复度 ( Multiplicity) 。

UML 中有 3 种类型的类: 抽象类 ( abstract class) 、可创建化类 ( creatable class) 和可实例化类 ( instantiable class) 。

UML 类图的符号见本节第四部分内容。

( 3) 面向对象的地理数据模型的设计方法

利用 CASE 工具进行 Geodatabase 数据模型设计的步骤具体为:

1) 在 CASE 工具中进行 UML 建模。

2) 将设计好的 UML 模型载入资料库 ( repositry) 。

3) 利用 GIS 软件提供的 CASE 接口,根据资料库中的 UML 模型生成空间数据库结构。至此,Geodatabase 空间数据库结构初具雏形。在 GIS 软件环境中,现在可以将新生成的数据或已有的数据进行格式转换后载入到设计好的 Geodatabase 空间数据库中,由空间数据库统一管理。利用 CASE 工具来建立 Geodatabase 地理数据库的工作流程见图12 - 6。

图 12 -6 利用 CASE 工具来建立 Geodatabase 地理数据库的工作流程

六、地质 - 生态环境 Geodatabase 数据模型的建立

( 一) 数据模型设计的依据

根据山东半岛城市群地质 - 生态环境调查评价研究工作的需要和山东半岛城市群地质 - 生态环境 GIS 数据库系统的整体设计要求,结合各地质 - 生态环境要素的成果图件和文本报告资料,利用 UML 设计工具 Microsoft Visio 完成了山东半岛城市群地质 - 生态环境Geodatabase 数据模型的设计 ( 图 12 - 7) 。

图 12 -7 山东半岛城市群地质 - 生态环境 Geodatabase 数据模型的设计依据

( 二) 山东半岛城市群地质 - 生态环境数据库的 UML 类图

1. 数据集管理

山东半岛城市群项目数据包中的数据以数据集为单元统一组织管理,数据集管理方式就是将一份文字报告或一幅成果图件视作逻辑上的整体,用 “数据集编号”唯一标识,通过数据集实体统一管理。同一数据集的不同实体,例如成果图中的图层,通过实体中的“数据集编号”元素关联。

2. 空间数据管理

山东半岛城市群项目数据包由文字报告及成果图件两大类数据组成,并以成果图件为主,成果图件是一空间数据实体,统一存储在面向对象的地理信息数据库中,以图幅为单元进行管理。

3. 数据包总体结构

本标准中山东半岛城市群项目数据包总体结构用 UML 模型来体现,山东半岛城市群项目数据包由 “成果报告”、“元数据”及 “存档文件”3 个数据实体 ( UML 类) 组成,通过 “数据集”实体统一组织管理。“成果报告”由它的继承类 “文字报告”及 “成果图件”定义,为研究成果数据包的主体数据。“元数据”及 “存档文件”为数据集的辅助数据,“元数据”存放文字报告或成果图件的元数据; “存档文件”存放文字报告或成果图件的相关存档文件,供数据集数据的整体下载与利用。

一个 “数据集”实体对应一个项目的 “文字报告”或一幅 “成果图件”; 每一个数据集必须有一个而且只能有一个 “元数据”文件; “存档文件”是 “数据集”的可选聚合实体。

“成果图件”是一空间数据实体,由特定的面向对象地理信息数据库 ( Geodatabase)统一存储、管理。一幅 “成果图件”数据内容由一组空间要素集 ( 基础地理要素集、地质要素集、地球物理要素集、地球化学要素集、辅助要素集) 组成,空间要素集数据类型包括矢量 ( Feature Dataset,简称要素集) 、栅格 ( Raster Dataset) 和 TIN ( TIN Dataset)3 种。

4. 数据集编号的编码规则

数据集编号由数据库管理方统一编码,必须保证编号在数据库中唯一,编号中的英文字母全部大写。

山东半岛城市群项目数据集按 “项目或图幅—提交单位—提交年份—成果序号”编码。数据集编号的字符串长度不得超过 22 位,以保证 “数据集编号 + 要素类名”的字符串总长度不超过 30 位。

5. 成果图件要素类命名规则

要素类名字符串总长度不得超过 8 位。

矢量要素类按 “要素集类型 + 要素类名 + 要素类型”命名,全部用大写英文字母表示。“要素集类型”用一位代码表示,如 “L”表示基础地理要素集。栅格数据集数据以“要素集类型 + 要素类型”命名,要素类型用代码 RAS 表示,如 “DRSRAS”表示遥感栅格数据。TIN 数据集数据以 “要素集类型 + 要素类型”命名,要素类型用代码 TIN 表示,如 “LELETIN”表示地面高程 TIN。

6. 成果图件要素分类编码规则

要素分类编码用以标识不同的要素类要素,保证地图要素存储、交换、显示的一致性。

( 1) 分类编码原则

1) 科学性、系统性;

2) 相对稳定性;

3) 不受地图比例尺的限制;

4) 完整性和可扩展性;

5) 适用性。

( 2) 分类编码方法

成果图件要素类中不同要素的分类编码采用中华人民共和国国家标准 《国土基础信息数据分类与代码》的编码结构,结构如下:

山东半岛城市群地区地质-生态环境与可持续发展研究

大类码、小类码、一级代码和二级代码分别用数字顺序排列。识别位由用户自行定义,以便于扩充。在本项目中编码分两类: ①基础地理要素编码; ②地质专业要素编码( 地质、地球物理、地球化学等) 。

( 三) 山东半岛城市群项目数据实体及实体关系

山东半岛城市群项目数据实体类及其代码见表 12 -2,实体类名代码按实体类的英文名缩略语编码,本标准中山东半岛城市群项目数据实体及实体间关系用 UML 及实体关系图 ( ERD) 来体现。

表 12 -2 山东半岛城市群项目数据实体类及其代码

1. 数据集实体 ( MGRD_Dataset)

山东半岛城市群项目数据包中的 “数据集”实体用来统一组织管理 “文字报告”、“成果图件”、“元数据”及 “存档文件”数据实体,“数据集”实体中的数据项包含数据集的归属项目、提交日期、提交单位、主题类别及地理范围等可用于数据集检索的信息。一个 “数据集”实体对应一个项目的 “文字报告”或一幅 “成果图件”,“数据集”实体与 “元数据”实体间为一一对应关系,与 “存档文件”实体间为一对多的对应关系。“数据集”实体的数据内容及其存储表通过 “数据子集”实体分类定义,主键 [数据集编号]可用于同一数据集中不同 “数据子集”的关联,也可用于数据集对应的 “元数据”及“存档文件”的关联。

2. 成果报告数据实体 ( MGRD SumTmaryReport)

研究成果报告数据实体包括项目的最终综合文字报告及相应的成果图件。

( 1) 文字报告数据实体 ( SR_WordReport)

文字报告数据实体包括 “文字报告”及图像格式的 “报告附图”数据实体,文字报告及附图均以二进制大对象存储。数据实体之间通过 [数据集编号] 关联。

( 2) 成果图件数据实体 ( SR_hemeMapSet)

“成果图件”数据实体是一空间数据实体,主要以矢量图形格式存储在地理信息数据库中,其中也包括栅格数据及 TIN 数据用于数据的空间分析。

1) 要素集: “成果图件” 数据实体以图幅为数据集单元进行管理; 图幅内容以分属不同空间要素集 ( 基础地理要素集、地质要素集、地球物理要素集、地球化学要素集、辅助要素集) 的要素类组合,同一个要素集内的要素类享有同一空间参照系,相互具有拓扑关系。

2) 要素类: 一个要素类的存储单元为关系数据库中的一个数据表,要素类图元类型有点、线、面、注记 4 种,一个要素类只能包含一种图元类型。本标准中基础地理要素集、地质要素集、地球物理要素集、地球化学要素类、辅助要素集的要素类用 UML 类图体现。

3) 图层: 图层为要素类的专题组合及表现,不同图层的组合即构成了可视化 “成果图件”。本项目通过对数据来源的分析,提出并建立了适合山东半岛城市群地区地质 - 生态环境调查与评价特点的空间数据库数据图层。考虑到空间数据的应用和相互转换,每一图层均应建立相应的内部属性表,属性表必须包含一些基本字段内容,根据具体任务的不同,需灵活扩充内部属性表字段内容。 “成果图件”数据实体的图层划分及其代码见表 12 -3。

4) 要素类属性: 要素类的要素特征由属性表定义,属性表每一行对应一个要素,每一列包含要素的一个特征信息。

表 12 -3 成果图件数据实体的图层划分及其代码

5) 要素类要素分类: 同一要素类中不同类型的要素用不同的代码标识,通过属性表中的 “编码” ( GEO_CODE) 数据项体现,以便地图中同一要素类要素的分类显示,并保证地图要素存储、交换、显示的一致性。在本项目中成果图件的基础地理要素分类代码采用中华人民共和国国家标准 《国土基础信息数据分类与代码》,并根据需要进行了扩充,地质专业要素分类代码全部由本标准定义,见表 12 -4 和表 12 -5。

表 12 -4 基础地理要素分类代码

表 12 -5 地质专业要素分类代码

图12 -8 山东半岛城市群项目数据包UML类图

图层编码中,之一位为图类代码,L 代表基础地理类图层; D 代表基础地质类图层;G 代表国土资源图层; W 代表地壳稳定性图层; S 代表水资源图层; H 代表海岸带图层;T 代表生态环境图层; R 代表人类工程活动图层; F 代表分析评价图层; Y 代表预测与防治图层; Z 代表辅助图层。第二位为比例尺代码,图件均采用 1∶ 50 万比例尺,代码为 B。第三位到第五位为图名的汉语拼音首字母缩写。第六位为图层数字编号。

( 四) 山东半岛城市群项目 UML 类图

1. 山东半岛城市群项目数据包 UML 类图

UML 类图见图 12 - 8。

2. 成果图件要素集 UML 类图

1) 基础地理要素集实体 UML 类图 ( FD_Geography) 。本项目将基础地理要素分为地理网格、居民地、境界、交通网、地貌地形、水系、海洋海岸带、行政区划、栅格数据等 9个抽象要素类,建立了 “各市基本情况”对象类,与表明各地区域的 “城市群”类相连接,将山东半岛城市群8 个地级市的地理位置数据与地区的基本资料数据有机地联系起来。

2) 地质要素集实体 UML 类图 ( FD_Geology) 。

3) 国土资源要素集实体 UML 类图 ( FD_LandResource) 。

4) 水资源要素集实体 UML 类图 ( FD_WaterResource) 。

5) 生态环境要素集实体 UML 类图 ( FD_Environment) 。

6) 辅助要素集实体 UML 类图 ( FD_Ancillary) 。

3. 山东半岛城市群项目数据实体关系图

1) 数据集实体 ER 图 ( MGRD_DataSet) 。

2) 研究成果报告数据实体 ER 图 ( MGRD_SummaryReport) ( 图 12 - 9) 。

图 12 -9 研究成果报告数据实体 ER 图 ( MGRD_SummaryReport)

七、山东半岛城市群项目数据包数据字典

( 一) 数据集实体 ( MGRD_DataSet)

山东半岛城市群地区地质-生态环境与可持续发展研究

( 二) 研究成果报告数据实体 ( MGRD_SummaryReport)

1. 文字报告数据实体 ( SR_WordReport)

山东半岛城市群地区地质-生态环境与可持续发展研究

2. 成果图件数据实体 ( SR_ThemeMapSet)

( 1) 基础地理要素集实体 ( FD_Geography)

山东半岛城市群地区地质-生态环境与可持续发展研究

( 2) 地质要素集实体 ( FD_Geology)

山东半岛城市群地区地质-生态环境与可持续发展研究

( 3) 水资源要素集实体 ( FD_HydroResource)

山东半岛城市群地区地质-生态环境与可持续发展研究

如何将图片存到数据库中

一般图片的处蚂让皮理都是上传到服务器然后将图片的地址名称依次保存在数据库中,取出时按照地滑岁址取出就可以。直接用网上的图片地址有的是可以的访问,有的因为图片加锁,闷差保留网上那个图片地址最终是无法找到图片的。

保存图片到数据库中,有两种方法:

1、州铅橘一种是用大对象,即blob型,对c#不了解,但是java、c++中都有专门操作blob的对象,应该是以二进制流的方式走的。但是不建议采用这样的管理方式,会加重数据库、程序负担,即使是手机开发也是如此。

2、图片保存在本地,数据库中用字符激指串存册团储地址,这样的方式比较好,也较易实现。但是缺乏安全性,把图片重命名就行了,改个后缀,一般人就不会打开。还是不放心,用二进制加密下就好,这样的程序代价仍然要比存在数据库大对象中要好。

关于geography 在数据库中如何存储的介绍到此就结束了,不知道你从中找到你需要的信息了吗 ?如果你还想了解更多这方面的信息,记得收藏关注本站。


数据运维技术 » 地理学在数据库中如何储存? (geography 在数据库中如何存储)