PostgreSQL插入地理数据怎么操作_PostGIS地理数据插入教程-SQL-PHP中文网

答案：在PostgreSQL中插入地理数据需启用PostGIS扩展，创建含几何类型列的表并指定SRID，使用ST_MakePoint或ST_GeomFromText等函数将坐标转换为几何对象插入。

postgresql插入地理数据怎么操作_postgis地理数据插入教程

在PostgreSQL中插入地理数据，核心操作其实就是利用强大的PostGIS扩展。你需要做的，简单来说，就是先确保你的数据库启用了PostGIS，然后创建一张表，其中包含一个几何（Geometry）类型的列，最后通过SQL函数将你的地理坐标或几何描述转换并存入这个列中。这听起来可能有点抽象，但实际操作起来并不复杂，主要就是围绕着数据类型和几个关键函数展开。

解决方案

要将地理数据顺利地插入PostgreSQL，我们通常会遵循以下几个步骤。这不仅仅是技术流程，更像是我们处理地理信息时的一种思维习惯。

首先，确保你的数据库已经安装并启用了PostGIS扩展。如果没有，你可以用这条命令来完成：

CREATE EXTENSION postgis;

登录后复制

如果这条命令执行失败，那多半是你的PostgreSQL实例上没有安装PostGIS的二进制文件，这需要系统管理员层面去处理。成功启用后，你就可以开始定义你的地理数据表了。

接下来，我们需要创建一个包含几何列的表。这个几何列是PostGIS的核心，它存储了实际的地理形状。在定义它的时候，你需要指定几何类型（比如点、线、面）和空间参考系统标识符（SRID）。SRID非常重要，它告诉PostGIS你的数据是基于哪个坐标系的，比如全球通用的WGS84（SRID 4326）。

比如说，我们想存储一些商店的位置信息，每个位置都是一个点：

CREATE TABLE stores (
    id SERIAL PRIMARY KEY,
    name VARCHAR(255),
    location GEOMETRY(Point, 4326) -- 存储点数据，使用WGS84坐标系
);

登录后复制

这里

GEOMETRY(Point, 4326)

登录后复制

就定义了一个点类型的几何列，并且明确了它的SRID是4326。如果你要存储多边形，那就用

GEOMETRY(Polygon, 4326)

登录后复制

。

现在，表结构有了，就可以插入数据了。插入地理数据最常用的方式是使用PostGIS提供的几何构造函数，比如

ST_MakePoint()

登录后复制

用于点，或者

ST_GeomFromText()

登录后复制

用于从WKT（Well-Known Text）字符串创建几何对象。

例如，插入一个商店的位置：

INSERT INTO stores (name, location) VALUES
('旗舰店A', ST_SetSRID(ST_MakePoint(116.397, 39.909), 4326));

登录后复制

这里

ST_MakePoint(116.397, 39.909)

登录后复制

创建了一个点对象，经度116.397，纬度39.909。

ST_SetSRID()

登录后复制

则确保这个点被正确地标记为SRID 4326。我个人觉得，很多人刚开始会忽略

ST_SetSRID

登录后复制

这一步，或者不理解它的重要性，但它真的是数据完整性的关键。没有它，你的地理数据就像是失去了地图上的参照系，后续的地理计算都会出问题。

如果你有WKT格式的字符串，比如来自其他GIS软件导出的数据，那么

ST_GeomFromText()

登录后复制

就非常方便：

INSERT INTO stores (name, location) VALUES
('概念店B', ST_GeomFromText('POINT(116.400 39.910)', 4326));

登录后复制

这种方式对于导入批量数据，或者从外部系统接收地理信息时，尤其有用。当然，除了点，你也可以插入线（LINESTRING）或面（POLYGON）数据，原理都是一样的，只是构造函数或WKT字符串会相应变化。比如：

-- 插入一条路线 (LINESTRING)
CREATE TABLE routes (
    id SERIAL PRIMARY KEY,
    name VARCHAR(255),
    path GEOMETRY(LineString, 4326)
);

INSERT INTO routes (name, path) VALUES
('市中心环线', ST_GeomFromText('LINESTRING(116.390 39.900, 116.400 39.910, 116.410 39.900)', 4326));

-- 插入一个区域 (POLYGON)
CREATE TABLE districts (
    id SERIAL PRIMARY KEY,
    name VARCHAR(255),
    area GEOMETRY(Polygon, 4326)
);

INSERT INTO districts (name, area) VALUES
('商业区C', ST_GeomFromText('POLYGON((116.395 39.905, 116.405 39.905, 116.405 39.915, 116.395 39.915, 116.395 39.905))', 4326));

登录后复制

这些就是最基础，也是最核心的地理数据插入操作。理解了这些，你就掌握了PostGIS的入门钥匙。

在PostGIS中如何选择合适的几何类型和SRID？

选择合适的几何类型和SRID是PostGIS数据建模中非常关键的一步，它直接影响数据的存储效率、查询性能以及地理分析的准确性。我个人在实践中，发现很多人一开始会把重心放在如何插入数据，却忽略了这背后的设计考量，结果在后期遇到各种麻烦。

几何类型的选择：

PostGIS提供了多种几何类型来表示不同的地理特征：

POINT（点）：最简单，用于表示没有面积和长度的单个位置，比如商店、传感器位置、单个地址。
LINESTRING（线串）：由一系列点连接而成的线段，用于表示道路、河流、轨迹、管线等。
POLYGON（多边形）：由一个闭合的线串组成的区域，可以有内部的洞（holes），用于表示行政区划、湖泊、建筑物占地面积等。
MULTIPOINT（多点）、MULTILINESTRING（多线串）、MULTIPOLYGON（多多边形）：这些是复合类型，用于表示由多个相同类型几何对象组成的单个地理特征。例如，一个国家可能由多个不相连的岛屿组成，这时用
```
MULTIPOLYGON
```
登录后复制
就比多个
```
POLYGON
```
登录后复制
更合理。
GEOMETRYCOLLECTION（几何集合）：最通用的类型，可以包含不同类型的几何对象。但说实话，我很少直接用这个类型作为列的定义，因为它太灵活了，反而可能导致数据结构不清晰，增加查询的复杂性。通常，我会尽量细化到具体的单一类型或复合类型。
GEOMETRY（通用几何）：如果你不确定会存储哪种几何类型，或者你的列可能包含多种几何类型（比如，有时候是点，有时候是线），你可以直接使用
```
GEOMETRY
```
登录后复制
。但同样，这会降低类型检查的严格性，可能在后期带来一些意想不到的问题。我的建议是，如果能明确类型，尽量明确。

选择时，你需要根据你实际要表示的地理实体来决定。比如，一个邮筒是

POINT

登录后复制

，一条公交线路是

LINESTRING

登录后复制

，一个公园是

POLYGON

登录后复制

。如果一个对象在逻辑上是单一的，但地理上是分离的（比如一个由多个岛屿组成的国家），那么

MULTI

登录后复制

类型就是首选。

SRID（空间参考系统标识符）的选择：

SRID是PostGIS中另一个至关重要的概念，它定义了地理数据所使用的坐标系。没有SRID，你的坐标就只是没有意义的数字对。

地理坐标系（Geographic Coordinate Systems, GCS）：最常见的是WGS84，其SRID是4326。它使用经度和纬度来表示地球表面的位置，单位是度。WGS84是全球定位系统（GPS）的基础，也是Web地图（如Google Maps, OpenStreetMap）普遍采用的坐标系。如果你需要全球范围的数据，或者数据来源是GPS设备，那么4326通常是你的不二选择。它的优点是全球通用，但缺点是度量单位不是线性距离，进行距离计算时需要更复杂的球面几何算法。
投影坐标系（Projected Coordinate Systems, PCS）：这些坐标系将地球表面的三维弧形坐标投影到二维平面上，单位通常是米或英尺。例如，UTM（Universal Transverse Mercator）系统，或者各个国家和地区自定义的投影坐标系。它们的SRID通常是五位数或六位数，例如中国常用的CGCS2000投影坐标系（如3857是Web Mercator，基于WGS84椭球体，但它是投影坐标系，单位是米）。
- 何时选择投影坐标系？ 当你需要进行精确的距离、面积计算，或者你的数据集中在某个局部区域时，投影坐标系会更合适。在投影坐标系下，距离和面积计算通常更简单、更准确，因为它们是在平面上进行的。
- 一个常见的误区：很多人会直接使用
```
3857
```
  登录后复制
  （Web Mercator）来存储数据，因为它是Web地图的标准。但
```
3857
```
  登录后复制
  在极地地区存在严重的形变，不适合进行精确的地理分析。如果你只是为了展示，那没问题；但如果需要进行测量和分析，最好还是选择一个适合你区域的局部投影坐标系，或者在分析时将数据投影到合适的坐标系。

我的建议是：

数据存储： 优先考虑使用4326 (WGS84) 来存储全球性的原始地理数据，因为它通用性好，便于数据交换。
数据分析： 在进行距离、面积等精确几何计算时，将数据即时投影到适合分析的局部投影坐标系（例如，使用
```
ST_Transform()
```
登录后复制
函数），完成计算后再转换回来或仅用于结果展示。避免直接在
```
3857
```
登录后复制
上进行精确测量。

简而言之，几何类型决定了你“画”什么，而SRID则决定了你“在哪里”画，两者都必须明确且正确，才能确保你的地理数据既准确又实用。

批量导入地理数据时有哪些常见问题和优化策略？

批量导入地理数据，尤其是在数据量巨大的时候，常常会遇到性能瓶颈、数据格式不匹配或者导入失败等问题。我记得有一次处理几百万条轨迹数据，一开始没做任何优化，直接用

INSERT

登录后复制

语句循环插入，那速度简直是噩梦，最后不得不重新考虑策略。

常见问题：

模力视频

模力视频 - AIGC视频制作平台 | AI剪辑 | 云剪辑 | 海量模板

425

查看详情

性能瓶颈：
- 单条
  INSERT
  登录后复制
  语句效率低下：每次插入都会涉及事务开销、索引更新等，大量单条
```
INSERT
```
  登录后复制
  会非常慢。
- 缺乏索引： 如果你的几何列没有空间索引（GIST索引），查询会非常慢，这也会影响插入时的索引维护。
- 事务处理不当： 频繁的
```
COMMIT
```
  登录后复制
  操作会增加I/O开销。
- 数据量过大导致内存或磁盘溢出： 特别是处理复杂的几何图形时。
数据格式不匹配：
- SRID不一致： 导入的数据SRID与目标表的SRID不符，导致数据错位或插入失败。
- 几何类型不符： 试图将多边形数据插入到点类型列中。
- WKT/WKB格式错误： 字符串解析失败，常见于WKT字符串格式不规范（如括号不匹配、坐标分隔符错误）。
几何有效性问题：
- 导入的几何图形可能存在自相交、重复点等无效情况，PostGIS在某些操作时可能会报错或给出不准确的结果。

优化策略：

使用

COPY

登录后复制

命令进行批量导入： 这是PostgreSQL导入大量数据的首选方式，比

INSERT

登录后复制

语句快几个数量级。你可以将数据组织成CSV或其他文本格式，然后使用

COPY FROM

登录后复制

命令导入。对于几何数据，你可以将WKT或EWKT（Extended WKT，包含SRID信息）字符串作为文本列导入，然后在导入后更新几何列，或者直接在

COPY

登录后复制

命令中处理。

例如，假设你的CSV文件

geo_data.csv

登录后复制

包含

name,wkt_geometry

登录后复制

：

商店A,"POINT(116.397 39.909)"
商店B,"POINT(116.400 39.910)"

登录后复制

你可以先导入到临时表，再转换：

CREATE TEMPORARY TABLE temp_stores (
    name VARCHAR(255),
    wkt_geom TEXT
);

COPY temp_stores FROM '/path/to/geo_data.csv' WITH (FORMAT CSV, HEADER true);

INSERT INTO stores (name, location)
SELECT name, ST_SetSRID(ST_GeomFromText(wkt_geom), 4326)
FROM temp_stores;

登录后复制

或者更直接，如果你的

COPY

登录后复制

源可以直接提供几何列的WKT或EWKT：

-- 如果你的CSV中直接是带SRID的EWKT，比如 "SRID=4326;POINT(116.397 39.909)"
-- 那么你可以直接在COPY时利用ST_GeomFromEWKT
CREATE TABLE stores_new (
    id SERIAL PRIMARY KEY,
    name VARCHAR(255),
    location GEOMETRY(Point, 4326)
);
-- 假设CSV文件是 name,ewkt_geometry
-- 商店A,"SRID=4326;POINT(116.397 39.909)"
COPY stores_new (name, location) FROM '/path/to/geo_data_ewkt.csv' WITH (FORMAT CSV, HEADER true, DELIMITER ',' );
-- 注意：这里location列的类型需要是GEOMETRY，且COPY会自动调用ST_GeomFromEWKT进行转换

登录后复制

这种直接

COPY

登录后复制

到几何列的方式，要求源数据格式非常精确，通常是EWKT或WKB。

使用
```
ogr2ogr
```
登录后复制
工具： 对于Shapefile、GeoJSON、KML等常见GIS文件格式，
```
ogr2ogr
```
登录后复制
是GDAL/OGR库提供的一个命令行工具，它是导入地理数据的瑞士军刀。它能自动处理坐标系转换、几何类型匹配等复杂问题，效率极高。

例如，导入一个Shapefile到PostgreSQL：
```
ogr2ogr -f "PostgreSQL" PG:"host=localhost user=youruser dbname=yourdb password=yourpassword" /path/to/your_shapefile.shp -nln your_table_name -lco GEOMETRY_NAME=location -lco FID=id -t_srs EPSG:4326
```
登录后复制
这里
```
-t_srs EPSG:4326
```
登录后复制
指定了目标SRID，
```
ogr2ogr
```
登录后复制
会自动进行坐标转换。
```
-nln
```
登录后复制
指定了目标表名，
```
-lco GEOMETRY_NAME=location
```
登录后复制
指定了几何列的名称。

批量事务处理： 如果必须使用

INSERT

登录后复制

语句（比如数据是动态生成的），考虑将多条

INSERT

登录后复制

语句放在一个事务中，或者使用

INSERT INTO ... VALUES (), (), ...;

登录后复制

这种多值插入的语法。这可以显著减少事务开销。

BEGIN;
INSERT INTO stores (name, location) VALUES
('店C', ST_SetSRID(ST_MakePoint(116.410, 39.920), 4326)),
('店D', ST_SetSRID(ST_MakePoint(116.420, 39.930), 4326)),
('店E', ST_SetSRID(ST_MakePoint(116.430, 39.940), 4326));
COMMIT;

登录后复制

创建GIST空间索引： 在导入大量数据之前或之后（如果表为空，导入前建索引更快；如果表有数据，导入后建索引），为几何列创建GIST（Generalized Search Tree）索引。这是PostGIS进行空间查询的核心，没有它，任何空间查询都将是全表扫描。
```
CREATE INDEX idx_stores_location ON stores USING GIST (location);
```
登录后复制
我记得有次处理几百万条数据，没建GIST索引，那查询速度简直是噩梦。加上索引后，查询速度提升了上百倍，这真的是个经验教训。

处理几何有效性： 在导入数据前或导入后，检查并修复几何图形的有效性。

ST_IsValid()

登录后复制

可以检查几何图形是否有效，

ST_MakeValid()

登录后复制

可以尝试修复无效的几何图形。

-- 查找无效几何图形
SELECT id, name FROM districts WHERE NOT ST_IsValid(area);

-- 修复无效几何图形（可能生成MULTI类型）
UPDATE districts SET area = ST_MakeValid(area) WHERE NOT ST_IsValid(area);

登录后复制

临时关闭索引和约束： 对于超大规模的数据导入，有时可以考虑在导入期间临时关闭表的索引和外键约束，导入完成后再重新启用。这会加速插入操作，但需要谨慎操作，确保数据完整性。不过，对于GIST索引，通常是建议在数据导入完成后再创建，因为每次插入都会更新索引，这会减慢速度。

通过这些策略的组合使用，你可以大大提高PostGIS中地理数据的批量导入效率和成功率。

如何验证和查询PostGIS中插入的地理数据？

数据插进去之后，最重要的一步就是验证它是否正确，以及如何有效地查询这些地理信息。毕竟，我们插入数据的目的就是为了后续的分析和应用。

验证数据：

查看WKT表示： 最直接的方式就是将几何列转换为WKT（Well-Known Text）格式，直观地查看其坐标和结构是否符合预期。
```
SELECT id, name, ST_AsText(location) AS location_wkt FROM stores;
SELECT id, name, ST_AsText(path) AS path_wkt FROM routes;
```
登录后复制
```
ST_AsText()
```
登录后复制
函数会将几何对象转换成易读的WKT字符串，比如
```
POINT(116.397 39.909)
```
登录后复制
。很多时候，我插完数据第一件事就是
```
ST_AsText
```
登录后复制
看看是不是我想要的样子，或者有没有出现意料之外的坐标。
查看GeoJSON表示： 如果你的应用需要与Web前端交互，GeoJSON格式会更常用。
```
SELECT id, name, ST_AsGeoJSON(location) AS location_geojson FROM stores;
```
登录后复制
```
ST_AsGeoJSON()
```
登录后复制
函数会将几何对象转换成GeoJSON格式的文本，这对于集成到地图可视化库（如Leaflet, OpenLayers）非常方便。
检查SRID： 确保几何列的SRID是正确的，这是空间数据一致性的基础。
```
SELECT id, name, ST_SRID(location) AS srid_value FROM stores;
```
登录后复制
```
ST_SRID()
```
登录后复制
函数会返回几何对象的SRID。如果返回
```
0
```
登录后复制
或者不是你期望的值，那可能在插入时就出了问题。
检查几何有效性：
```
ST_IsValid()
```
登录后复制
函数可以检查几何图形是否在拓扑上是有效的。无效的几何图形可能会在空间分析中导致错误。
```
SELECT id, name, ST_IsValid(location) AS is_valid FROM stores;
SELECT id, name FROM districts WHERE NOT ST_IsValid(area); -- 查找无效区域
```
登录后复制
如果
```
is_valid
```
登录后复制
返回
```
f
```
登录后复制
（false），说明几何图形存在问题，可能需要用
```
ST_MakeValid()
```
登录后复制
进行修复。

查询数据：

PostGIS提供了极其丰富的空间查询函数，可以让你进行各种复杂的地理分析。

简单的选择和投影： 选择所有数据，或者将数据投影到不同的坐标系进行查看。

-- 选择所有商店的位置
SELECT id, name, location FROM stores;

-- 将商店位置从WGS84投影到Web Mercator (SRID 3857)
SELECT id, name, ST_Transform(location, 3857) AS projected

登录后复制

以上就是PostgreSQL插入地理数据怎么操作_PostGIS地理数据插入教程的详细内容，更多请关注php中文网其它相关文章！