主键是数据表的身份id,因为它唯一标识每条记录并定义其存在性。主键必须唯一且非空,可由单列或多列组成(复合主键)。实际应用中常见业务主键(如身份证号)和代理主键(如自增id或uuid),后者因稳定性和效率更高而更受推荐。主键不仅是查询和更新的基础,也是外键关联的前提,缺乏主键将导致数据库关系结构失效。

SQL约束条件是数据库管理系统中的核心机制,它们是一套规则,用于强制数据表的完整性、准确性和一致性。简单来说,它们确保你存入数据库的数据是“对的”且“有意义的”,特别是PRIMARY KEY(主键)和FOREIGN KEY(外键),它们分别定义了每条记录的唯一身份和表与表之间的关联逻辑。

SQL约束条件,这东西说实话,是数据库设计里最容易被忽视,但又至关重要的一环。它不是什么炫酷的新技术,而是实实在在的“数据守门员”。我个人觉得,很多时候我们为了快速开发,会把数据完整性的检查丢给应用层,觉得反正代码能控制。但经验告诉我,把这些底层规则交给数据库自己去执行,才是最稳妥、最高效的办法。你想啊,业务逻辑总在变,代码总在迭代,但数据的基本属性和关系,往往是相对稳定的。让数据库来强制这些规则,能从根本上避免脏数据、孤立数据,也能在多应用访问同一数据库时,提供统一的数据质量保障。这就像是给数据穿上了一层坚固的盔甲,不管外面风吹雨打,核心数据总是安全的。
主键(PRIMARY KEY),这真的是一个数据表的“身份证号”。它不仅仅是用来唯一标识表中每一行记录的,更深层次地说,它定义了这条记录的“存在性”和“可识别性”。没有主键的表,就像一个没有门牌号的城市,你想找谁都得大海捞针。

从技术角度看,主键有几个非常明确的特性:它必须是唯一的(不能有重复值),而且不能为NULL(因为如果可以为NULL,那怎么保证唯一性呢?)。一个表只能有一个主键,但这个主键可以由一个或多个列组成(复合主键)。
在实际应用中,我们经常会看到两种主键: 一种是“业务主键”,比如身份证号、产品SKU码。它们本身就具有业务含义,且在业务层面是唯一的。但这里有个小坑,业务主键可能会因为业务规则的调整而变化,或者因为数据录入错误而产生重复。 另一种是“代理主键”(Surrogate Key),通常是一个自增的整数ID,或者UUID。这种主键没有任何业务含义,纯粹是为了数据库内部管理而生。我个人更倾向于使用代理主键,因为它稳定、简单、不随业务变化而变化,而且在关联查询时通常效率更高,因为整数ID的比较和索引效率是极高的。

主键的存在,不仅让数据查询和更新变得高效,更是建立表之间关系的基础。没有主键,外键就无从谈起,整个关系型数据库的精髓就失去了支撑。
-- 创建一个带有自增主键的表
CREATE TABLE Users (
user_id INT PRIMARY KEY AUTO_INCREMENT, -- user_id 是主键,且自增
username VARCHAR(50) NOT NULL UNIQUE,
email VARCHAR(100) UNIQUE
);
-- 复合主键示例:订单明细表,一个订单可以有多个商品,商品在订单中是唯一的
CREATE TABLE OrderItems (
order_id INT,
product_id INT,
quantity INT,
PRIMARY KEY (order_id, product_id) -- order_id 和 product_id 组合作为主键
);外键(FOREIGN KEY),这是关系型数据库“关系”二字的灵魂所在。它不像主键那样定义自身表的唯一性,而是定义了表与表之间的引用关系。简单来说,外键就是用来确保一个表中的数据,在另一个被引用的表中是真实存在的。这就像你写一篇论文引用别人的观点,外键就是那个引用,它确保你引用的内容确实来自某个具体的、存在的文献。
它的核心作用是维护“引用完整性”(Referential Integrity)。想象一下,如果你删除了一个用户,而这个用户在订单表里还有好几条订单记录,如果没有外键约束,这些订单记录就会变成“孤儿数据”,它们指向一个不存在的用户ID,数据就乱套了。外键就是为了防止这种混乱而生的。
当你在一个表上定义外键时,它会引用另一个表(通常是主键)。这意味着,你不能在子表中插入一个在父表中不存在的引用值,也不能在父表中删除或更新一个被子表引用的值,除非你明确告诉数据库如何处理这些情况。
外键的强大之处还在于它对“级联操作”的支持:
ON DELETE CASCADE: 当父表中的记录被删除时,子表中所有引用该记录的行也跟着被删除。这很方便,但也非常危险,因为可能导致大量数据意外丢失。使用时务必谨慎再谨慎。ON DELETE SET NULL: 当父表中的记录被删除时,子表中引用该记录的外键列会被设置为NULL。前提是该外键列允许为NULL。ON DELETE RESTRICT (或 NO ACTION): 这是默认行为,如果父表中的记录被子表引用,则不允许删除父表中的记录。ON UPDATE CASCADE: 当父表中的主键值更新时,子表中所有引用该主键的外键值也跟着更新。选择哪种级联操作,完全取决于你的业务逻辑。我个人的经验是,对于核心业务数据,RESTRICT 或 NO ACTION 是最安全的,它会强制你在删除父数据前先处理子数据。而 CASCADE 虽然方便,但就像一把双刃剑,一旦用错,后果不堪设想。
-- 创建一个 Orders 表,其 user_id 列是 Users 表 user_id 的外键
CREATE TABLE Orders (
order_id INT PRIMARY KEY AUTO_INCREMENT,
user_id INT,
order_date DATE NOT NULL,
total_amount DECIMAL(10, 2) NOT NULL,
FOREIGN KEY (user_id) REFERENCES Users(user_id)
-- ON DELETE RESTRICT 是默认行为,如果 Users 表中的用户有订单,则不能直接删除该用户
-- ON DELETE CASCADE -- 如果用户被删除,其所有订单也跟着删除
-- ON DELETE SET NULL -- 如果用户被删除,订单中的 user_id 设为 NULL
);
-- 尝试插入一个不存在的用户ID,会报错
-- INSERT INTO Orders (user_id, order_date, total_amount) VALUES (999, '2023-10-26', 100.00);
-- 假设 Users 表中 user_id 为 1 的用户有订单
-- 尝试删除 user_id 为 1 的用户,如果 ON DELETE 是 RESTRICT,会报错
-- DELETE FROM Users WHERE user_id = 1;主键和外键是关系型数据库的骨架,但要让数据真正“健康”,还需要一些其他的约束来填充细节。它们虽然不如主外键那么“宏大”,但在保证数据质量方面同样不可或缺。
NOT NULL 约束:
这个最简单,也最容易理解。它就是强制某个列不能包含NULL值。NULL不是空字符串,它代表“未知”或“不存在”。在很多业务场景下,某个字段的值是必须存在的,比如用户的姓名、订单的创建日期。如果允许这些字段为NULL,那么后续的查询、统计和业务逻辑都会变得复杂甚至出错。
说白了,NOT NULL 就是在说:“这个信息,你必须给我!”
CREATE TABLE Products (
product_id INT PRIMARY KEY,
product_name VARCHAR(255) NOT NULL, -- 产品名称不能为NULL
price DECIMAL(10, 2) NOT NULL
);UNIQUE 约束:UNIQUE 约束确保一个列(或一组列)中的所有值都是唯一的。它和主键很像,但有几个关键区别:一个表可以有多个UNIQUE约束,而主键只能有一个;UNIQUE约束的列可以包含一个NULL值(有些数据库允许多个NULL,但通常只允许一个,因为NULL是“未知”,所以无法判断其是否与另一个“未知”相等),而主键列不允许NULL。
这在需要确保某个字段唯一性但又不是主键的场景非常有用,比如用户的邮箱地址、产品的序列号。
CREATE TABLE Employees (
employee_id INT PRIMARY KEY,
employee_name VARCHAR(255) NOT NULL,
email VARCHAR(255) UNIQUE -- 邮箱地址必须唯一
);CHECK 约束:CHECK 约束用于定义一个条件,所有插入或更新到该列的值都必须满足这个条件。这就像是给数据设定了一个“门槛”。比如,你可能希望某个数值列的值必须大于0,或者某个日期列的值不能是未来的日期,或者某个状态列的值必须是预定义列表中的一个。
这个约束非常灵活,能帮你把很多业务规则直接下沉到数据库层面,避免了应用层代码的重复校验和潜在遗漏。
CREATE TABLE Payments (
payment_id INT PRIMARY KEY,
amount DECIMAL(10, 2) CHECK (amount > 0), -- 金额必须大于0
payment_date DATE,
status VARCHAR(50) CHECK (status IN ('Pending', 'Completed', 'Failed')) -- 状态必须是指定值之一
);DEFAULT 约束:DEFAULT 约束为列提供一个默认值。当你在插入新行时,如果某个列没有明确指定值,那么数据库会自动使用这个默认值。这对于那些在大多数情况下都有固定初始值的字段非常方便,比如创建时间(默认为当前时间)、订单状态(默认为“待处理”)。它减少了插入语句的复杂性,也保证了数据的一致性。
CREATE TABLE Tasks (
task_id INT PRIMARY KEY,
task_name VARCHAR(255) NOT NULL,
status VARCHAR(50) DEFAULT 'Pending', -- 默认状态为 'Pending'
created_at TIMESTAMP DEFAULT CURRENT_TIMESTAMP -- 默认创建时间为当前时间
);这些约束看似简单,但它们共同构筑了数据库数据完整性的坚实防线。在设计数据库时,花时间思考并正确应用这些约束,绝对是事半功倍的投入。它能帮你从源头避免很多数据问题,让你的系统更加健壮。
以上就是SQL约束条件详解 PRIMARY/FOREIGN KEY等用法指南的详细内容,更多请关注php中文网其它相关文章!
每个人都需要一台速度更快、更稳定的 PC。随着时间的推移,垃圾文件、旧注册表数据和不必要的后台进程会占用资源并降低性能。幸运的是,许多工具可以让 Windows 保持平稳运行。
Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号