
本教程详细介绍了如何解析 tor v3 onion 域名,以程序化方式提取其核心组成部分:公钥、校验和与版本号。我们将依据 tor 官方规范,通过 php 语言实现 base32 解码,并精确地从解码后的二进制数据中定位并提取这些关键信息。文章还将提供完整的示例代码和校验和验证方法,确保解析的准确性和可靠性。
引言:理解 v3 Onion 域名结构
Tor v3 Onion 域名是 Tor 隐藏服务在网络中的标识符,它们以 .onion 结尾,并提供了一种加密且匿名的访问方式。理解其内部结构对于进行安全分析、服务识别或构建相关工具至关重要。Tor 项目的官方规范 rend-spec-v3.txt(特别是 4.3.6 节)详细定义了 v3 Onion 域名的编码方式。
根据规范,一个 v3 Onion 域名由以下部分构成,并经过 Base32 编码:
onion_address = base32(PUBKEY | CHECKSUM | VERSION) + ".onion"
其中:
- PUBKEY: 隐藏服务的 32 字节 Ed25519 主公钥。
- VERSION: 一个字节的版本字段,默认值为 \x03(即十进制 3)。
- CHECKSUM: 一个 2 字节的校验和,其计算方式为 H(".onion checksum" | PUBKEY | VERSION)[:2],其中 H 表示 SHA3-256 哈希函数,".onion checksum" 是一个常量字符串,[:2] 表示取哈希结果的前两个字节。
这意味着,当我们对一个 v3 Onion 域名(去除 .onion 后缀)进行 Base32 解码后,会得到一个 35 字节的二进制字符串,其结构为:[32 字节公钥] [2 字节校验和] [1 字节版本号]。
解析流程概述
解析 v3 Onion 域名的主要步骤如下:
- 移除 .onion 后缀:从完整的 Onion 域名中去除末尾的 .onion 字符串。
- Base32 解码:对剩余的 Base32 编码字符串进行解码,得到原始的二进制数据。
- 提取组件:根据规范中定义的字节偏移量,从解码后的二进制数据中精确提取公钥、校验和和版本号。
- 校验和验证(可选但推荐):根据提取出的公钥和版本号,重新计算校验和,并与提取的校验和进行比对,以验证 Onion 域名的完整性和有效性。
PHP 实现:逐步解析 v3 Onion 域名
我们将使用 PHP 语言来演示如何实现上述解析过程。
步骤一:准备 Base32 解码器
PHP 标准库中没有内置 Base32 解码函数,因此我们需要一个自定义的实现。以下是一个简洁的 Base32 解码类:
= 8) {
$bits -= 8;
$output .= chr(($buffer >> $bits) & 0xFF); // 提取最高 8 位作为字节
}
}
return $output;
}
}
?>步骤二:移除后缀并解码
现在,我们可以使用上述 Base32 类来处理一个示例的 v3 Onion 域名。
步骤三:提取公钥、校验和与版本
根据 v3 Onion 域名的结构 [32 字节公钥] [2 字节校验和] [1 字节版本号],我们可以使用 substr 函数来精确提取这些组件。
通过上述代码,我们成功地从一个 v3 Onion 域名中提取了其核心组成部分。
校验和验证
为了确保解析出的数据是有效的,并且 Onion 域名本身没有被篡改,我们可以重新计算校验和并与提取出的校验和进行比对。
根据规范:CHECKSUM = H(".onion checksum" | PUBKEY | VERSION)[:2]。这里 H 是 SHA3-256 哈希函数。PHP 7.1 及以上版本支持 SHA3 系列哈希算法。
完整 PHP 示例代码
将上述所有步骤整合到一个完整的 PHP 脚本中:
= 8) {
$bits -= 8;
$output .= chr(($buffer >> $bits) & 0xFF);
}
}
return $output;
}
}
/**
* 解析 v3 Onion 域名并提取其组件。
* @param string $onionUrl 完整的 v3 Onion 域名。
* @return array|null 包含 'publicKey', 'checksum', 'version' 的数组,或解析失败返回 null。
*/
function parseV3OnionDomain(string $onionUrl): ?array
{
// 1. 移除 .onion 后缀
if (!str_ends_with($onionUrl, ".onion")) {
echo "错误:域名不以 '.onion' 结尾。\n";
return null;
}
$base32EncodedString = str_replace(".onion", "", $onionUrl);
// 2. Base32 解码
$decodedBinaryData = Base32::decode($base32EncodedString);
// 验证解码后的长度是否符合预期 (35 字节)
if (strlen($decodedBinaryData) !== 35) {
echo "错误:解码后的数据长度不符合 v3 Onion 域名规范 (预期 35 字节,实际 " . strlen($decodedBinaryData) . " 字节)。\n";
return null;
}
// 3. 提取公钥、校验和与版本
$publicKeyBytes = substr($decodedBinaryData, 0, 32); // 前 32 字节
$checksumBytes = substr($decodedBinaryData, 32, 2); // 紧接着的 2 字节
$versionByte = substr($decodedBinaryData, 34, 1); // 最后一个字节
$result = [
'publicKey' => bin2hex($publicKeyBytes),
'checksum' => bin2hex($checksumBytes),
'version' => ord($versionByte), // 将字节转换为十进制整数
'rawPublicKey' => $publicKeyBytes,
'rawChecksum' => $checksumBytes,
'rawVersion' => $versionByte,
];
// 4. 校验和验证
if (in_array('sha3-256', hash_algos())) {
$constantString = ".onion checksum";
$dataToHash = $constantString . $publicKeyBytes . $versionByte;
$calculatedHash = hash('sha3-256', $dataToHash, true);
$calculatedChecksum = substr($calculatedHash, 0, 2);
$result['checksumVerified'] = ($calculatedChecksum === $checksumBytes);
$result['calculatedChecksum'] = bin2hex($calculatedChecksum);
} else {
$result['checksumVerified'] = false;
$result['calculatedChecksum'] = 'N/A (SHA3-256 not supported)';
}
return $result;
}
// 示例使用
$testOnionUrl = "pg6mmjiyjmcrsslvykfwnntlaru7p5svn6y2ymmju6nubxndf4pscryd.onion";
$parsedData = parseV3OnionDomain($testOnionUrl);
if ($parsedData) {
echo "--------------------------------------------------\n";
echo "解析 v3 Onion 域名: " . $testOnionUrl . "\n";
echo "--------------------------------------------------\n";
echo "公钥 (Hex): " . $parsedData['publicKey'] . "\n";
echo "提取的校验和 (Hex): " . $parsedData['checksum'] . "\n";
echo "版本号 (十进制): " . $parsedData['version'] . "\n";
echo "计算的校验和 (Hex): " . $parsedData['calculatedChecksum'] . "\n";
echo "校验和验证结果: " . ($parsedData['checksumVerified'] ? "成功" : "失败") . "\n";
echo "--------------------------------------------------\n";
}
// 另一个示例
$anotherOnionUrl = "sp3k262uwy4r2k3ycr5awluarykdpag6a7y33jxop4cs2lu5uz5sseqd.onion";
$parsedData2 = parseV3OnionDomain($anotherOnionUrl);
if ($parsedData2) {
echo "\n--- 另一个示例 ---\n";
echo "解析 v3 Onion 域名: " . $anotherOnionUrl . "\n";
echo "公钥 (Hex): " . $parsedData2['publicKey'] . "\n";
echo "提取的校验和 (Hex): " . $parsedData2['checksum'] . "\n";
echo "版本号 (十进制): " . $parsedData2['version'] . "\n";
echo "校验和验证结果: " . ($parsedData2['checksumVerified'] ? "成功" : "失败") . "\n";
}
?>注意事项
- Base32 解码器的可靠性:确保使用的 Base32 解码器实现是准确且符合 RFC 4648 规范的,尤其是在处理不同字符集和填充规则时。本教程提供的实现适用于 Tor v3 Onion 域名,因为它们通常不包含填充字符。










