
本文详解在java/scala中从任意格式的完全限定域名(fqdn)中可靠提取shortname的方法——核心在于基于已知域名字典进行后缀匹配,而非依赖简单分割,从而避免歧义和错误切分。
在实际系统集成、服务发现或日志归一化等场景中,常需将类似 node.a.dev.domain.net 的FQDN解析为业务可读的短名称(如 node.a.dev)。但必须明确:仅凭字符串本身无法无歧义地确定 shortName 与 domain 的边界。例如:
- node.a.dev.domain.net → node.a.dev(而非 node.a 或 node)
- node.a.dev.dom-as-me.domain.net → node.a.dev(说明 dom-as-me.domain.net 是一个合法注册域)
- node.a.dom-as-me.domain.net → node.a(说明 dom-as-me.domain.net 不参与截断,而更长的 domain.net 才是基准域)
这表明:shortName = FQDN 去掉最长可识别的、预定义的“权威域名后缀”后的前缀部分。
✅ 正确解法:基于权威域名字典的最长后缀匹配
你需要维护一个有序的权威域名列表(按长度降序),例如:
domain.net dev.domain.net sbx.domain.net dom-as-me.domain.net
然后对每个FQDN,从右向左尝试匹配最长可能的后缀;一旦匹配成功,剩余左侧部分即为 shortName。
? Java 示例实现(使用 TreeSet 保证逆序遍历)
import java.util.*;
public class FqdnShortNameExtractor {
// 按长度降序排列的权威域名后缀集合(确保最长匹配优先)
private final TreeSet domains = new TreeSet<>((a, b) ->
Integer.compare(b.length(), a.length())
);
public FqdnShortNameExtractor(Collection knownDomains) {
this.domains.addAll(knownDomains);
}
public String extractShortName(String fqdn) {
if (fqdn == null || fqdn.trim().isEmpty()) return fqdn;
String clean = fqdn.trim().toLowerCase();
for (String domain : domains) {
String lowerDomain = domain.toLowerCase();
if (clean.endsWith("." + lowerDomain) || clean.equals(lowerDomain)) {
int idx = clean.length() - lowerDomain.length();
if (idx > 0 && clean.charAt(idx - 1) == '.') {
return clean.substring(0, idx - 1); // 去掉前导点
}
// 完全相等时返回空(罕见,表示整个FQDN就是domain)
return "";
}
}
// 未匹配任何已知域,保守返回原FQDN或抛出异常
return clean; // 或 throw new IllegalArgumentException("Unknown domain: " + fqdn);
}
// 使用示例
public static void main(String[] args) {
var extractor = new FqdnShortNameExtractor(Arrays.asList(
"domain.net",
"dev.domain.net",
"sbx.domain.net",
"dom-as-me.domain.net"
));
System.out.println(extractor.extractShortName("node.a.domain.net")); // node.a
System.out.println(extractor.extractShortName("node.a.dev.domain.net")); // node.a.dev
System.out.println(extractor.extractShortName("node.a.dev.dom-as-me.domain.net")); // node.a.dev
System.out.println(extractor.extractShortName("node.a.sbx.domain.net")); // node.a.sbx
}
} ? Scala 简洁版(利用 List.sortBy + find)
object FqdnExtractor {
def buildExtractor(domains: Seq[String]): String => String = {
val sorted = domains.distinct.sortBy(-_.length) // 降序:优先匹配更长后缀
fqdn =>
sorted.find { domain =>
fqdn.equalsIgnoreCase(domain) || fqdn.toLowerCase.endsWith("." + domain.toLowerCase)
} match {
case Some(domain) =>
val pos = fqdn.toLowerCase.lastIndexOf("." + domain.toLowerCase)
if (pos > 0) fqdn.substring(0, pos)
else ""
case None => fqdn
}
}
// 使用
val extractor = buildExtractor(Seq(
"domain.net",
"dev.domain.net",
"sbx.domain.net",
"dom-as-me.domain.net"
))
println(extractor("node.a.dev.dom-as-me.domain.net")) // node.a.dev
}⚠️ 关键注意事项
- 字典必须完整且权威:缺失关键后缀(如漏掉 dev.domain.net)会导致错误切分(如误将 node.a.dev.domain.net 截为 node.a)。
- 顺序决定结果:务必按后缀长度降序排列,否则 domain.net 可能先于 dev.domain.net 匹配,导致 node.a.dev.domain.net 错误截成 node.a.dev。
- 大小写不敏感处理:DNS 域名不区分大小写,所有比较应转为小写。
- 边界校验不可少:需确保匹配发生在完整标签边界(即前一位是 . 或开头),防止 example.com 错误匹配 myexample.com。
- 兜底策略要明确:对未知FQDN,建议记录告警并返回原值,而非静默失败。
✅ 总结
提取 FQDN 的 shortName 不是字符串算法题,而是领域建模问题。它依赖你对组织内真实域名体系的理解与维护。将 domain.net、dev.domain.net 等作为配置项注入系统,配合最长后缀匹配逻辑,即可稳定、可扩展地支撑多环境(dev/sbx/prod)、多租户(dom-as-me)场景下的命名解析需求。










