
本文深入探讨了java中`list
理解retainAll方法与字符串比较
在Java中,java.util.List接口提供了一个名为retainAll(Collection> c)的方法,用于计算当前列表与指定集合的交集。调用此方法后,当前列表将只保留那些也存在于指定集合c中的元素。换句话说,它会移除当前列表中所有不在c中的元素。这个操作的核心在于元素的比较,对于String对象而言,比较是基于其equals()方法进行的。String的equals()方法会逐字符比较两个字符串的内容,包括任何空白字符。
考虑以下场景,我们有两个字符串列表,希望找出它们之间的共同元素:
import java.util.ArrayList;
import java.util.Arrays;
import java.util.List;
public class ListIntersectionDemo {
public static void main(String[] args) {
String csv = "Apple, Google, Samsung";
List csvList = Arrays.asList(csv.split(",")); // 问题根源在此
ArrayList list0 = new ArrayList<>(csvList);
ArrayList list1 = new ArrayList<>();
list1.add("Apple");
list1.add("Asus");
list1.add("Lenovo");
list1.add("Google");
System.out.println("原始 list0: " + list0); // 预期: [Apple, Google, Samsung]
System.out.println("原始 list1: " + list1); // 预期: [Apple, Asus, Lenovo, Google]
list1.retainAll(list0);
System.out.println("交集结果 list1: " + list1); // 实际: []
}
} 运行上述代码,你会发现list1在调用retainAll后变成了空列表,这与我们期望的结果([Apple, Google])不符。
retainAll失败的根本原因:未处理的空白字符
问题的根源在于字符串的解析方式。当执行csv.split(",")时,字符串"Apple, Google, Samsung"被分割成以下三个元素:
立即学习“Java免费学习笔记(深入)”;
- "Apple"
- " Google" (注意前面的空格)
- " Samsung" (注意前面的空格)
而list1中的元素是:
- "Apple"
- "Asus"
- "Lenovo"
- "Google"
当retainAll方法尝试比较list1中的"Google"与list0中的" Google"时,由于两者内容不完全相同("Google"与" Google"的equals()方法返回false),它们被视为不同的字符串。因此,没有任何元素能够匹配成功,导致最终的交集为空。
解决方案:数据预处理——去除空白字符
要解决这个问题,关键在于确保参与比较的字符串元素是“干净”的,即去除所有不必要的首尾空白字符。有多种方法可以实现这一点:
方法一:在分割时去除空白字符
使用正则表达式在split方法中同时匹配逗号和其后的任意空白字符。
import java.util.ArrayList;
import java.util.Arrays;
import java.util.List;
import java.util.stream.Collectors;
public class ListIntersectionSolution1 {
public static void main(String[] args) {
String csv = "Apple, Google, Samsung";
// 使用正则表达式 ",\\s*" 来分割,同时去除逗号后的所有空白字符
List csvList = Arrays.asList(csv.split(",\\s*"));
ArrayList list0 = new ArrayList<>(csvList);
ArrayList list1 = new ArrayList<>();
list1.add("Apple");
list1.add("Asus");
list1.add("Lenovo");
list1.add("Google");
System.out.println("修正后 list0: " + list0); // 预期: [Apple, Google, Samsung]
System.out.println("原始 list1: " + list1); // 预期: [Apple, Asus, Lenovo, Google]
list1.retainAll(list0);
System.out.println("交集结果 list1: " + list1); // 实际: [Apple, Google]
}
} 在csv.split(",\\s*")中,,\\s*表示匹配一个逗号后跟着零个或多个空白字符。这样,"Apple, Google, Samsung"就会被正确地分割为"Apple"、"Google"和"Samsung"。
方法二:迭代修剪列表元素
如果无法修改split逻辑(例如,列表来自其他源),可以在将元素添加到列表或在进行retainAll操作之前,对列表中的每个字符串元素进行修剪(trim())。
import java.util.ArrayList;
import java.util.Arrays;
import java.util.List;
import java.util.stream.Collectors;
public class ListIntersectionSolution2 {
public static void main(String[] args) {
String csv = "Apple, Google, Samsung";
List csvListRaw = Arrays.asList(csv.split(","));
// 使用Stream API对每个元素进行trim操作
ArrayList list0 = csvListRaw.stream()
.map(String::trim)
.collect(Collectors.toCollection(ArrayList::new));
ArrayList list1 = new ArrayList<>();
list1.add("Apple");
list1.add("Asus");
list1.add("Lenovo");
list1.add("Google");
// 如果list1的元素也可能包含空格,同样需要trim
// list1 = list1.stream().map(String::trim).collect(Collectors.toCollection(ArrayList::new));
System.out.println("修剪后 list0: " + list0); // 预期: [Apple, Google, Samsung]
System.out.println("原始 list1: " + list1); // 预期: [Apple, Asus, Lenovo, Google]
list1.retainAll(list0);
System.out.println("交集结果 list1: " + list1); // 实际: [Apple, Google]
}
} 此方法使用Java 8的Stream API,通过map(String::trim)对列表中的每个字符串应用trim()方法,然后收集到新的ArrayList中。
方法三:创建新的交集列表
retainAll方法会修改调用它的列表。如果需要保留原始列表不变,可以先创建一个新列表,然后将其中一个原始列表的所有元素添加进去,再对新列表调用retainAll方法。
import java.util.ArrayList;
import java.util.Arrays;
import java.util.List;
import java.util.stream.Collectors;
public class ListIntersectionSolution3 {
public static void main(String[] args) {
String csv = "Apple, Google, Samsung";
ArrayList list0 = Arrays.asList(csv.split(",\\s*"))
.stream()
.map(String::trim) // 确保所有元素都被trim
.collect(Collectors.toCollection(ArrayList::new));
ArrayList list1 = new ArrayList<>();
list1.add("Apple");
list1.add("Asus");
list1.add("Lenovo");
list1.add("Google");
System.out.println("原始 list0: " + list0);
System.out.println("原始 list1: " + list1);
// 创建一个新的列表用于存放交集结果
ArrayList commonElements = new ArrayList<>(list1); // 将list1的元素复制到新列表
commonElements.retainAll(list0); // 对新列表执行retainAll
System.out.println("原始 list0 (不变): " + list0);
System.out.println("原始 list1 (不变): " + list1);
System.out.println("交集结果 commonElements: " + commonElements); // 实际: [Apple, Google]
}
} 注意事项与总结
- 数据洁净性是关键:在进行任何集合操作(如交集、并集、差集)之前,务必确保参与操作的数据是干净的。对于字符串,这意味着要特别注意首尾空白字符、大小写(如果需要忽略大小写,则在比较前统一转换为大写或小写)以及其他非打印字符。
- retainAll修改原列表:请记住retainAll方法会直接修改调用它的List对象。如果需要保留原始列表,应先创建列表的副本再进行操作。
- equals()方法的重要性:retainAll方法依赖于集合中元素的equals()方法来判断两个元素是否“相同”。对于自定义对象,如果需要根据特定业务逻辑判断相等性,则必须正确重写equals()和hashCode()方法。
- 性能考量:对于非常大的列表,retainAll的性能可能不是最优。如果对性能有极高要求,并且元素数量巨大,可以考虑将其中一个列表转换为HashSet(查找速度快),然后再进行迭代比较,或者使用Stream API进行更复杂的集合操作。
通过上述方法,我们可以有效地解决List










