
在数据分析和处理中,我们经常需要根据一个数据集(DataFrame B)中的信息来标记或更新另一个数据集(DataFrame A)中的记录。例如,如果DataFrame A中的某条记录在DataFrame B中存在,我们可能希望将其标记为“已处理”或“开放”,否则标记为“新增”或“未处理”。
准备示例数据
首先,我们定义两个示例DataFrame,data1作为源数据,data2作为参考数据。
import pandas as pd
import numpy as np
# DataFrame 1:源数据
data1 = pd.DataFrame(
{'A': [1, 2, 3, 4, 5],
'B': ['apple', 'banana', 'orange', 'apple', 'grape'],
'C': [10, 20,










