
本文旨在解决在使用 Pandas 的 `isin` 方法,结合 `datetime` 类型数据进行条件筛选时,遇到的 `False` 结果问题。通过分析问题的根本原因,即 `Timestamp.date` 属性返回的是一个绑定方法而非日期对象,本文提供了修改 `Plate` 类定义中 `date` 属性的处理方式,并给出了示例代码,确保日期匹配的正确性。
在使用 Pandas 处理时间序列数据时,经常需要根据日期进行数据筛选。isin 方法是 Pandas 中一个非常方便的函数,可以用于判断 Series 中的元素是否包含在给定的列表中。然而,当涉及到 datetime 类型的数据时,如果不注意一些细节,可能会导致 isin 方法返回错误的结果,即始终为 False。
问题分析
问题的核心在于 pandas.Timestamp 对象的 date 属性。df["Record Date"].dt.date 返回的并不是一个 datetime.date 对象的 Series,而是一个包含绑定方法的 Series。具体来说,每个元素都是 <bound method Timestamp.date of Timestamp('...')>,这表示 date 属性还没有被调用,它只是一个方法。因此,直接使用 isin 方法与 datetime.date 对象列表进行比较,会导致类型不匹配,从而返回 False。
解决方案
解决办法是在 Plate 类的定义中,确保 self.date 存储的是 datetime.date 对象,而不是 datetime 对象。
原始代码中,Plate 类的 __init__ 方法中关于 date 属性的处理可能存在问题。例如,如果 date 是一个 datetime 对象,直接赋值 self.date = date.date,这会导致 self.date 成为一个绑定方法。
应该在类定义中确保调用 .date() 方法,将 datetime 对象转换为 date 对象:
from datetime import datetime
from dateutil.parser import parse
import pandas as pd
import numpy as np
class Plate:
def __init__(self, ..., date=None):
# ... (其他初始化代码)
if date is not None:
if isinstance(date, str):
self.date = [parse(date).date()] # 将字符串解析为 datetime 对象,然后提取 date 部分
elif isinstance(date, list) or isinstance(date, tuple):
if all((isinstance(item, str) or isinstance(item, datetime)) for item in date):
self.date = [parse(item).date() if isinstance(item, str) else item.date() for item in date] # 提取 date 部分
else:
raise TypeError("The data type of the elements in the date list/tuple must be datetime or strings.")
elif isinstance(date, datetime):
self.date = [date.date()] # 提取 date 部分
else:
raise TypeError("The data type of parameter date must be datetime.date, string (containing date) or list/tuple (of dates/strings).")
else:
self.date = [] # 初始化为空列表,方便后续判断
# 示例数据
data = {'Record Date': pd.to_datetime(['2023-12-01 17:16:00', '2023-12-06 10:00:00', '2023-12-08 12:00:00']),
'Well Name': ['A1', 'B2', 'C3']}
df = pd.DataFrame(data)
# 创建 Plate 对象
plate = Plate(date=['2023-12-01', '2023-12-06']) # 使用字符串初始化 date
# 使用 isin 进行日期匹配
if hasattr(plate, "date") and plate.date: # 确保 plate.date 存在且不为空
condition = df["Record Date"].dt.date.isin(plate.date)
else:
condition = df["Well Name"] != None
df.loc[condition, ["sample_type", "index", "initial_measurement"]] = [('type1', 1, True), ('type2', 2, False), ('type3', 3, True)][:len(df.loc[condition])] # 简化赋值
df = df.astype({"sample_type": str, "index": pd.Int64Dtype(), "initial_measurement": bool})
print(df)
代码解释:
注意事项
总结
通过确保 plate.date 存储的是 datetime.date 对象,可以解决在使用 Pandas 的 isin 方法进行日期匹配时返回 False 的问题。在处理时间序列数据时,需要注意数据类型的一致性,避免类型不匹配导致的问题。 此外,代码中增加了对 plate.date 存在性的判断,增加了代码的健壮性。
以上就是使用 Pandas 的 isin 方法进行日期匹配时返回 False 的问题解决的详细内容,更多请关注php中文网其它相关文章!
每个人都需要一台速度更快、更稳定的 PC。随着时间的推移,垃圾文件、旧注册表数据和不必要的后台进程会占用资源并降低性能。幸运的是,许多工具可以让 Windows 保持平稳运行。
Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号