
在面向对象编程中,我们经常会遇到这样的场景:一个父级对象包含一个或多个子对象,父级对象的数据结构(例如一个 pandas.dataframe)是基于这些子对象的属性计算得出的。当子对象的某个属性被修改时,我们期望父级对象能够自动感知这一变化并更新其自身的数据结构,而不是需要显式地调用一个更新方法。
考虑以下初始的 Dataframe_Builder_Update 类设计:
import pandas as pd
class Dataframe_Builder_Update():
def __init__(self, column_builders):
self._column_builders = column_builders
self.build_dataframe() # 初始构建DataFrame
def build_dataframe(self):
self.result_df = pd.DataFrame()
for column_builder in self._column_builders:
# 假设 column_builder 有 calculated_output 属性
if not column_builder.group:
self.result_df = pd.concat([self.result_df, column_builder.calculated_output], axis=0)
elif column_builder.group:
self.result_df = pd.concat([self.result_df, column_builder.calculated_output], axis=1)
@property
def column_builders(self):
return self._column_builders
@column_builders.setter
def column_builders(self, new_column_builders):
self._column_builders = new_column_builders
self.build_dataframe() # 当整个 column_builders 列表被替换时触发当 Dataframe_Builder_Update 对象的 column_builders 属性被整体替换时(例如 dataframe_builder_obj.column_builders = new_list),@column_builders.setter 会被触发,进而调用 build_dataframe() 更新 result_df。然而,如果仅仅是 column_builders 列表中某个 column_builder 对象的内部属性(例如 obj.date)发生了变化,@column_builders.setter 不会被触发,result_df 也不会自动更新。
例如,以下操作不会更新 result_df:
# 假设 my_arr 是一个包含 column_builder 对象的列表 # dataframe_builder_obj = Dataframe_Builder_Update(my_arr) # print(dataframe_builder_obj.result_df) # 旧的DataFrame # 修改 column_builder 列表中某个对象的属性 # [setattr(obj, 'date', '12/29/2019') for obj in dataframe_builder_obj.column_builders] # 此时 dataframe_builder_obj.result_df 不会更新 # print(dataframe_builder_obj.result_df) # 仍然是旧的DataFrame
为了解决这个问题,我们需要设计一种机制,使得子对象属性的修改能够通知父级对象进行更新。
立即学习“Python免费学习笔记(深入)”;
核心思想是引入显式的更新方法,并在适当的时机调用它们。对于复杂的对象结构,我们可以采用分层更新的策略。
我们将 Dataframe_Builder_Update 重命名为 Dataframe_Builder,并进行以下改进:
import pandas as pd
class Dataframe_Builder():
def __init__(self, column_builders):
self._column_builders = column_builders
self._result_df = self._build_dataframe() # 初始构建并赋值给内部属性
@property
def column_builders(self):
return self._column_builders
@property
def result_df(self):
"""提供对内部 _result_df 的只读访问"""
return self._result_df
@column_builders.setter
def column_builders(self, new_column_builders):
"""当整个 column_builders 列表被替换时,触发更新"""
self._column_builders = new_column_builders
self.update_dataframe() # 列表变更时更新DataFrame
def _build_dataframe(self):
"""私有方法,负责根据当前 column_builders 列表构建DataFrame"""
result_df = pd.DataFrame()
for obj in self._column_builders:
# 假设 obj 具有 calculated_output 和 group 属性
if not obj.group:
result_df = pd.concat([result_df, obj.calculated_output], axis=0)
elif obj.group:
result_df = pd.concat([result_df, obj.calculated_output], axis=1)
return result_df
def update_dataframe(self):
"""公共方法,用于显式触发DataFrame的重新构建和更新"""
self._result_df = self._build_dataframe()现在,如果 column_builders 列表中的某个子对象属性发生变化,我们需要显式调用 dataframe_builder_obj.update_dataframe() 来刷新 result_df。
当系统变得更复杂,例如一个 Table_Builder 类管理多个 Dataframe_Builder 实例时,我们可以设计一个更高层次的更新方法来协调所有子对象的更新。
class Table_Builder():
def __init__(self, df_builders: list, stack_horizontal=None, stack_vertical=None):
self.df_builders = df_builders # 包含 Dataframe_Builder 对象的列表
self.stack_horizontal = stack_horizontal
self.stack_vertical = stack_vertical
self.result_df = self._build_table(self.stack_horizontal, self.stack_vertical)
def _build_table(self, stack_horizontal=None, stack_vertical=None):
"""私有方法,根据 Dataframe_Builder 列表构建最终的表格"""
result_df = pd.DataFrame()
for obj in self.df_builders:
# 假设 obj 是 Dataframe_Builder 实例,具有 result_df 属性
if stack_vertical:
result_df = pd.concat([result_df, obj.result_df], axis=0)
elif stack_horizontal:
result_df = pd.concat([result_df, obj.result_df], axis=1)
return result_df
def update_dates(self, new_date):
"""
更新所有 Dataframe_Builder 及其内部 column_builder 的日期,
并触发所有相关DataFrame的更新。
"""
for df_obj in self.df_builders:
for col_obj in df_obj.column_builders:
# 假设 col_obj 有 'date' 属性
setattr(col_obj, 'date', new_date)
# 关键:更新 Dataframe_Builder 自身的 DataFrame
df_obj.update_dataframe()
# 最后,重建 Table_Builder 自身的 result_df
self.result_df = self._build_table(self.stack_horizontal, self.stack_vertical)在这个 Table_Builder 类中,update_dates 方法负责:
假设我们有 ColumnBuilder 类(这里未给出,但其 calculated_output 依赖于 date 属性),并且已经创建了 my_column_builders 列表和 my_df_builders 列表。
# 假设 ColumnBuilder 类的简化版本
class ColumnBuilder:
def __init__(self, name, date, group=False):
self.name = name
self._date = date
self.group = group
self._calculate_output()
@property
def date(self):
return self._date
@date.setter
def date(self, new_date):
self._date = new_date
self._calculate_output() # 日期变化时重新计算输出
def _calculate_output(self):
# 模拟根据日期生成DataFrame列
# 实际中这里会有更复杂的计算
self.calculated_output = pd.DataFrame({
self.name: [f"Value for {self.name} on {self.date}"]
})
# 1. 创建 ColumnBuilder 对象
col_builder1 = ColumnBuilder('colA', '2023-01-01')
col_builder2 = ColumnBuilder('colB', '2023-01-01', group=True)
# 2. 创建 Dataframe_Builder 对象列表
df_builder1 = Dataframe_Builder([col_builder1])
df_builder2 = Dataframe_Builder([col_builder2])
my_df_builders = [df_builder1, df_builder2]
# 3. 创建 Table_Builder 对象
table_builder_obj = Table_Builder(my_df_builders, stack_horizontal=True)
print("初始 Table_Builder result_df:")
print(table_builder_obj.result_df)
# 4. 调用 Table_Builder 的 update_dates 方法来更新所有日期
table_builder_obj.update_dates('2023-03-30')
print("\n更新日期后的 Table_Builder result_df:")
print(table_builder_obj.result_df)通过上述示例,我们可以看到,只需要调用 table_builder_obj.update_dates('2023-03-30'),所有嵌套的 column_builder 对象的日期都会被更新,并且 Dataframe_Builder 和 Table_Builder 的 result_df 都会自动重新计算并反映最新的数据。
当处理包含嵌套对象的复杂数据结构时,仅仅依靠 @property.setter 无法实现子对象属性变更时父级对象的自动更新。通过引入显式的更新方法(如 update_dataframe() 和 update_dates()),并采用分层设计的策略,我们可以构建一个清晰、可维护且能够自动响应内部状态变化的系统。这种方法将数据一致性的维护逻辑封装在对象内部,从而避免了外部手动管理复杂更新流程的需要,提升了代码的健壮性和开发效率。
以上就是Python中对象属性变更引发父级数据结构更新的策略与实践的详细内容,更多请关注php中文网其它相关文章!
每个人都需要一台速度更快、更稳定的 PC。随着时间的推移,垃圾文件、旧注册表数据和不必要的后台进程会占用资源并降低性能。幸运的是,许多工具可以让 Windows 保持平稳运行。
Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号