
在面向对象编程中,我们经常会遇到一个类(父对象)包含一个对象集合(例如列表或字典),而父对象的状态或计算结果又依赖于这些嵌套对象(子对象)的属性。当子对象的某个属性发生变化时,我们期望父对象能够自动感知并更新其依赖于此属性的状态。然而,python的默认机制并不会自动实现这种联动。
考虑以下场景:一个Dataframe_Builder_Update类聚合了一组column_builder对象,并根据这些column_builder的calculated_output来构建一个result_df。当尝试直接修改column_builder对象列表中的某个元素的属性(例如date)时,Dataframe_Builder_Update的result_df并不会自动更新。
import pandas as pd
# 假设 column_builder 是一个具有 'date' 和 'calculated_output' 属性的类
# 为简化示例,这里创建一个模拟类
class ColumnBuilder:
def __init__(self, name, date, data, group=False):
self.name = name
self._date = date
self._data = data
self.group = group
self._calculated_output = self._calculate()
@property
def date(self):
return self._date
@date.setter
def date(self, new_date):
self._date = new_date
self._calculated_output = self._calculate() # 日期变化时重新计算
@property
def calculated_output(self):
return self._calculated_output
def _calculate(self):
# 模拟根据日期和数据生成DataFrame
return pd.DataFrame({self.name: [f"{self._data}_{self._date}"]})
class Dataframe_Builder_Update:
def __init__(self, column_builders):
self._column_builders = column_builders
self.build_dataframe() # 初始化时构建DataFrame
def build_dataframe(self):
self.result_df = pd.DataFrame()
for column_builder in self._column_builders:
if not column_builder.group:
self.result_df = pd.concat([self.result_df, column_builder.calculated_output], axis=0)
elif column_builder.group:
self.result_df = pd.concat([self.result_df, column_builder.calculated_output], axis=1)
@property
def column_builders(self):
return self._column_builders
@column_builders.setter
def column_builders(self, new_column_builders):
# 只有当 _column_builders 列表本身被重新赋值时才会触发此setter
self._column_builders = new_column_builders
self.build_dataframe() # 列表变更时重新构建
# 示例数据
my_arr = [
ColumnBuilder('colA', '12/01/2019', 'data1'),
ColumnBuilder('colB', '12/01/2019', 'data2', group=True)
]
dataframe_builder_obj = Dataframe_Builder_Update(my_arr)
print("原始DataFrame:\n", dataframe_builder_obj.result_df)
# 尝试修改嵌套对象的属性
# 这里的 setattr 修改的是 my_arr 列表中的 ColumnBuilder 对象的 'date' 属性
[setattr(obj, 'date', '12/29/2019') for obj in dataframe_builder_obj.column_builders]
print("\n修改嵌套对象属性后的DataFrame (未自动更新):\n", dataframe_builder_obj.result_df)
# 此时 result_df 仍然是旧数据,因为 Dataframe_Builder_Update 的 build_dataframe() 未被触发上述代码中,尽管ColumnBuilder内部的date.setter会重新计算calculated_output,但Dataframe_Builder_Update的build_dataframe()方法并不会自动执行。这是因为setattr(obj, 'date', ...)操作修改的是dataframe_builder_obj.column_builders列表中的一个元素的属性,而不是dataframe_builder_obj.column_builders这个列表属性本身。因此,@column_builders.setter装饰器定义的setter方法不会被触发。
要解决这个问题,我们需要引入一种显式的更新机制,并在必要时进行分层设计,让高层级的对象负责协调和触发其内部组件的更新。
首先,我们对Dataframe_Builder类进行改进,使其内部的result_df成为一个只读属性,并提供一个独立的update_dataframe方法来显式地重新构建它。
立即学习“Python免费学习笔记(深入)”;
class Dataframe_Builder:
def __init__(self, column_builders):
self._column_builders = column_builders
self._result_df = self.build_dataframe() # 初始化时构建并存储结果
@property
def column_builders(self):
return self._column_builders
@column_builders.setter
def column_builders(self, new_column_builders):
# 当整个 column_builders 列表被替换时,触发更新
self._column_builders = new_column_builders
self.update_dataframe() # 调用更新方法
@property
def result_df(self):
# result_df 作为只读属性,外部访问时直接返回内部存储的结果
return self._result_df
def build_dataframe(self):
"""根据当前的 column_builders 构建 DataFrame。"""
result_df = pd.DataFrame()
for obj in self._column_builders:
if not obj.group:
result_df = pd.concat([result_df, obj.calculated_output], axis=0)
elif obj.group:
result_df = pd.concat([result_df, obj.calculated_output], axis=1)
return result_df
def update_dataframe(self):
"""显式更新内部存储的 result_df。"""
self._result_df = self.build_dataframe()在这个改进版本中:
为了处理更复杂的场景,例如一个更高层级的Table_Builder聚合了多个Dataframe_Builder对象,并且需要统一更新所有嵌套对象的属性,我们可以引入一个协调者类。这个类将负责遍历其内部的Dataframe_Builder对象,并进一步遍历Dataframe_Builder内部的ColumnBuilder对象,然后显式触发必要的更新。
class Table_Builder:
def __init__(self, df_builders: list, stack_horizontal=None, stack_vertical=None):
self.df_builders = df_builders
self.stack_horizontal = stack_horizontal
self.stack_vertical = stack_vertical
self.result_df = self.build_table(self.stack_horizontal, self.stack_vertical)
def build_table(self, stack_horizontal=None, stack_vertical=None):
"""根据内部的 Dataframe_Builder 对象构建最终的表格。"""
result_df = pd.DataFrame()
if not self.df_builders:
return result_df
# 初始化 result_df 为第一个 df_builder 的结果,避免空concat问题
result_df = self.df_builders[0].result_df
for i, obj in enumerate(self.df_builders):
if i == 0: continue # 第一个已初始化
if stack_vertical:
result_df = pd.concat([result_df, obj.result_df], axis=0)
elif stack_horizontal:
result_df = pd.concat([result_df, obj.result_df], axis=1)
return result_df
def update_dates(self, new_date):
"""统一更新所有嵌套的 ColumnBuilder 对象的日期,并触发所有相关 DataFrame 的更新。"""
for df_obj in self.df_builders:
for col_obj in df_obj.column_builders:
# 修改 ColumnBuilder 的日期属性,其内部的 setter 会重新计算 calculated_output
setattr(col_obj, 'date', new_date)
# 显式调用 Dataframe_Builder 的 update_dataframe 方法,使其重新构建 result_df
df_obj.update_dataframe()
# 所有子 Dataframe_Builder 都更新完毕后,重新构建 Table_Builder 自身的 result_df
self.result_df = self.build_table(self.stack_horizontal, self.stack_vertical)在Table_Builder类中:
现在,我们可以使用Table_Builder来管理和更新数据,而无需手动调用底层的方法。
# 示例 ColumnBuilder 对象
col1 = ColumnBuilder('Sales', '01/01/2023', 100)
col2 = ColumnBuilder('Profit', '01/01/2023', 20, group=True)
col3 = ColumnBuilder('Cost', '01/01/2023', 80)
# 示例 Dataframe_Builder 对象
df_builder1 = Dataframe_Builder([col1, col2])
df_builder2 = Dataframe_Builder([col3])
# 创建 Table_Builder 实例,将 df_builder1 和 df_builder2 垂直堆叠
table_builder = Table_Builder([df_builder1, df_builder2], stack_vertical=True)
print("--- 初始状态 ---")
print("df_builder1.result_df:\n", df_builder1.result_df)
print("df_builder2.result_df:\n", df_builder2.result_df)
print("table_builder.result_df:\n", table_builder.result_df)
# 调用 Table_Builder 的 update_dates 方法来更新所有日期
new_date_str = '03/30/2019'
table_builder.update_dates(new_date_str)
print("\n--- 更新日期至 {} 后的状态 ---".format(new_date_str))
print("df_builder1.result_df:\n", df_builder1.result_df)
print("df_builder2.result_df:\n", df_builder2.result_df)
print("table_builder.result_df:\n", table_builder.result_df)
# 验证底层 ColumnBuilder 的日期是否也已更新
print("\n验证底层 ColumnBuilder 的日期:")
print("col1.date:", col1.date)
print("col2.date:", col2.date)
print("col3.date:", col3.date)通过运行上述代码,我们可以观察到:
这表明我们通过显式更新方法和分层设计,成功地实现了当嵌套对象属性变更时,高层级父对象能够自动更新其状态的目标,而无需在每次修改后手动调用多个更新方法。
通过遵循这些原则,开发者可以有效地管理Python中嵌套对象属性变更带来的更新挑战,构建出健壮且易于维护的数据处理系统。
以上就是Python中嵌套对象属性变更时父对象自动更新的策略的详细内容,更多请关注php中文网其它相关文章!
每个人都需要一台速度更快、更稳定的 PC。随着时间的推移,垃圾文件、旧注册表数据和不必要的后台进程会占用资源并降低性能。幸运的是,许多工具可以让 Windows 保持平稳运行。
Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号