在构建复杂的面向对象系统时,我们经常会遇到聚合对象(例如一个包含多个子对象的列表或字典的类)需要根据其内部子对象的状态变化来更新自身状态的情况。然而,python的属性(@property和@setter)机制默认只在属性本身被重新赋值时触发,并不能自动感知到属性所引用对象的内部状态变化。
考虑以下场景:我们有一个Dataframe_Builder_Update类,它聚合了一组column_builder对象,并根据这些column_builder生成一个result_df。当我们需要更新某个column_builder的内部属性(例如date)时,我们期望Dataframe_Builder_Update的result_df能够自动重新计算。
import pandas as pd # 假设 ColumnBuilder 是一个简单的类,有 calculated_output 和 group 属性 class ColumnBuilder: def __init__(self, name, data, group=False, date=''): self.name = name self._data = data self.group = group self._date = date self.calculated_output = self._calculate_output() # 初始计算 @property def date(self): return self._date @date.setter def date(self, new_date): self._date = new_date # 实际场景中,这里会触发 calculated_output 的重新计算 print(f"ColumnBuilder '{self.name}' date updated to {new_date}") self.calculated_output = self._calculate_output() # 属性变化时重新计算 def _calculate_output(self): # 实际场景中,这里会根据 _data 和 _date 进行复杂计算 # 简化的 calculated_output 示例 return pd.DataFrame({self.name: [len(self._date) if self._date else 0, 1, 2]}) # 原始的 Dataframe_Builder_Update 类设计 class Dataframe_Builder_Update: def __init__(self, column_builders): self._column_builders = column_builders self.build_dataframe() # 初始构建 def build_dataframe(self): self.result_df = pd.DataFrame() for column_builder in self._column_builders: # 根据 column_builder 的 group 属性决定拼接方式 if not column_builder.group: self.result_df = pd.concat([self.result_df, column_builder.calculated_output], axis=0) elif column_builder.group: self.result_df = pd.concat([self.result_df, column_builder.calculated_output], axis=1) @property def column_builders(self): return self._column_builders @column_builders.setter def column_builders(self, new_column_builders): self._column_builders = new_column_builders self.build_dataframe() # 只有当整个列表被替换时才触发 # 示例使用 col1 = ColumnBuilder('ColA', [1,2,3], date='01/01/2023') col2 = ColumnBuilder('ColB', [4,5,6], group=True, date='01/01/2023') my_arr = [col1, col2] dataframe_builder_obj = Dataframe_Builder_Update(my_arr) print("--- 初始 DataFrame ---") print(dataframe_builder_obj.result_df) # 尝试更新内部 column_builder 的 date 属性 print("\n--- 尝试更新内部对象属性 (期望不会自动更新父级 DataFrame) ---") [setattr(obj, 'date', '12/29/2019') for obj in dataframe_builder_obj.column_builders] print("\n更新内部属性后的 DataFrame (未自动更新):") print(dataframe_builder_obj.result_df) # 此时 result_df 并未更新 # 只有显式调用 build_dataframe() 才能更新 print("\n--- 显式调用 build_dataframe() 后的 DataFrame ---") dataframe_builder_obj.build_dataframe() print(dataframe_builder_obj.result_df)
从上述代码中可以看出,直接修改dataframe_builder_obj.column_builders列表中某个ColumnBuilder对象的date属性,并不会自动触发Dataframe_Builder_Update类内部的build_dataframe()方法。这是因为dataframe_builder_obj.column_builders这个属性本身并没有被重新赋值,仅仅是其引用对象的状态发生了变化。这种“深度”变化无法被Python的属性系统自动感知。
解决方案:分层更新机制为了解决这个问题,我们需要引入一种分层更新机制,即当内部对象状态变化时,能够逐级向上通知或显式触发上层对象的更新
以上就是Python面向对象设计:管理嵌套对象属性变化与自动更新机制的详细内容,更多请关注知识资源分享宝库其它相关文章!
发表评论:
◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。