
本文介绍了如何将Python对象列表高效地转换为Pandas DataFrame,重点讲解了利用vars()函数以及处理dataclasses和__slots__类的方法。通过示例代码和详细解释,帮助读者掌握自动化转换技巧,避免手动指定列名,提升数据处理效率。
在数据分析和处理中,经常需要将自定义的Python对象列表转换为Pandas DataFrame,以便进行后续的分析和操作。本文将介绍几种常用的方法,帮助你高效地完成这一转换过程,并避免手动指定列名。
对于简单的类,例如具有属性 name 和 age 的 Person 类,可以使用内置的 vars() 函数将对象转换为字典,然后使用 Pandas DataFrame 构造函数创建 DataFrame。
import pandas as pd
class Person:
def __init__(self, name, age):
self.name = name
self.age = age
person_list = [Person("Mary", 30), Person("John", 32)]
df = pd.DataFrame([vars(p) for p in person_list])
print(df)输出:
立即学习“Python免费学习笔记(深入)”;
name age 0 Mary 30 1 John 32
vars(p) 返回一个包含对象 p 的属性名称和值的字典。通过列表推导式,将 person_list 中的每个 Person 对象转换为字典,然后传递给 pd.DataFrame(),即可创建一个 DataFrame。
如果你的类是使用 dataclasses 模块定义的,特别是嵌套的 dataclasses 或使用了 slots,可以使用 .asdict() 方法将对象转换为字典。
from dataclasses import dataclass, asdict
import pandas as pd
@dataclass
class Person:
name: str
age: int
person_list = [Person("Mary", 30), Person("John", 32)]
df = pd.DataFrame([asdict(p) for p in person_list])
print(df)输出:
立即学习“Python免费学习笔记(深入)”;
name age 0 Mary 30 1 John 32
.asdict() 方法可以递归地将 dataclass 对象转换为字典,方便创建 DataFrame。
如果你的类使用了 __slots__,vars() 方法可能无法正常工作。在这种情况下,可以使用以下方法:
import pandas as pd
class Person:
__slots__ = ('name', 'age')
def __init__(self, name, age):
self.name = name
self.age = age
person_list = [Person("Mary", 30), Person("John", 32)]
df = pd.DataFrame([{a: getattr(p, a) for a in p.__slots__} for p in person_list])
print(df)输出:
立即学习“Python免费学习笔记(深入)”;
name age 0 Mary 30 1 John 32
这个方法通过遍历 p.__slots__ 获取属性名称,然后使用 getattr(p, a) 获取属性值,构建字典,最后创建 DataFrame。
注意事项:
总结:
本文介绍了三种将Python对象列表转换为Pandas DataFrame 的方法,分别适用于不同的类结构。vars() 函数适用于简单的类,.asdict() 方法适用于 dataclasses,而对于带有 __slots__ 的类,则需要使用 getattr() 方法。选择合适的方法可以高效地完成转换,并避免手动指定列名,提高数据处理效率。
以上就是将Python对象列表转换为Pandas DataFrame的实用指南的详细内容,更多请关注php中文网其它相关文章!
每个人都需要一台速度更快、更稳定的 PC。随着时间的推移,垃圾文件、旧注册表数据和不必要的后台进程会占用资源并降低性能。幸运的是,许多工具可以让 Windows 保持平稳运行。
Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号