Python 数据处理与验证¶
1. 数据处理¶
-
Pandas
Pandas
-
Dask
Dask
-
Polars
Polars
-
FireDucks
FireDucks
-
DuckDB
DuckDB
-
Spout
Spout 用于构建分布式数据流处理应用程序。非常古老的库,不建议学习。
-
MRJob2020
MRJob 用于简化编写和运行 MapReduce 作业。
-
PySpssio2022
PySpssio 允许 Python 用户直接读取 SPSS 数据文件(.sav),并进行数据分析和处理
-
Tablib2022
Tablib 用于创建、操作和导出多种表格格式(如 CSV、XLSX、JSON、HTML 等)。
-
Orjson2022
Orjson 专为高性能而设计的JSON库,它提供了快速的序列化和反序列化功能。
-
ujson
ujson
-
Faust2022
Faust 是一个用于构建流处理应用程序的Python库,已经被废弃。
-
Faust-Streaming
Faust-Streaming 是 Faust 重新实现库。
-
Shiv
Shiv 用于处理 JSON 数据,常作为 WEB 组件使用。