2.3.3 版本新增內容 (2025 年 9 月 29 日)#
這些是 pandas 2.3.3 版本中的更改。有關包括其他 pandas 版本在內的完整變更日誌,請參閱 釋出說明。
Pandas 2.3.3 現在與 Python 3.14 相容#
Pandas 2.3.3 是第一個與即將推出的 Python 3.14 版本相容的 pandas 版本。在此版本中,將在所有平臺上為常規 Python 3.14 上傳 wheel 包,而為免費執行緒 Python 3.14 準備的 wheel 包僅適用於 Linux 和 macOS。
一如既往,請將發現的任何 bug 報告給我們 問題跟蹤器
對 StringDtype 的改進和修復#
此版本的大部分更改都與 StringDtype 相關,該型別將在 pandas 3.0 中成為預設的字串 dtype。有關更多詳細資訊,請參閱 pandas 3.0 的即將進行的更改。
改進#
更新
DataFrame.select_dtypes(),當指定include=["object"]以保持向後相容性時,它將繼續選擇str列。在未來的版本中,此行為將被棄用,pandas 3+ 的程式碼應更新為使用include=["str"](GH 61916)支援
pathlib.Path物件和StringDtypeSeries 之間的/操作,這與物件 dtype Series 的工作方式類似 (GH 61940)
Bug 修復#
修復了在使用 Arrow 後端的 dtype 時,
Series.str.replace()使用命名捕獲組(例如\g<name>)時會引發錯誤的 bug (GH 57636)修復了
Series.str.contains()、match()和fullmatch()使用編譯後的正則表示式和自定義標誌時的迴歸錯誤 (GH 62240)修復了 Arrow 後端的字串 dtype 中
Series.str.match()和fullmatch()無法正確匹配帶組的模式的 bug (GH 61072)修復了在
groupby()和sum()操作中,未觀察到的類別導致結果為0而非空字串""的 bug (GH 61909)修復了
Series.str.isdigit()對於由 PyArrow 支援的StringDtype無法正確識別 unicode 上標字元為數字的 bug (GH 61466)修復了比較一個
StringDtypeSeries 與混合物件時引發錯誤的 bug (GH 60228)修復了在使用 numpy ufunc 時,帶有 Python 後端字串陣列會引發錯誤的 bug (GH 40800)
其他更改#
之前棄用的使用
Series.resample()和DataFrame.resample()結合PeriodIndex(以及 'convention' 關鍵字引數)的操作已恢復。現在可以再次支援使用PeriodIndex進行重取樣,但在 pandas 3.0 中,一部分會返回錯誤結果的方法將引發錯誤 (GH 57033)
其他 bug 修復#
修復了
DataFrame.to_json()使用 datetime 列時的記憶體洩漏問題 (GH 62204)修復了
DataFrame.from_records()未正確初始化子類導致的迴歸錯誤 (GH 57008)當在 `copy_on_write` 選項下,對同質 DataFrame 的列進行子集劃分後分配值時,
DataFrame.iloc()現在可以正確工作了 (GH 60309)
貢獻者#
共有 15 人為本次釋出貢獻了補丁。名字旁有“+”號的人是首次貢獻補丁。
邱志霖
Evgenii Mosikhin +
Ian Hunt-Isaak +
Joris Van den Bossche
Laurie O +
Lumberbot (aka Jack)
Matthew Roeschke
Nathan Goldbaum
Patrick Hoefler
Richard Shadrach
Scott Talbert
jbrockmendel
pandas 開發團隊
ptth222 +
Álvaro Kothe +