關於 pandas #
發展歷史 #
pandas 於 2008 年在 AQR Capital Management 開始開發。到 2009 年底,它已經 開源,並且今天仍然得到世界各地誌同道合的社群的積極支援,他們貢獻寶貴的時間和精力,幫助開源 pandas 成為可能。感謝 我們所有的貢獻者。
自 2015 年以來,pandas 一直是 NumFOCUS 贊助的專案。這將有助於確保 pandas 作為世界一流的開源專案的發展成功。
時間表 #
- 2008:pandas 開始開發
- 2009:pandas 開源
- 2012:《Python for Data Analysis》第一版出版
- 2015:pandas 成為 NumFOCUS 贊助的專案
- 2018:首次線下核心開發者衝刺
庫亮點 #
-
用於資料操作的快速高效的 DataFrame 物件,帶有整合索引;
-
用於在記憶體資料結構和不同格式之間讀取和寫入資料的工具:CSV 和文字檔案、Microsoft Excel、SQL 資料庫以及快速的 HDF5 格式;
-
智慧的資料對齊和整合的缺失資料處理:在計算中獲得自動基於標籤的對齊,並輕鬆將混亂的資料處理成有序的形式;
-
靈活的資料集重塑和透視;
-
智慧的基於標籤的切片、花式索引和大資料集的子集劃分;
-
可以從資料結構中插入和刪除列以實現大小可變性;
-
透過強大的分組依據引擎對資料進行聚合或轉換,該引擎允許對資料集進行拆分-應用-合併操作;
-
高效能的資料集合併和連線;
-
分層軸索引提供了一種直觀的方式來在較低維度的資料結構中處理高維度資料;
-
時間序列功能:日期範圍生成和頻率轉換、移動視窗統計、日期移位和滯後。甚至可以建立特定域的時間偏移量,並且在不丟失資料的情況下連線時間序列;
-
效能高度最佳化,關鍵程式碼路徑用 Cython 或 C 編寫。
-
Python 結合 pandas 在各種學術和商業領域都有應用,包括金融、神經科學、經濟學、統計學、廣告、網路分析等。
使命 #
pandas 旨在成為用 Python 進行實際、真實世界資料分析的基本高階構建塊。此外,它還有更廣泛的目標,即成為任何語言中最強大、最靈活的開源資料分析/操作工具。
願景 #
一個數據分析和操作軟體的世界,它
- 人人可及
- 使用者免費使用和修改
- 靈活
- 強大
- 易於使用
- 快速
價值觀 #
pandas 的核心是尊重和歡迎所有人,包括使用者、貢獻者和更廣泛的社群。無論經驗水平、性別、性別認同和表達、性取向、殘疾、外表、體型、種族、民族、年齡、宗教或國籍如何。