pandas (Software) – Wikipedia

pandas

Basisdaten

Entwickler Wes McKinney, J. Brock Mendel, Joris Van den Bossche, Jeff Reback[1]
Erscheinungsjahr 11. Januar 2008
Aktuelle Version 2.2.3[2]
(20. September 2024)
Betriebssystem Plattformunabhängig
Programmier­sprache Python[3]
Lizenz 3-Klausel-BSD-Lizenz
pandas.pydata.org

pandas ist eine Programmbibliothek für Python zur Verarbeitung, Analyse und Darstellung von Daten. Insbesondere enthält sie Datenstrukturen und Operatoren für den Zugriff auf numerische Tabellen und Zeitreihen. pandas ist Freie Software, veröffentlicht unter der 3-Klausel-BSD-Lizenz. Der Name leitet sich von dem englischen Begriff panel data (Paneldaten) ab, einer ökonometrischen Bezeichnung für Datensätze, die Beobachtungen über mehrere Zeiträume für dieselbe Untersuchungseinheit enthalten.

Der Softwareentwickler Wes McKinney startete mit der Entwicklung 2008, als er ein Werkzeug für die Analyse von Finanzdaten bei AQR Capital brauchte. Bevor er die Firma verließ, überzeugte er seine Vorgesetzten, die Software quelloffen machen zu dürfen. Chang She, ein anderer AQR-Mitarbeiter, wurde 2012 Mitwirkender. Seit 2015 wird das Community-Projekt von NumFOCUS gesponsert und unterstützt.

Kurven

import pandas as pd import matplotlib.pyplot as plt import numpy as np  df = pd.DataFrame(np.random.randn(100, 5), columns=list('ABCDE')) df=df.cumsum() # Return cumulative sum over a DataFrame or Series axis df.plot() plt.show() 

Bar charts

df = pd.DataFrame(np.random.rand(10, 5), columns=list('ABCDE')) df.plot.bar(stacked=True) plt.show() 

Box plot

df = pd.DataFrame(np.random.rand(7, 5), columns=list('ABCDE')) df.plot.box() plt.show() 

Histogram

data = pd.Series(np.random.normal(size=100)) data.hist(grid=False) plt.show() 

Einzelnachweise

[Bearbeiten | Quelltext bearbeiten]
  1. www.youtube.com.
  2. Release 2.2.3. 20. September 2024 (abgerufen am 22. September 2024).
  3. The py-pandas Open Source Project on Open Hub: Languages Page. In: Open Hub. (abgerufen am 14. Juli 2018).