Python Pandas

Veri analiziyle uğraşan herkesin yolu mutlaka Pandas kütüphanesinden geçer. Python Pandas, yapılandırılmış veriler üzerinde çalışmayı kolaylaştıran bir açık kaynak kütüphanedir. Hem küçük veri kümeleriyle hızlı testler yapmak hem de milyonlarca satır içeren büyük veri setleriyle çalışmak için idealdir.

Veri okuma, temizleme, analiz etme ve görselleştirme gibi adımlarda Pandas adeta bir “İsviçre çakısı” görevi görür.


Python Pandas

Pandas Nasıl Kurulur?

Pandas kütüphanesini yüklemek için terminal ya da komut satırına aşağıdaki komutu yazman yeterlidir:

pip install pandas

Kurulum sonrası Python ortamında doğrudan kullanmaya başlayabilirsin.

import pandas as pd


DataFrame ve Series Nedir?

Pandas’ta iki temel veri yapısı vardır:

  • Series: Tek boyutlu veri yapısıdır (liste gibi düşünebilirsin).
  • DataFrame: Satır ve sütunlardan oluşan, tabloyu andıran veri yapısıdır.
# Series örneği
ser = pd.Series([1, 2, 3, 4])

# DataFrame örneği
veri = {
    'Ad': ['Ahmet', 'Zeynep', 'Furkan'],
    'Yaş': [25, 22, 28]
}
df = pd.DataFrame(veri)


Veri Okuma ve Yazma İşlemleri

En yaygın kullanım alanlarından biri CSV, Excel ve JSON gibi dosyalardan veri okumaktır.

# CSV dosyası okuma
df = pd.read_csv("veriler.csv")

# Excel dosyası okuma
df = pd.read_excel("veriler.xlsx")

# JSON okuma
df = pd.read_json("veriler.json")

# Veri kaydetme
df.to_csv("yeni_veri.csv", index=False)


Veri İnceleme Fonksiyonları

df.head()      # İlk 5 satırı getirir
df.tail()      # Son 5 satırı getirir
df.info()      # Sütun bilgileri
df.describe()  # İstatistiksel özet

Bu fonksiyonlarla veri setinin yapısını hızlıca anlayabilirsin.


Veri Filtreleme ve Sıralama

# Yaşı 25'ten büyük olanları getir
df[df['Yaş'] > 25]

# İsme göre sıralama
df.sort_values(by='Ad')

# Belirli sütunları seçme
df[['Ad', 'Yaş']]


Eksik Verilerle Çalışma

Veri setlerinde eksik veriler sıkça karşılaşılır. Pandas bu konuda güçlü araçlar sunar:

df.isnull().sum()        # Eksik değerleri say
df.dropna()              # Eksik değer içeren satırları sil
df.fillna(0)             # Eksik değerleri 0 ile doldur


Gruplama ve İstatistiksel Analiz

df.groupby('Yaş').mean()       # Yaşa göre ortalama
df['Yaş'].mean()               # Yaşların ortalaması
df['Yaş'].value_counts()       # Her yaşın tekrar sayısı


python pandas kullanımı detaylı anlatım

Pandas, Python dünyasında veriyle çalışmanın temelidir. Özellikle DataFrame yapısı sayesinde veriler üzerinde satır-sütun bazında rahatlıkla işlem yapılabilir. CSV okuma, filtreleme, gruplama, eksik veri temizleme gibi işlemler sadece birkaç satır kodla yapılabilir.

Özellikle veri analizi, makine öğrenimi, finansal analiz gibi alanlarda Pandas olmazsa olmaz bir araçtır. Temel seviyede Pandas kullanmayı öğrenmek bile veriyle çalışırken büyük zaman kazandırır.


Sık Sorulan Sorular

Pandas neden bu kadar popüler?
Çünkü veriyi okuma, filtreleme, analiz etme gibi işlemleri çok kısa ve okunabilir kodlarla yapmanı sağlar.

Pandas hangi alanlarda kullanılır?
Veri analizi, finans, bilimsel araştırmalar, makine öğrenimi, istatistik ve daha fazlası.

DataFrame nedir?
Satır ve sütunlardan oluşan tablo yapısındaki verileri temsil eden ana veri yapısıdır.

Excel dosyasını nasıl okurum?
pd.read_excel("dosya_adı.xlsx") komutu ile kolayca okunabilir.

Pandas öğrenmek zor mu?
Hayır. Temel seviyede öğrenmek oldukça kolaydır. İleri seviye ise zamanla pratikle gelişir.

Pandas ile görselleştirme yapılır mı?
Pandas Matplotlib ve Seaborn gibi kütüphanelerle birlikte kullanılarak görselleştirme yapılabilir.


Sonuç

Veriyle çalışıyorsan, Python Pandas mutlaka öğrenmen gereken bir kütüphane. Veri okuma, analiz, filtreleme ve daha pek çok işlemi kolayca yapabilmeni sağlar. Özellikle büyük veri setleriyle çalışırken Pandas kullanmak seni profesyonel seviyeye bir adım daha yaklaştırır.

guest
0 Yorum
Eskiler
En Yeniler Beğenilenler
Inline Feedbacks
View all comments