Pandas DataFrame'deki NaN Değerleri İçeren Satırları Kaldırma
Makale Başlığı: Pandas DataFrame'de NaN Değerleri İçeren Satırları Kaldırmak
İçindekiler:
- Giriş
- Pandas ve Python ile DataFrame Oluşturma
- Tüm NaN Değerleri İçeren Satırları Kaldırmak
- Belirli Bir Sütundaki NaN Değerleri İçeren Satırları Kaldırmak
- notna() ve notnull() Fonksiyonlarını Kullanarak NaN Değerleri İçeren Satırları Kaldırmak
- Tüm Değerleri NaN Olan Satırları Kaldırmak
- Belirli Bir Sayıda NaN Değeri İçeren Satırları Kaldırmak
- Özet
- Kaynaklar
1. Giriş
Pandas, Python programlama dilinde veri manipülasyonu için popüler bir kütüphanedir. DataFrame, bu kütüphane içinde bulunan ana veri yapılarından biridir. DataFrame'lerde NaN değerleri içeren satırlar bazen istenmeyen sonuçlara neden olabilir. Bu makalede, Pandas DataFrame'de NaN değerleri içeren satırları nasıl kaldırabileceğinizi öğreneceksiniz.
2. Pandas ve Python ile DataFrame Oluşturma
İlk olarak, pandas kütüphanesini yüklemeliyiz. Bunun için aşağıdaki kodu kullanabilirsiniz:
import pandas as pd
Daha sonra, örnek bir DataFrame oluşturmak için DataFrame yapıcısını kullanabiliriz. Örnek veri kümesi şu şekilde görünmektedir:
X1 |
X2 |
X3 |
1 |
2 |
3 |
NaN |
5 |
6 |
7 |
NaN |
9 |
10 |
11 |
NaN |
NaN |
13 |
14 |
15 |
16 |
NaN |
Bu DataFrame'i oluşturmak için aşağıdaki kodu kullanabilirsiniz:
data = pd.DataFrame({'X1': [1, None, 7, 10, None, 15],
'X2': [2, 5, None, 11, 13, 16],
'X3': [3, 6, 9, None, 14, None]})
print(data)
3. Tüm NaN Değerleri İçeren Satırları Kaldırmak
DataFrame'de NaN değerleri içeren satırları kaldırmak için, dropna()
fonksiyonunu kullanabiliriz. Bu fonksiyon varsayılan olarak, herhangi bir NaN değeri içeren satırları kaldırır ve yeni bir DataFrame döndürür. İlgili kod aşağıdaki gibidir:
data1 = data.dropna()
print(data1)
Bu kod parçasını çalıştırdığınızda, NaN değerleri içeren tüm satırların kaldırıldığı yeni bir DataFrame olan data1
elde edersiniz.
4. Belirli Bir Sütundaki NaN Değerleri İçeren Satırları Kaldırmak
Eğer yalnızca belirli bir sütundaki NaN değerleri içeren satırları kaldırmak isterseniz, dropna()
fonksiyonunu kullanırken subset
parametresini belirtebilirsiniz. İlgili kod örneği şu şekildedir:
data2 = data.dropna(subset=['X2'])
print(data2)
Bu kodu çalıştırdığınızda, yalnızca 'X2' sütununda NaN değeri bulunmayan satırları içeren yeni bir DataFrame olan data2
elde edeceksiniz.
5. notna() ve notnull() Fonksiyonlarını Kullanarak NaN Değerleri İçeren Satırları Kaldırmak
NaN değerleri içeren satırları kaldırmak için dropna()
fonksiyonunun yanı sıra notna()
ve notnull()
fonksiyonlarını da kullanabilirsiniz. Bu fonksiyonlar dropna()
ile benzer sonuçlar üretir, ancak farklı bir sözdizimi kullanır. İlgili örnekler aşağıda verilmiştir:
data3 = data[data['X2'].notna()]
print(data3)
data4 = data[data['X2'].notnull()]
print(data4)
Bu kodları çalıştırdığınızda, 'X2' sütununda NaN değeri bulunmayan satırları içeren yeni DataFrame'ler olan data3
ve data4
elde edersiniz.
6. Tüm Değerleri NaN Olan Satırları Kaldırmak
Eğer tüm değerleri NaN olan satırları kaldırmak isterseniz, dropna()
fonksiyonunu kullanırken how
parametresini "all"
olarak belirtmelisiniz. İlgili kod parçası şu şekildedir:
data31 = data.dropna(how='all')
print(data31)
Bu kodu çalıştırdığınızda, tüm değerleri NaN olan satırların kaldırıldığı yeni bir DataFrame olan data31
elde edersiniz.
7. Belirli Bir Sayıda NaN Değeri İçeren Satırları Kaldırmak
Eğer yalnızca belli bir sayıda NaN değeri içeren satırları kalmak isterseniz, dropna()
fonksiyonunda thresh
parametresini belirlemeniz gerekmektedir. Bu parametre ile en az kaç tane non-NaN değeri içeren satırları tutmak istediğinizi belirtebilirsiniz. İlgili kod örneği aşağıda verilmiştir:
data4 = data.dropna(thresh=2)
print(data4)
Bu kodu çalıştırdığınızda, en az iki geçerli değer içeren satırları içeren yeni bir DataFrame olan data4
elde edeceksiniz.
8. Özet
Bu makalede, pandas DataFrame'deki NaN değerlerini içeren satırları nasıl kaldırabileceğinizi öğrendiniz. Özetle, dropna()
fonksiyonu ve notna()
, notnull()
fonksiyonları bu işlemi gerçekleştirmek için yaygın olarak kullanılan yöntemlerdir.
9. Kaynaklar