Python ile Makine Öğrenimi | NAN'i (Not a number) Nasıl Manipüle Edilir - P5
İçindekiler:
- Giriş
- Pandas ile Eksik Değerlerle Çalışma
- Series Nedir?
- Eksik Değerleri Kontrol Etme
- Not Null Değerleri Kontrol Etme
- Series'e İşlemsel Eylemler Uygulama
- Veri Setine İlk Bakış
- Eksik Değerleri Manipüle Etme
- Değerleri Başka Bir Değerle Değiştirme
- Sonuç
Giriş
Bu makalede, Python kullanarak eksik verileri nasıl ele alacağımızı öğreteceğim. Öncelikle "Series" kavramının ne olduğunu anlatacağım ve ardından eksik verilerle çalışmayı öğreneceğiz. Bunun için Pandas kütüphanesini kullanacağız.
Pandas ile Eksik Değerlerle Çalışma
Pandas, veri manipülasyonu için sıkça kullanılan bir kütüphanedir. Eksik verilerle çalışırken, bu kütüphanenin sağladığı işlevlerden yararlanacağız.
Series Nedir?
Series, Pandas kütüphanesinde bulunan bir veri yapısıdır. Bir boyutlu etiketli bir dizi olarak tanımlanabilir ve farklı veri tiplerini (sayılar, metinler, vb.) içerebilir. Bu veri yapısının erişim seviyelerine "index" denir.
Eksik Değerleri Kontrol Etme
Eksik değerlerle çalışırken bize yardımcı olacak iki temel fonksiyon "isnull()" ve "notnull()" fonksiyonlarıdır. Her iki fonksiyon da boolean değerler döndürür.
series.isnull()
: Eğer bir değer eksikse, True değeri döndürür.
series.notnull()
: Eğer bir değer eksik değilse, True değeri döndürür.
Not Null Değerleri Kontrol Etme
Eksik olmayan değerleri kontrol etmek için "notnull()" fonksiyonunu kullanabiliriz. Bu fonksiyon da boolean değerler döndürür.
series.notnull()
: Eğer bir değer eksik değilse, True değeri döndürür.
Series'e İşlemsel Eylemler Uygulama
Pandas ile eksik değerleri ele almanın temel yöntemlerini öğrendikten sonra şimdi nasıl işlemler yapabileceğimize bakalım.
Veri Setine İlk Bakış
Öncelikle bir veri setiyle çalışmaya başlamadan önce, veri setinin içeriğini incelemek önemlidir. Bunun için info()
fonksiyonunu kullanabiliriz.
veri_seti.info()
: Veri seti hakkında bilgi sağlar.
Eksik Değerleri Manipüle Etme
Eksik değerleri manipüle etmek için öncelikle veri setimizi içe aktarmamız gerekmektedir. Sonrasında eksik değerleri belirli bir değerle değiştirebiliriz.
veri_seti.isnull().head()
: Eksik değerleri kontrol etmek ve ilk beş veriyi görmek için kullanılır.
veri_seti.replace(ns, yeni_değer)
: Belirli bir değeri eksik değerlerle değiştirmek için kullanılır.
Değerleri Başka Bir Değerle Değiştirme
Veri setindeki değerleri başka bir değerle değiştirmek için replace()
fonksiyonunu kullanabiliriz. Ancak başka bir değer yerine "n" değerini kullanmak istediğimizde dikkatli olmalıyız.
veri_seti.replace("female", np.nan)
: "female" değerini "nan" ile değiştirmek için kullanılır.
Sonuç
Bu makalede, Python kullanarak pandas kütüphanesini kullanarak eksik verileri nasıl ele alabileceğimizi öğrendik. Eksik değerleri kontrol etmek, manipüle etmek ve başka bir değerle değiştirmek için pandas fonksiyonlarını kullanmayı öğrendik. Eksik verilerle başa çıkmak, veri analitiği çalışmalarında oldukça önemlidir.
Not: Makalenin tamamını izlemek için lütfen videoyu izleyin ve kanala abone olmayı unutmayın.