Özellikleri belirtildiğinde kişilerin diyabet hastası olup olmadıklarını tahmin edebilecek bir makine öğrenmesi modeli geliştirilmesi istenmektedir. Modeli geliştirmeden önce gerekli olan veri analizi ve özellik mühendisliği adımlarını gerçekleştirmeniz beklenmektedir.
Veri seti ABD'deki Ulusal Diyabet-Sindirim-Böbrek Hastalıkları Enstitüleri'nde tutulan büyük veri setinin parçasıdır. ABD'deki Arizona Eyaleti'nin en büyük 5. şehri olan Phoenix şehrinde yaşayan 21 yaş ve üzerinde olan Pima Indian kadınları üzerinde yapılan diyabet araştırması için kullanılan verilerdir. Hedef değişken "outcome" olarak belirtilmiş olup; 1 diyabet test sonucunun pozitif oluşunu, 0 ise negatif oluşunu belirtmektedir.
9 Değişken 768 Gözlem bulunmaktadır.
- Pregnancies = Hamilelik sayısı
- Glucose = Oral glikoz tolerans testinde 2 saatlik plazma glikoz konsantrasyonu
- Blood Pressure = Kan Basıncı (Küçük tansiyon) (mm Hg)
- SkinThickness = Cilt Kalınlığı
- Insulin = 2 saatlik serum insülini (mu U/ml)
- DiabetesPedigreeFunction = Fonksiyon (Oral glikoz tolerans testinde 2 saatlik plazma glikoz konsantrasyonu)
- BMI = Vücut kitle endeksi
- Age = Yaş (yıl)
- Outcome = Hastalığa sahip (1) ya da değil (0)