Podcast
Questions and Answers
Pandas kütüphanesi hangi temel kütüphane üzerine inşa edilmiştir ve özellikle hangi veri yapılarını içerir?
Pandas kütüphanesi hangi temel kütüphane üzerine inşa edilmiştir ve özellikle hangi veri yapılarını içerir?
- Numpy; seriler ve DataFrameler (correct)
- Seaborn; istatistiksel modeller ve seriler
- Scikit-learn; vektörler ve matrisler
- Matplotlib; grafikler ve çizimler
Aşağıdaki kod bloğu Pandas kütüphanesini kullanmak için nasıl içe aktarılır?
Aşağıdaki kod bloğu Pandas kütüphanesini kullanmak için nasıl içe aktarılır?
- `import pandas as pd` (correct)
- `from pandas import *`
- `import Pandas`
- `using Pandas as pd`
Pandas'ta tek boyutlu bir veri yapısı oluşturmak için hangi fonksiyon kullanılır?
Pandas'ta tek boyutlu bir veri yapısı oluşturmak için hangi fonksiyon kullanılır?
- `pd.list()`
- `pd.array()`
- `pd.DataFrame()`
- `pd.Series()` (correct)
CSV dosyasından veri okuyup bir DataFrame'e dönüştürmek için hangi Pandas fonksiyonu kullanılır?
CSV dosyasından veri okuyup bir DataFrame'e dönüştürmek için hangi Pandas fonksiyonu kullanılır?
Aşağıdaki Pandas fonksiyonlarından hangisi Excel dosyasından veri okumak için kullanılır?
Aşağıdaki Pandas fonksiyonlarından hangisi Excel dosyasından veri okumak için kullanılır?
Pandas serilerinde, ilk elemanın indisi nedir?
Pandas serilerinde, ilk elemanın indisi nedir?
Aşağıdaki kodun çıktısı ne olur?
import pandas as pd
seri1 = pd.Series([2018, 'Makine Öğrenmesi', -5.23])
print(seri1[1])
Aşağıdaki kodun çıktısı ne olur?
import pandas as pd
seri1 = pd.Series([2018, 'Makine Öğrenmesi', -5.23])
print(seri1[1])
Pandas serilerinde, özel indisler nasıl tanımlanır?
Pandas serilerinde, özel indisler nasıl tanımlanır?
NumPy kütüphanesindeki listelerin dilimlenmesi işlemleri Pandas serileri için geçerli midir?
NumPy kütüphanesindeki listelerin dilimlenmesi işlemleri Pandas serileri için geçerli midir?
Aşağıdaki Python veri türlerinden hangisi Pandas serisine dönüştürülebilir ve elemanları değiştirilebilir, sırasız ve indisli bir yapıya sahiptir?
Aşağıdaki Python veri türlerinden hangisi Pandas serisine dönüştürülebilir ve elemanları değiştirilebilir, sırasız ve indisli bir yapıya sahiptir?
Pandas serisinde bir elemanın var olup olmadığını kontrol etmek için hangi operatör kullanılır?
Pandas serisinde bir elemanın var olup olmadığını kontrol etmek için hangi operatör kullanılır?
Pandas serileri üzerinde matematiksel işlemler yapılabilir mi?
Pandas serileri üzerinde matematiksel işlemler yapılabilir mi?
Pandas serisi içindeki benzersiz (unique) değerleri tespit etmek için hangi fonksiyon kullanılır?
Pandas serisi içindeki benzersiz (unique) değerleri tespit etmek için hangi fonksiyon kullanılır?
Bir Pandas serisinde her bir değerin kaç kez tekrar ettiğini öğrenmek için hangi fonksiyon kullanılır?
Bir Pandas serisinde her bir değerin kaç kez tekrar ettiğini öğrenmek için hangi fonksiyon kullanılır?
Pandas'ta DataFrame nesnesi temel olarak neyi temsil eder?
Pandas'ta DataFrame nesnesi temel olarak neyi temsil eder?
DataFrame oluştururken sütunları temsil eden Pandas nesnesi hangisidir?
DataFrame oluştururken sütunları temsil eden Pandas nesnesi hangisidir?
Pandas'ta bir DataFrame hakkında genel bilgileri (sütun türleri, eksik değer sayıları vb.) görüntülemek için hangi fonksiyon kullanılır?
Pandas'ta bir DataFrame hakkında genel bilgileri (sütun türleri, eksik değer sayıları vb.) görüntülemek için hangi fonksiyon kullanılır?
Pandas'ta bir DataFrame'in sayısal sütunları için temel istatistiksel bilgileri (ortalama, standart sapma vb.) hangi fonksiyon gösterir?
Pandas'ta bir DataFrame'in sayısal sütunları için temel istatistiksel bilgileri (ortalama, standart sapma vb.) hangi fonksiyon gösterir?
Pandas DataFrame'de, belirli bir koşulu sağlayan satırları seçmek için hangi yöntem kullanılır?
Pandas DataFrame'de, belirli bir koşulu sağlayan satırları seçmek için hangi yöntem kullanılır?
Makine öğrenmesi uygulamalarında veri setleri hangi formatlarda bulunabilir ve Pandas ile nasıl işlenir?
Makine öğrenmesi uygulamalarında veri setleri hangi formatlarda bulunabilir ve Pandas ile nasıl işlenir?
Pandas kullanarak verileri dataframe
nesnelerine dönüştürmenin temel amacı nedir?
Pandas kullanarak verileri dataframe
nesnelerine dönüştürmenin temel amacı nedir?
Korelasyon analizinin temel amacı nedir?
Korelasyon analizinin temel amacı nedir?
Aşağıdakilerden hangisi korelasyon katsayısının alabileceği değer aralığını doğru şekilde ifade eder?
Aşağıdakilerden hangisi korelasyon katsayısının alabileceği değer aralığını doğru şekilde ifade eder?
Veri setindeki öznitelikler arasındaki korelasyonu görselleştirmek için hangi kütüphane ve fonksiyon kullanılır?
Veri setindeki öznitelikler arasındaki korelasyonu görselleştirmek için hangi kütüphane ve fonksiyon kullanılır?
Pozitif korelasyon ne anlama gelir?
Pozitif korelasyon ne anlama gelir?
Korelasyon matrisinde, bir değişkenin kendisiyle olan korelasyon değeri her zaman kaçtır?
Korelasyon matrisinde, bir değişkenin kendisiyle olan korelasyon değeri her zaman kaçtır?
Hangi durumda iki değişken arasında anlamlı bir ilişki olmadığı söylenebilir?
Hangi durumda iki değişken arasında anlamlı bir ilişki olmadığı söylenebilir?
Aşağıdakilerden hangisi One-Hot Encoding yönteminin temel amacıdır?
Aşağıdakilerden hangisi One-Hot Encoding yönteminin temel amacıdır?
Titanic veri setinde 'Embarked' sütunu hangi tür verileri içerir ve bu sütunun One-Hot Encoding ile dönüştürülmesinin nedeni nedir?
Titanic veri setinde 'Embarked' sütunu hangi tür verileri içerir ve bu sütunun One-Hot Encoding ile dönüştürülmesinin nedeni nedir?
Aşağıdaki kodlardan hangisi Pandas DataFrame'indeki sayısal sütunları seçmek için kullanılır?
Aşağıdaki kodlardan hangisi Pandas DataFrame'indeki sayısal sütunları seçmek için kullanılır?
Yüksek korelasyonlu değişkenlerin modellenmesinde dikkate alınması gereken temel neden nedir?
Yüksek korelasyonlu değişkenlerin modellenmesinde dikkate alınması gereken temel neden nedir?
Bir veri setinde korelasyon analizi yapıldıktan sonra, hangi durumlarda değişken seçimi yapılması önerilir?
Bir veri setinde korelasyon analizi yapıldıktan sonra, hangi durumlarda değişken seçimi yapılması önerilir?
Aşağıdaki Pandas fonksiyonlarından hangisi bir DataFrame'in ilk birkaç satırını görüntülemek için kullanılır?
Aşağıdaki Pandas fonksiyonlarından hangisi bir DataFrame'in ilk birkaç satırını görüntülemek için kullanılır?
Pandas DataFrame'de belirli bir sütundaki değerlere göre filtreleme yapmak için hangi yöntem kullanılır?
Pandas DataFrame'de belirli bir sütundaki değerlere göre filtreleme yapmak için hangi yöntem kullanılır?
Pandas DataFrame üzerinde hangi tür matematiksel işlemler yapılabilir?
Pandas DataFrame üzerinde hangi tür matematiksel işlemler yapılabilir?
Seaborn kütüphanesi temel olarak ne için kullanılır?
Seaborn kütüphanesi temel olarak ne için kullanılır?
Aşağıdaki kodlardan hangisi Seaborn ile bir korelasyon matrisini ısı haritası (heatmap) olarak çizmek için kullanılır?
Aşağıdaki kodlardan hangisi Seaborn ile bir korelasyon matrisini ısı haritası (heatmap) olarak çizmek için kullanılır?
Korelasyon matrisinde 'annot=True' parametresi ne anlama gelir?
Korelasyon matrisinde 'annot=True' parametresi ne anlama gelir?
Pandas kütüphanesi ile ilgili aşağıdaki ifadelerden hangisi yanlıştır?
Pandas kütüphanesi ile ilgili aşağıdaki ifadelerden hangisi yanlıştır?
Aşağıdakilerden hangisi Pandas kütüphanesinin özelliklerinden biri değildir?
Aşağıdakilerden hangisi Pandas kütüphanesinin özelliklerinden biri değildir?
Aşağıdaki kod parçacığının üreteceği çıktı nedir?
import pandas as pd
data = {'isim': ['Ahmet', 'Mehmet', 'Ayşe'], 'yaş': [25, 30, 28]}
df = pd.DataFrame(data)
print(df['isim'])
Aşağıdaki kod parçacığının üreteceği çıktı nedir?
import pandas as pd
data = {'isim': ['Ahmet', 'Mehmet', 'Ayşe'], 'yaş': [25, 30, 28]}
df = pd.DataFrame(data)
print(df['isim'])
Aşağıdaki kod parçacığı ne iş yapar?
import pandas as pd
df = pd.read_csv('dosya.csv')
ortalama_yaş = df['yaş'].mean()
Aşağıdaki kod parçacığı ne iş yapar?
import pandas as pd
df = pd.read_csv('dosya.csv')
ortalama_yaş = df['yaş'].mean()
Aşağıdakilerden hangisi Pandas kütüphanesinin temel özelliklerinden biri değildir?
Aşağıdakilerden hangisi Pandas kütüphanesinin temel özelliklerinden biri değildir?
Pandas DataFrame'de, belirli bir sütundaki benzersiz değerleri ve bu değerlerin tekrar sayılarını eş zamanlı olarak elde etmek için hangi fonksiyonlar birlikte kullanılır?
Pandas DataFrame'de, belirli bir sütundaki benzersiz değerleri ve bu değerlerin tekrar sayılarını eş zamanlı olarak elde etmek için hangi fonksiyonlar birlikte kullanılır?
Aşağıdaki kod bloğunun çıktısı ne olur?
import pandas as pd
seri = pd.Series([15, 20, 25, 30], index=['a', 'b', 'c', 'd'])
print(seri[['c', 'a']])
Aşağıdaki kod bloğunun çıktısı ne olur?
import pandas as pd
seri = pd.Series([15, 20, 25, 30], index=['a', 'b', 'c', 'd'])
print(seri[['c', 'a']])
Aşağıdaki kodlardan hangisi, Titanic veri setindeki sayısal sütunlar arasındaki korelasyon matrisini hesaplayıp, bu matrisi Seaborn kütüphanesi ile bir ısı haritası (heatmap) olarak görselleştirmek için doğru sıralamayı takip eder?
Aşağıdaki kodlardan hangisi, Titanic veri setindeki sayısal sütunlar arasındaki korelasyon matrisini hesaplayıp, bu matrisi Seaborn kütüphanesi ile bir ısı haritası (heatmap) olarak görselleştirmek için doğru sıralamayı takip eder?
Pandas DataFrame'de query()
fonksiyonu ne işe yarar?
Pandas DataFrame'de query()
fonksiyonu ne işe yarar?
Bir Pandas DataFrame'inde, belirli iki sütun arasındaki korelasyon katsayısı -0.85 olarak hesaplanmıştır. Bu ne anlama gelir?
Bir Pandas DataFrame'inde, belirli iki sütun arasındaki korelasyon katsayısı -0.85 olarak hesaplanmıştır. Bu ne anlama gelir?
Aşağıdaki kod parçasının amacı nedir?
import pandas as pd
df = pd.read_csv('titanic.csv')
df['Cinsiyet'] = df['Sex'].map({'male': 0, 'female': 1})
Aşağıdaki kod parçasının amacı nedir?
import pandas as pd
df = pd.read_csv('titanic.csv')
df['Cinsiyet'] = df['Sex'].map({'male': 0, 'female': 1})
Bir veri setinde yüksek korelasyona sahip iki değişken tespit edildiğinde, modelleme sürecinde hangi yaklaşım en uygun olur?
Bir veri setinde yüksek korelasyona sahip iki değişken tespit edildiğinde, modelleme sürecinde hangi yaklaşım en uygun olur?
Pandas DataFrame'de, bir sütunun belirli bir eşik değerini aşan satırlarını seçmek için aşağıdaki yöntemlerden hangisi en etkilidir?
Pandas DataFrame'de, bir sütunun belirli bir eşik değerini aşan satırlarını seçmek için aşağıdaki yöntemlerden hangisi en etkilidir?
Aşağıdaki kodlardan hangisi, Pandas DataFrame'deki belirli bir sütunun ortalama değerini hesaplar?
Aşağıdaki kodlardan hangisi, Pandas DataFrame'deki belirli bir sütunun ortalama değerini hesaplar?
Pandas kütüphanesinde One-Hot Encoding yöntemi hangi amaçla kullanılır?
Pandas kütüphanesinde One-Hot Encoding yöntemi hangi amaçla kullanılır?
Aşağıdaki kod bloğunun çıktısı nedir?
import pandas as pd
seri = pd.Series([10, 20, 30, 40, 50])
print(seri > 25)
Aşağıdaki kod bloğunun çıktısı nedir?
import pandas as pd
seri = pd.Series([10, 20, 30, 40, 50])
print(seri > 25)
Pandas DataFrame'de hangi fonksiyon, sayısal sütunlar için standart sapma, ortalama, minimum ve maksimum gibi temel istatistiksel özetleri hesaplar?
Pandas DataFrame'de hangi fonksiyon, sayısal sütunlar için standart sapma, ortalama, minimum ve maksimum gibi temel istatistiksel özetleri hesaplar?
Aşağıdaki kod parçasının çıktısı ne olur?
import pandas as pd
df = pd.DataFrame({'A': [1, 2, 3], 'B': [4, 5, 6]})
print(df.head(2))
Aşağıdaki kod parçasının çıktısı ne olur?
import pandas as pd
df = pd.DataFrame({'A': [1, 2, 3], 'B': [4, 5, 6]})
print(df.head(2))
Pandas'ta bir DataFrame oluştururken, her sütunun aynı uzunlukta olması gerekli midir ve bunun temel nedeni nedir?
Pandas'ta bir DataFrame oluştururken, her sütunun aynı uzunlukta olması gerekli midir ve bunun temel nedeni nedir?
Flashcards
Pandas Kütüphanesi nedir?
Pandas Kütüphanesi nedir?
Numpy kütüphanesi üzerine kurulmuş, seri ve dataframe gibi kullanışlı veri yapılarına sahip açık kaynaklı bir Python kütüphanesidir.
pd.Series() nedir?
pd.Series() nedir?
Tek boyutlu bir veri yapısıdır, etiketli verileri saklar.
pd.DataFrame() nedir?
pd.DataFrame() nedir?
Çok boyutlu bir veri yapısıdır, sütunlar ve satırlar içerir.
pd.read_csv() ne işe yarar?
pd.read_csv() ne işe yarar?
Signup and view all the flashcards
pd.read_excel() ne yapar?
pd.read_excel() ne yapar?
Signup and view all the flashcards
pd.read_sql() fonksiyonu?
pd.read_sql() fonksiyonu?
Signup and view all the flashcards
Pandas serileri nedir?
Pandas serileri nedir?
Signup and view all the flashcards
Serilerde indisleme nasıl yapılır?
Serilerde indisleme nasıl yapılır?
Signup and view all the flashcards
Özel indisli seriler?
Özel indisli seriler?
Signup and view all the flashcards
Serilerde dilimleme?
Serilerde dilimleme?
Signup and view all the flashcards
Dictionary nedir?
Dictionary nedir?
Signup and view all the flashcards
Seride eleman kontrolü?
Seride eleman kontrolü?
Signup and view all the flashcards
Serilerde matematik?
Serilerde matematik?
Signup and view all the flashcards
Serilerde filtreleme?
Serilerde filtreleme?
Signup and view all the flashcards
unique() fonksiyonu?
unique() fonksiyonu?
Signup and view all the flashcards
value_counts() ne işe yarar?
value_counts() ne işe yarar?
Signup and view all the flashcards
DataFrame nedir?
DataFrame nedir?
Signup and view all the flashcards
DataFrame oluşturma yöntemi?
DataFrame oluşturma yöntemi?
Signup and view all the flashcards
head(), tail() fonksiyonları?
head(), tail() fonksiyonları?
Signup and view all the flashcards
info() fonksiyonu?
info() fonksiyonu?
Signup and view all the flashcards
describe() fonksiyonu?
describe() fonksiyonu?
Signup and view all the flashcards
DataFrame kullanım amacı?
DataFrame kullanım amacı?
Signup and view all the flashcards
DataFrame ne için kullanılır?
DataFrame ne için kullanılır?
Signup and view all the flashcards
DataFrame nasıl oluşturulur?
DataFrame nasıl oluşturulur?
Signup and view all the flashcards
DataFrame hangi kaynaklarla çalışır?
DataFrame hangi kaynaklarla çalışır?
Signup and view all the flashcards
Excel verilerini okuma?
Excel verilerini okuma?
Signup and view all the flashcards
Korelasyon nedir?
Korelasyon nedir?
Signup and view all the flashcards
Pozitif korelasyon?
Pozitif korelasyon?
Signup and view all the flashcards
Negatif korelasyon?
Negatif korelasyon?
Signup and view all the flashcards
Sıfıra yakın korelasyon?
Sıfıra yakın korelasyon?
Signup and view all the flashcards
Korelasyon matrisi nasıl oluşturulur?
Korelasyon matrisi nasıl oluşturulur?
Signup and view all the flashcards
veri_seti.corr() ne yapar?
veri_seti.corr() ne yapar?
Signup and view all the flashcards
Korelasyon matrisini görselleştirme?
Korelasyon matrisini görselleştirme?
Signup and view all the flashcards
Embarked sütunu ne içerir?
Embarked sütunu ne içerir?
Signup and view all the flashcards
One-Hot Encoding nedir?
One-Hot Encoding nedir?
Signup and view all the flashcards
Verileri dataframe nesnelerine dönüştürmek neden önemlidir?
Verileri dataframe nesnelerine dönüştürmek neden önemlidir?
Signup and view all the flashcards
Study Notes
- MBP206-Yapay Zeka Uygulamalarında Temel Kavramlar ders notları, Ders 4: Pandas-Matplotlib kütüphanesidir.
Pandas Kütüphanesi
- Numpy üzerine inşa edilmiş, açık kaynaklı bir Python kütüphanesidir. Seri ve DataFrame gibi kullanışlı veri yapılarına sahiptir.
import pandas as pd
şeklinde çağrılır.
Pandas Fonksiyonları
pd.Series()
tek boyutlu bir Series veri yapısı oluşturur.pd.DataFrame()
çok boyutlu bir DataFrame veri yapısı oluşturur.pd.read_csv()
CSV dosyasından veri okur ve DataFrame'e dönüştürür.pd.read_excel()
Excel dosyasından veri okur.pd.read_sql()
veritabanından veri okur.- Pandas Kütüphanesini kullanmak için
import pandas as pd
kodu dizine eklenir. - Series oluşturma örneği:
s = pd.Series([10, 20, 30, 40, 50])
. - DataFrame oluşturma örneği:
data = {'Name': ['Alice', 'Bob', 'Charlie'], 'Age': [25, 30, 22]}; df = pd.DataFrame(data)
. - CSV dosyasından veri okuma örneği:
csv_data = pd.read_csv('data.csv')
. - Excel dosyasından veri okuma örneği:
excel_data = pd.read_excel('data.xlsx')
.
Seriler
- Herhangi bir tipteki veriyi saklayabilen, sakladığı verilere etiket verilebilen tek boyutlu dizilere benzer nesnelerdir.
- Her eleman indis değeri alır ve ilk elemanın indisi sıfırdır.
- Örnek:
seri1 = pd.Series([2018, 'Makine Öğrenmesi', -5.23])
üç elemanlı bir seri oluşturur. print(seri1[0])
sadece 0. elemanı yazdırır.- Seriler oluşturulurken özel bir indis belirlenebilir.
- Bir elemana erişmek için ilgili indis değeri kullanılır.
- NumPy kütüphanesindeki listelerin dilimlenmesi işlemleri seriler için de geçerlidir.
- Python'daki Dictionary veri türü, seri nesnesine dönüştürülebilir.
- Bir seride bir elemanın olup olmadığı,
True
veyaFalse
döndüren bir kodla belirlenebilir. - Seriler üzerinde matematiksel işlemler yapılabilir ve fonksiyonlara parametre olarak verilebilir.
- Seri içinde filtreleme yapılabilir.
- Bir seride en az bir kez geçen veriler
unique()
fonksiyonu ile bulunur. - Her verinin seride kaç kez geçtiği
value_counts()
fonksiyonu ile belirlenebilir.
DataFrame Yapıları
- Satır indis etiketleri, sütun adları ve hücre değerlerini içeren elektronik tablo yapısıdır. Excel sayfalarına benzer.
- Sütunlar seriler ile oluşturulmuş bir sözlük nesnesi ile oluşturulabilir.
- Pandas'ta bir DataFrame oluşturmak için genellikle bir sözlük (dictionary) kullanılır.
- Her sözlük anahtarı (key) bir sütun adı olur ve değerleri (values) bir liste ya da Series olarak saklanır.
Veri Gözlemleme Fonksiyonları
head()
vetail()
DataFrame'in ilk veya son birkaç satırını gösterir.info()
DataFrame hakkında bilgi, sütun türleri ve eksik değer sayıları gibi detayları görüntüler.describe()
sayısal sütunlar için temel istatistiksel bilgileri gösterir.- DataFrame'de belirli koşulları sağlayan öğrencileri yazdırma örneği:
print(tablo[tablo["ortalama"] < 93])
ortalaması 93'ten küçük olan öğrencileri ekrana yazdırır. - DataFrame oluşturma, filtreleme ve yazdırma işlemleri örneklerle açıklanmıştır.
Makine Öğrenmesi Uygulamaları için DataFrame
- Onlarca sütun ve binlerce satırdan oluşan veri setleri ile çalışmak gerekebilir.
- Veriler; veritabanı, Excel veya metin dosyalarından alınabilir.
- DataFrame, Pandas kütüphanesinde çok boyutlu veri depolamak için kullanılır.
- Dictionary veya Pandas Series nesneleri ile oluşturulabildiği, her sütunun farklı veri türleri içerebildiği ve Excel, SQL, CSV gibi kaynaklarla uyumlu olduğu belirtilmiştir.
- Pandas kütüphanesinde okunabilecek veri formatları:
- CSV için
read_csv()
- JSON için
read_json()
- HTML için
read_html()
- MS Excel için
read_excel()
- CSV için
Excel Verilerinin Okunması
- Pandas kütüphanesi aracılığı ile Excel dosyalarındaki veri setleri okunabilir.
- Titanic veri setindeki yolcuların bilgilerini ve hayatta kalma durumlarını hesaplamada kullanılan bazı öznitelikler şunlardır:
- PassengerId: Yolcunun benzersiz kimlik numarası.
- Survived: Hayatta kalma durumu (0 = Hayır, 1 = Evet).
- Pclass: Yolcu sınıfı (1 = Birinci sınıf, 2 = İkinci sınıf, 3 = Üçüncü sınıf).
- Name: Yolcunun adı.
- Sex: Cinsiyet (male = erkek, female = kadın).
- Age: Yolcunun yaşı.
- SibSp: Gemideki kardeş ve eş sayısı.
- Parch: Gemideki ebeveyn ve çocuk sayısı.
- Ticket: Bilet numarası.
- Fare: Ödenen bilet ücreti.
- Cabin: Kabin numarası (bazı değerler eksik).
- Embarked: Yolcunun bindiği liman (C = Cherbourg, Q = Queenstown, S = Southampton).
Nitelik (Öznitelik) Arasındaki Korelasyon
- Korelasyon, bir veri setindeki nitelikler arasındaki ilişkinin olup olmadığını ve varsa nasıl olduğunu belirten istatistiksel bir ölçümdür.
- Korelasyon katsayısı -1 ile +1 arasında değişir.
- Pozitif korelasyon: Bir değişken artarken diğeri de artıyorsa.
- Negatif korelasyon: Bir değişken artarken diğeri azalıyorsa.
- Sıfıra yakın korelasyon: İki değişken arasında anlamlı bir ilişki olmadığını gösterir.
- Korelasyon matrisinde, aynı niteliklerin kesişim değeri her zaman 1'dir.
- Korelasyon matrisinin görselleştirilmesi için Seaborn kütüphanesi kullanılabilir ve
df.corr()
fonksiyonu ile oluşturulur. - Yüksek korelasyona (0.9 ve üzeri) sahip nitelikler, modelleme sürecinde dikkatle ele alınmalıdır.
- Kategorik verilerin sayısal hale getirilmesi için
map()
fonksiyonu ve One-Hot Encoding kullanılabilir. - One-Hot Encoding, kategorik değişkenleri sayısal hale getirme yöntemidir; her kategori ayrı bir sütuna dönüştürülür ve 0 veya 1 ile kodlanır.
Bölüm Özeti
- Makine öğrenmesi uygulamalarında kullanılan veri setleri, farklı formatlardaki dosyalardan elde edilebilir ve Pandas kütüphanesi ile DataFrame'e dönüştürülebilir.
- Veri setindeki öznitelikler arasındaki ilişkinin olup olmadığını istatistiksel olarak belirlemek için korelasyon analizi yapılır.
- Korelasyon matrisini görselleştirmek için Seaborn kütüphanesi kullanılır ve
heatmap()
fonksiyonu ile korelasyon matrisleri grafiksel olarak sunulabilir.
Uygulama Yapılacak!!!
- imdb.csv dosyasını Pandas ile okuyunuz.
- Dosya hakkında genel bilgileri görüntüleyiniz. (.info() ve .describe() fonksiyonları)
- İlk 5 kaydı görüntüleyiniz.
- İlk 10 kaydı görüntüleyiniz.
- Son 5 kaydı görüntüleyiniz.
- Son 10 kaydı görüntüleyiniz.
- Sadece Movie_Title kolonunu seçerek listeleyiniz.
- Sadece Movie_Title kolonunu içeren ilk 5 kaydı listeleyiniz.
- Movie_Title ve Rating kolonlarını seçerek, son 7 kaydı listeleyiniz.
- Movie_Title ve Rating kolonlarını içeren ve IMDb puanı 8.0 ve üzerinde olan ilk 50 kaydı listeleyiniz.
- Yayın tarihi 2014 ile 2015 arasında olan filmlerin isimlerini listeleyiniz.
- Num_Review değeri 100.000’den büyük olan veya IMDb puanı 8 ile 9 arasında olan filmleri listeleyiniz.
Studying That Suits You
Use AI to generate personalized quizzes and flashcards to suit your learning preferences.