MBP206 Ders 4: Pandas-Matplotlib Kütüphanesi

Choose a study mode

Play Quiz
Study Flashcards
Spaced Repetition
Chat to Lesson

Podcast

Play an AI-generated podcast conversation about this lesson
Download our mobile app to listen on the go
Get App

Questions and Answers

Pandas kütüphanesi hangi temel kütüphane üzerine inşa edilmiştir ve özellikle hangi veri yapılarını içerir?

  • Numpy; seriler ve DataFrameler (correct)
  • Seaborn; istatistiksel modeller ve seriler
  • Scikit-learn; vektörler ve matrisler
  • Matplotlib; grafikler ve çizimler

Aşağıdaki kod bloğu Pandas kütüphanesini kullanmak için nasıl içe aktarılır?

  • `import pandas as pd` (correct)
  • `from pandas import *`
  • `import Pandas`
  • `using Pandas as pd`

Pandas'ta tek boyutlu bir veri yapısı oluşturmak için hangi fonksiyon kullanılır?

  • `pd.list()`
  • `pd.array()`
  • `pd.DataFrame()`
  • `pd.Series()` (correct)

CSV dosyasından veri okuyup bir DataFrame'e dönüştürmek için hangi Pandas fonksiyonu kullanılır?

<p><code>pd.read_csv()</code> (B)</p>
Signup and view all the answers

Aşağıdaki Pandas fonksiyonlarından hangisi Excel dosyasından veri okumak için kullanılır?

<p><code>pd.read_excel()</code> (B)</p>
Signup and view all the answers

Pandas serilerinde, ilk elemanın indisi nedir?

<p>0 (B)</p>
Signup and view all the answers

Aşağıdaki kodun çıktısı ne olur?

import pandas as pd seri1 = pd.Series([2018, 'Makine Öğrenmesi', -5.23]) print(seri1[1])

<p>'Makine Öğrenmesi' (C)</p>
Signup and view all the answers

Pandas serilerinde, özel indisler nasıl tanımlanır?

<p>Seri oluşturulurken <code>index</code> parametresi ile (D)</p>
Signup and view all the answers

NumPy kütüphanesindeki listelerin dilimlenmesi işlemleri Pandas serileri için geçerli midir?

<p>Evet, geçerlidir (D)</p>
Signup and view all the answers

Aşağıdaki Python veri türlerinden hangisi Pandas serisine dönüştürülebilir ve elemanları değiştirilebilir, sırasız ve indisli bir yapıya sahiptir?

<p>Dictionary (B)</p>
Signup and view all the answers

Pandas serisinde bir elemanın var olup olmadığını kontrol etmek için hangi operatör kullanılır?

<p><code>in</code> (A)</p>
Signup and view all the answers

Pandas serileri üzerinde matematiksel işlemler yapılabilir mi?

<p>Evet, yapılabilir (A)</p>
Signup and view all the answers

Pandas serisi içindeki benzersiz (unique) değerleri tespit etmek için hangi fonksiyon kullanılır?

<p><code>unique()</code> (C)</p>
Signup and view all the answers

Bir Pandas serisinde her bir değerin kaç kez tekrar ettiğini öğrenmek için hangi fonksiyon kullanılır?

<p><code>value_counts()</code> (C)</p>
Signup and view all the answers

Pandas'ta DataFrame nesnesi temel olarak neyi temsil eder?

<p>Çok boyutlu bir tablo yapısı (A)</p>
Signup and view all the answers

DataFrame oluştururken sütunları temsil eden Pandas nesnesi hangisidir?

<p>Series (C)</p>
Signup and view all the answers

Pandas'ta bir DataFrame hakkında genel bilgileri (sütun türleri, eksik değer sayıları vb.) görüntülemek için hangi fonksiyon kullanılır?

<p><code>info()</code> (A)</p>
Signup and view all the answers

Pandas'ta bir DataFrame'in sayısal sütunları için temel istatistiksel bilgileri (ortalama, standart sapma vb.) hangi fonksiyon gösterir?

<p><code>describe()</code> (A)</p>
Signup and view all the answers

Pandas DataFrame'de, belirli bir koşulu sağlayan satırları seçmek için hangi yöntem kullanılır?

<p>Köşeli parantez içinde koşul belirtme (<code>df[df['sütun'] &gt; değer]</code>) (D)</p>
Signup and view all the answers

Makine öğrenmesi uygulamalarında veri setleri hangi formatlarda bulunabilir ve Pandas ile nasıl işlenir?

<p>CSV, XLS, JSON gibi formatlarda bulunabilir ve Pandas ile <code>dataframe</code>'e dönüştürülebilir. (B)</p>
Signup and view all the answers

Pandas kullanarak verileri dataframe nesnelerine dönüştürmenin temel amacı nedir?

<p>Veri setini tanıma ve makine öğrenmesi tekniklerine hazırlık (B)</p>
Signup and view all the answers

Korelasyon analizinin temel amacı nedir?

<p>İki veya daha fazla değişken arasındaki doğrusal ilişkiyi belirlemek (A)</p>
Signup and view all the answers

Aşağıdakilerden hangisi korelasyon katsayısının alabileceği değer aralığını doğru şekilde ifade eder?

<p>-1 ile +1 arasında (A)</p>
Signup and view all the answers

Veri setindeki öznitelikler arasındaki korelasyonu görselleştirmek için hangi kütüphane ve fonksiyon kullanılır?

<p>Seaborn ve <code>heatmap()</code> (D)</p>
Signup and view all the answers

Pozitif korelasyon ne anlama gelir?

<p>Bir değişken artarken diğeri de artar (A)</p>
Signup and view all the answers

Korelasyon matrisinde, bir değişkenin kendisiyle olan korelasyon değeri her zaman kaçtır?

<p>1 (B)</p>
Signup and view all the answers

Hangi durumda iki değişken arasında anlamlı bir ilişki olmadığı söylenebilir?

<p>Korelasyon 0'a yakınsa (D)</p>
Signup and view all the answers

Aşağıdakilerden hangisi One-Hot Encoding yönteminin temel amacıdır?

<p>Kategorik verileri sayısal verilere dönüştürmek (A)</p>
Signup and view all the answers

Titanic veri setinde 'Embarked' sütunu hangi tür verileri içerir ve bu sütunun One-Hot Encoding ile dönüştürülmesinin nedeni nedir?

<p>Kategorik veriler içerir; makine öğrenmesi algoritmalarıyla kullanılabilmesi için dönüştürülür. (D)</p>
Signup and view all the answers

Aşağıdaki kodlardan hangisi Pandas DataFrame'indeki sayısal sütunları seçmek için kullanılır?

<p><code>df.select_dtypes(include=['number'])</code> (B)</p>
Signup and view all the answers

Yüksek korelasyonlu değişkenlerin modellenmesinde dikkate alınması gereken temel neden nedir?

<p>Çoklu doğrusallık sorununu önlemek (A)</p>
Signup and view all the answers

Bir veri setinde korelasyon analizi yapıldıktan sonra, hangi durumlarda değişken seçimi yapılması önerilir?

<p>Belirli değişkenler arasında yüksek korelasyon varsa (A)</p>
Signup and view all the answers

Aşağıdaki Pandas fonksiyonlarından hangisi bir DataFrame'in ilk birkaç satırını görüntülemek için kullanılır?

<p><code>head()</code> (A)</p>
Signup and view all the answers

Pandas DataFrame'de belirli bir sütundaki değerlere göre filtreleme yapmak için hangi yöntem kullanılır?

<p><code>df[df['sütun_adı'] koşul]</code> (B)</p>
Signup and view all the answers

Pandas DataFrame üzerinde hangi tür matematiksel işlemler yapılabilir?

<p>Toplama, çıkarma, çarpma, bölme ve daha fazlası (B)</p>
Signup and view all the answers

Seaborn kütüphanesi temel olarak ne için kullanılır?

<p>Veri görselleştirme (A)</p>
Signup and view all the answers

Aşağıdaki kodlardan hangisi Seaborn ile bir korelasyon matrisini ısı haritası (heatmap) olarak çizmek için kullanılır?

<p><code>sns.heatmap(df.corr())</code> (C)</p>
Signup and view all the answers

Korelasyon matrisinde 'annot=True' parametresi ne anlama gelir?

<p>Korelasyon değerlerini hücreler üzerinde gösterir (D)</p>
Signup and view all the answers

Pandas kütüphanesi ile ilgili aşağıdaki ifadelerden hangisi yanlıştır?

<p>Pandas, sadece sayısal verilerle çalışabilir. (A)</p>
Signup and view all the answers

Aşağıdakilerden hangisi Pandas kütüphanesinin özelliklerinden biri değildir?

<p>Derin öğrenme modelleme (B)</p>
Signup and view all the answers

Aşağıdaki kod parçacığının üreteceği çıktı nedir?

import pandas as pd data = {'isim': ['Ahmet', 'Mehmet', 'Ayşe'], 'yaş': [25, 30, 28]} df = pd.DataFrame(data) print(df['isim'])

<p><code>['Ahmet', 'Mehmet', 'Ayşe']</code> (C)</p>
Signup and view all the answers

Aşağıdaki kod parçacığı ne iş yapar?

import pandas as pd df = pd.read_csv('dosya.csv') ortalama_yaş = df['yaş'].mean()

<p>'dosya.csv' adlı dosyayı okur ve DataFrame'deki 'yaş' sütununun ortalamasını hesaplar. (D)</p>
Signup and view all the answers

Aşağıdakilerden hangisi Pandas kütüphanesinin temel özelliklerinden biri değildir?

<p>Sadece metin dosyalarıyla (txt) doğrudan çalışabilmesi. (C)</p>
Signup and view all the answers

Pandas DataFrame'de, belirli bir sütundaki benzersiz değerleri ve bu değerlerin tekrar sayılarını eş zamanlı olarak elde etmek için hangi fonksiyonlar birlikte kullanılır?

<p><code>unique()</code> ve <code>value_counts()</code> (A)</p>
Signup and view all the answers

Aşağıdaki kod bloğunun çıktısı ne olur?

import pandas as pd
seri = pd.Series([15, 20, 25, 30], index=['a', 'b', 'c', 'd'])
print(seri[['c', 'a']])

<pre><code>c 25 a 15 dtype: int64 ``` (C) </code></pre>
Signup and view all the answers

Aşağıdaki kodlardan hangisi, Titanic veri setindeki sayısal sütunlar arasındaki korelasyon matrisini hesaplayıp, bu matrisi Seaborn kütüphanesi ile bir ısı haritası (heatmap) olarak görselleştirmek için doğru sıralamayı takip eder?

<p><code>sns.heatmap(df.corr(), annot=True); plt.show()</code> (B)</p>
Signup and view all the answers

Pandas DataFrame'de query() fonksiyonu ne işe yarar?

<p>DataFrame üzerinde SQL benzeri sorgular çalıştırmaya yarar. (B)</p>
Signup and view all the answers

Bir Pandas DataFrame'inde, belirli iki sütun arasındaki korelasyon katsayısı -0.85 olarak hesaplanmıştır. Bu ne anlama gelir?

<p>Bu iki sütun arasında güçlü bir negatif yönlü ilişki vardır. (D)</p>
Signup and view all the answers

Aşağıdaki kod parçasının amacı nedir?

import pandas as pd
df = pd.read_csv('titanic.csv')
df['Cinsiyet'] = df['Sex'].map({'male': 0, 'female': 1})

<p><code>titanic.csv</code> dosyasını okuyarak <code>df</code> adında bir DataFrame oluşturmak ve 'Cinsiyet' adında yeni bir sütun eklemek. (B)</p>
Signup and view all the answers

Bir veri setinde yüksek korelasyona sahip iki değişken tespit edildiğinde, modelleme sürecinde hangi yaklaşım en uygun olur?

<p>Sadece bir değişkeni modelde kullanmak ve diğerini çıkarmak, çünkü yüksek korelasyon çoklu doğrusallık sorununa yol açabilir. (D)</p>
Signup and view all the answers

Pandas DataFrame'de, bir sütunun belirli bir eşik değerini aşan satırlarını seçmek için aşağıdaki yöntemlerden hangisi en etkilidir?

<p>Doğrudan sütun üzerinde koşullu filtreleme yapmak (örneğin, <code>df[df['sütun_adı'] &gt; eşik_değeri]</code>). (A)</p>
Signup and view all the answers

Aşağıdaki kodlardan hangisi, Pandas DataFrame'deki belirli bir sütunun ortalama değerini hesaplar?

<p><code>df['sütun_adı'].mean()</code> (B)</p>
Signup and view all the answers

Pandas kütüphanesinde One-Hot Encoding yöntemi hangi amaçla kullanılır?

<p>Kategorik değişkenleri sayısal verilere dönüştürmek için. (D)</p>
Signup and view all the answers

Aşağıdaki kod bloğunun çıktısı nedir?

import pandas as pd
seri = pd.Series([10, 20, 30, 40, 50])
print(seri > 25)

<p>Her eleman için 25'ten büyük olup olmadığını gösteren boolean değerleri. (D)</p>
Signup and view all the answers

Pandas DataFrame'de hangi fonksiyon, sayısal sütunlar için standart sapma, ortalama, minimum ve maksimum gibi temel istatistiksel özetleri hesaplar?

<p><code>describe()</code> (C)</p>
Signup and view all the answers

Aşağıdaki kod parçasının çıktısı ne olur?

import pandas as pd
df = pd.DataFrame({'A': [1, 2, 3], 'B': [4, 5, 6]})
print(df.head(2))

<p>DataFrame'in ilk 2 satırını gösterir. (C)</p>
Signup and view all the answers

Pandas'ta bir DataFrame oluştururken, her sütunun aynı uzunlukta olması gerekli midir ve bunun temel nedeni nedir?

<p>Evet, aksi takdirde ValueError hatası alınır; çünkü DataFrame, her satırda tutarlı bir veri yapısı gerektirir. (B)</p>
Signup and view all the answers

Flashcards

Pandas Kütüphanesi nedir?

Numpy kütüphanesi üzerine kurulmuş, seri ve dataframe gibi kullanışlı veri yapılarına sahip açık kaynaklı bir Python kütüphanesidir.

pd.Series() nedir?

Tek boyutlu bir veri yapısıdır, etiketli verileri saklar.

pd.DataFrame() nedir?

Çok boyutlu bir veri yapısıdır, sütunlar ve satırlar içerir.

pd.read_csv() ne işe yarar?

CSV dosyasından veriyi okur ve DataFrame'e dönüştürür.

Signup and view all the flashcards

pd.read_excel() ne yapar?

Excel dosyasından veriyi okur.

Signup and view all the flashcards

pd.read_sql() fonksiyonu?

Veritabanından veriyi okur.

Signup and view all the flashcards

Pandas serileri nedir?

Seriler, farklı tipteki verileri saklayabilen tek boyutlu dizilere benzer.

Signup and view all the flashcards

Serilerde indisleme nasıl yapılır?

Seri içindeki her eleman indis değeri alır. İlk elemanın indisi sıfırdır.

Signup and view all the flashcards

Özel indisli seriler?

Alternatif olarak, seriler oluşturulurken özel bir indis belirlenebilir.

Signup and view all the flashcards

Serilerde dilimleme?

NumPy kütüphanesindeki dilimleme işlemleri seriler için de geçerlidir.

Signup and view all the flashcards

Dictionary nedir?

Python'daki değiştirilebilir, sırasız veri yapısıdır, seriye dönüştürülebilir.

Signup and view all the flashcards

Seride eleman kontrolü?

Seri içinde bir elemanın olup olmadığını kontrol eder ve True/False döndürür.

Signup and view all the flashcards

Serilerde matematik?

Seriler üzerinde matematiksel işlemler yapılabilir.

Signup and view all the flashcards

Serilerde filtreleme?

Seri içinde filtreleme yapılabilir.

Signup and view all the flashcards

unique() fonksiyonu?

Bir seri içinde en az bir kez geçen verileri tespit eder.

Signup and view all the flashcards

value_counts() ne işe yarar?

Her verinin seri içinde kaç kez geçtiğini belirler.

Signup and view all the flashcards

DataFrame nedir?

Satır indis etiketleri, sütun adları ve hücre değerlerini içeren elektronik tablo yapısıdır.

Signup and view all the flashcards

DataFrame oluşturma yöntemi?

DataFrame oluşturmak için sütunları seriler ile oluşturulmuş bir dictionary kullanılır.

Signup and view all the flashcards

head(), tail() fonksiyonları?

DataFrame'in ilk veya son birkaç satırını gösterir.

Signup and view all the flashcards

info() fonksiyonu?

DataFrame hakkında bilgi, sütun türleri ve eksik değer sayıları gibi detayları gösterir.

Signup and view all the flashcards

describe() fonksiyonu?

Sayısal sütunlar için temel istatistiksel bilgileri gösterir.

Signup and view all the flashcards

DataFrame kullanım amacı?

Makine öğrenmesi uygulamalarında kullanılan veri setleri ile çalışmayı sağlar.

Signup and view all the flashcards

DataFrame ne için kullanılır?

Çok boyutlu veri depolamak için kullanılır.

Signup and view all the flashcards

DataFrame nasıl oluşturulur?

Dictionary veya Pandas Series nesneleri ile oluşturulabilir.

Signup and view all the flashcards

DataFrame hangi kaynaklarla çalışır?

Excel, SQL, CSV gibi veri kaynakları ile çalışmaya uygundur.

Signup and view all the flashcards

Excel verilerini okuma?

Excel dosyasındaki veri seti, pandas aracı ile okunur.

Signup and view all the flashcards

Korelasyon nedir?

Bir veri setinde özellikler arasındaki ilişkinin gücünü ve yönünü ölçer.

Signup and view all the flashcards

Pozitif korelasyon?

Bir değişken artarken diğeri de artıyorsa.

Signup and view all the flashcards

Negatif korelasyon?

Bir değişken artarken diğeri azalıyorsa.

Signup and view all the flashcards

Sıfıra yakın korelasyon?

İki değişken arasında anlamlı bir ilişki olmadığını gösterir.

Signup and view all the flashcards

Korelasyon matrisi nasıl oluşturulur?

df.corr() fonksiyonu kullanılır.

Signup and view all the flashcards

veri_seti.corr() ne yapar?

Veri setindeki değişkenler arasındaki korelasyon değerlerini gösterir.

Signup and view all the flashcards

Korelasyon matrisini görselleştirme?

Seaborn kütüphanesi kullanılabilir.

Signup and view all the flashcards

Embarked sütunu ne içerir?

Titanic veri setinde Embarked sütunu C, Q, S gibi kategorik değerler içerir.

Signup and view all the flashcards

One-Hot Encoding nedir?

Kategorik değişkenleri sayısal hale getirme yöntemidir.

Signup and view all the flashcards

Verileri dataframe nesnelerine dönüştürmek neden önemlidir?

Pandas kullanarak verilerin dataframe nesnelerine dönüştürülmesi, makine öğrenmesi teknikleri uygulanmadan önce veri setini tanıma sürecinin temel bir adımıdır.

Signup and view all the flashcards

Study Notes

  • MBP206-Yapay Zeka Uygulamalarında Temel Kavramlar ders notları, Ders 4: Pandas-Matplotlib kütüphanesidir.

Pandas Kütüphanesi

  • Numpy üzerine inşa edilmiş, açık kaynaklı bir Python kütüphanesidir. Seri ve DataFrame gibi kullanışlı veri yapılarına sahiptir.
  • import pandas as pd şeklinde çağrılır.

Pandas Fonksiyonları

  • pd.Series() tek boyutlu bir Series veri yapısı oluşturur.
  • pd.DataFrame() çok boyutlu bir DataFrame veri yapısı oluşturur.
  • pd.read_csv() CSV dosyasından veri okur ve DataFrame'e dönüştürür.
  • pd.read_excel() Excel dosyasından veri okur.
  • pd.read_sql() veritabanından veri okur.
  • Pandas Kütüphanesini kullanmak için import pandas as pd kodu dizine eklenir.
  • Series oluşturma örneği: s = pd.Series([10, 20, 30, 40, 50]).
  • DataFrame oluşturma örneği: data = {'Name': ['Alice', 'Bob', 'Charlie'], 'Age': [25, 30, 22]}; df = pd.DataFrame(data).
  • CSV dosyasından veri okuma örneği: csv_data = pd.read_csv('data.csv').
  • Excel dosyasından veri okuma örneği: excel_data = pd.read_excel('data.xlsx').

Seriler

  • Herhangi bir tipteki veriyi saklayabilen, sakladığı verilere etiket verilebilen tek boyutlu dizilere benzer nesnelerdir.
  • Her eleman indis değeri alır ve ilk elemanın indisi sıfırdır.
  • Örnek: seri1 = pd.Series([2018, 'Makine Öğrenmesi', -5.23]) üç elemanlı bir seri oluşturur.
  • print(seri1[0]) sadece 0. elemanı yazdırır.
  • Seriler oluşturulurken özel bir indis belirlenebilir.
  • Bir elemana erişmek için ilgili indis değeri kullanılır.
  • NumPy kütüphanesindeki listelerin dilimlenmesi işlemleri seriler için de geçerlidir.
  • Python'daki Dictionary veri türü, seri nesnesine dönüştürülebilir.
  • Bir seride bir elemanın olup olmadığı, True veya False döndüren bir kodla belirlenebilir.
  • Seriler üzerinde matematiksel işlemler yapılabilir ve fonksiyonlara parametre olarak verilebilir.
  • Seri içinde filtreleme yapılabilir.
  • Bir seride en az bir kez geçen veriler unique() fonksiyonu ile bulunur.
  • Her verinin seride kaç kez geçtiği value_counts() fonksiyonu ile belirlenebilir.

DataFrame Yapıları

  • Satır indis etiketleri, sütun adları ve hücre değerlerini içeren elektronik tablo yapısıdır. Excel sayfalarına benzer.
  • Sütunlar seriler ile oluşturulmuş bir sözlük nesnesi ile oluşturulabilir.
  • Pandas'ta bir DataFrame oluşturmak için genellikle bir sözlük (dictionary) kullanılır.
  • Her sözlük anahtarı (key) bir sütun adı olur ve değerleri (values) bir liste ya da Series olarak saklanır.

Veri Gözlemleme Fonksiyonları

  • head() ve tail() DataFrame'in ilk veya son birkaç satırını gösterir.
  • info() DataFrame hakkında bilgi, sütun türleri ve eksik değer sayıları gibi detayları görüntüler.
  • describe() sayısal sütunlar için temel istatistiksel bilgileri gösterir.
  • DataFrame'de belirli koşulları sağlayan öğrencileri yazdırma örneği: print(tablo[tablo["ortalama"] < 93]) ortalaması 93'ten küçük olan öğrencileri ekrana yazdırır.
  • DataFrame oluşturma, filtreleme ve yazdırma işlemleri örneklerle açıklanmıştır.

Makine Öğrenmesi Uygulamaları için DataFrame

  • Onlarca sütun ve binlerce satırdan oluşan veri setleri ile çalışmak gerekebilir.
  • Veriler; veritabanı, Excel veya metin dosyalarından alınabilir.
  • DataFrame, Pandas kütüphanesinde çok boyutlu veri depolamak için kullanılır.
  • Dictionary veya Pandas Series nesneleri ile oluşturulabildiği, her sütunun farklı veri türleri içerebildiği ve Excel, SQL, CSV gibi kaynaklarla uyumlu olduğu belirtilmiştir.
  • Pandas kütüphanesinde okunabilecek veri formatları:
    • CSV için read_csv()
    • JSON için read_json()
    • HTML için read_html()
    • MS Excel için read_excel()

Excel Verilerinin Okunması

  • Pandas kütüphanesi aracılığı ile Excel dosyalarındaki veri setleri okunabilir.
  • Titanic veri setindeki yolcuların bilgilerini ve hayatta kalma durumlarını hesaplamada kullanılan bazı öznitelikler şunlardır:
    • PassengerId: Yolcunun benzersiz kimlik numarası.
    • Survived: Hayatta kalma durumu (0 = Hayır, 1 = Evet).
    • Pclass: Yolcu sınıfı (1 = Birinci sınıf, 2 = İkinci sınıf, 3 = Üçüncü sınıf).
    • Name: Yolcunun adı.
    • Sex: Cinsiyet (male = erkek, female = kadın).
    • Age: Yolcunun yaşı.
    • SibSp: Gemideki kardeş ve eş sayısı.
    • Parch: Gemideki ebeveyn ve çocuk sayısı.
    • Ticket: Bilet numarası.
    • Fare: Ödenen bilet ücreti.
    • Cabin: Kabin numarası (bazı değerler eksik).
    • Embarked: Yolcunun bindiği liman (C = Cherbourg, Q = Queenstown, S = Southampton).

Nitelik (Öznitelik) Arasındaki Korelasyon

  • Korelasyon, bir veri setindeki nitelikler arasındaki ilişkinin olup olmadığını ve varsa nasıl olduğunu belirten istatistiksel bir ölçümdür.
  • Korelasyon katsayısı -1 ile +1 arasında değişir.
    • Pozitif korelasyon: Bir değişken artarken diğeri de artıyorsa.
    • Negatif korelasyon: Bir değişken artarken diğeri azalıyorsa.
    • Sıfıra yakın korelasyon: İki değişken arasında anlamlı bir ilişki olmadığını gösterir.
  • Korelasyon matrisinde, aynı niteliklerin kesişim değeri her zaman 1'dir.
  • Korelasyon matrisinin görselleştirilmesi için Seaborn kütüphanesi kullanılabilir ve df.corr() fonksiyonu ile oluşturulur.
  • Yüksek korelasyona (0.9 ve üzeri) sahip nitelikler, modelleme sürecinde dikkatle ele alınmalıdır.
  • Kategorik verilerin sayısal hale getirilmesi için map() fonksiyonu ve One-Hot Encoding kullanılabilir.
  • One-Hot Encoding, kategorik değişkenleri sayısal hale getirme yöntemidir; her kategori ayrı bir sütuna dönüştürülür ve 0 veya 1 ile kodlanır.

Bölüm Özeti

  • Makine öğrenmesi uygulamalarında kullanılan veri setleri, farklı formatlardaki dosyalardan elde edilebilir ve Pandas kütüphanesi ile DataFrame'e dönüştürülebilir.
  • Veri setindeki öznitelikler arasındaki ilişkinin olup olmadığını istatistiksel olarak belirlemek için korelasyon analizi yapılır.
  • Korelasyon matrisini görselleştirmek için Seaborn kütüphanesi kullanılır ve heatmap() fonksiyonu ile korelasyon matrisleri grafiksel olarak sunulabilir.

Uygulama Yapılacak!!!

  • imdb.csv dosyasını Pandas ile okuyunuz.
  • Dosya hakkında genel bilgileri görüntüleyiniz. (.info() ve .describe() fonksiyonları)
  • İlk 5 kaydı görüntüleyiniz.
  • İlk 10 kaydı görüntüleyiniz.
  • Son 5 kaydı görüntüleyiniz.
  • Son 10 kaydı görüntüleyiniz.
  • Sadece Movie_Title kolonunu seçerek listeleyiniz.
  • Sadece Movie_Title kolonunu içeren ilk 5 kaydı listeleyiniz.
  • Movie_Title ve Rating kolonlarını seçerek, son 7 kaydı listeleyiniz.
  • Movie_Title ve Rating kolonlarını içeren ve IMDb puanı 8.0 ve üzerinde olan ilk 50 kaydı listeleyiniz.
  • Yayın tarihi 2014 ile 2015 arasında olan filmlerin isimlerini listeleyiniz.
  • Num_Review değeri 100.000’den büyük olan veya IMDb puanı 8 ile 9 arasında olan filmleri listeleyiniz.

Studying That Suits You

Use AI to generate personalized quizzes and flashcards to suit your learning preferences.

Quiz Team

Related Documents

More Like This

Use Quizgecko on...
Browser
Browser