Document Details

Uploaded by Deleted User

Tags

statistics descriptive statistics inferential statistics data analysis

Summary

Bu belge, istatistiksel yöntemleri, kavramları ve türlerini açıklayan bir ders notu/sunudur. Tanımlayıcı ve çıkarımsal istatistikleri, veri türlerini ve araştırma türlerini içerir.

Full Transcript

İstatistik Herhangi bir konu hakkında Bilgi toplamak, Toplanan bilgileri düzenlemek, Çözümlemek, Yorumlamak için gerekli yöntemler topluluğudur İSTATİSTİK Tanımlayıcı İstatistik Çıkarımsal İstatistik (Descriptive Statistics) (Inferential Statistics) Tanı...

İstatistik Herhangi bir konu hakkında Bilgi toplamak, Toplanan bilgileri düzenlemek, Çözümlemek, Yorumlamak için gerekli yöntemler topluluğudur İSTATİSTİK Tanımlayıcı İstatistik Çıkarımsal İstatistik (Descriptive Statistics) (Inferential Statistics) Tanımlayıcı İstatistik Verilerin; Özetlenmesi Sınıflandırılması Tablo ve grafik halinde sunulması Çıkarımsal İstatistik Örneklemden elde edilen bulgular sayesinde; Kitle hakkında tahminde bulunma, Kurulan Hipotezleri test etme, Karara varma Ho yoktur H1 vardır Kavramlar/Tanımlar Veri (Data) : İncelenen konu hakkında elde edilen bilgiler, belgeler, ölçümler,... vb. Denek (Subject): Verilerin elde edildiği kaynak Değişken (Variable) : Deneklerin herhangi bir özelliğine ilişkin verilere değişken denir. (uzunluk, yaş, öğrenim düzeyi, cinsiyet vb.) Kavramlar/Tanımlar Değişkenler, deneklere ait özelliklerdir. Deneğin ait olduğu grup, yaşı, cinsiyeti, boyu, ağırlığı, kan basıncı, serum glukoz düzeyi vb. birer değişkendir. Değişkenler, ölçüm özelliklerine göre nominal, ordinal ve sayısal olabilir. Nominal değişkende, ölçüm düzeyleri (değişkenin alabileceği değerler) arasında bir sıralama ya da uzaklık-yakınlık gibi belirli bir mesafe yoktur. Grup, cinsiyet… SINIFLAMA Ordinal değişkende ölçüm düzeyleri arasında bir sıralama vardır, ama düzeyler arasındaki mesafeler belirli değildir. Hastalık evreleri… SIRALAMA Sayısal değişkende ölçüm düzeyleri arasında hem sıralama hem de belirli bir mesafe vardır. Kolesterol seviyesi, kan basıncı… Kavramlar/Tanımlar Kitle(Population): Araştırma kapsamına giren, aynı özellikleri taşıyan deneklerin tümüne denir. Örneklem (Sample): Bir kitleden, kitleyi temsil edecek biçimde seçilen alt gruba denir. (Çalışmaya alınan deneklerin oluşturduğu grup) Parametre:(Parameter) Kitlenin özelliklerini tanımlamak için kullanılan ölçülere denir. İstatistik (Statistics) : Örneklemin özelliklerini tanımlamak için kullanılan ölçülere denir. Veri Türleri Niceliksel (Quantitative) Niteliksel (Qualitative) Bireylerin sahip Bireylerin sahipolduğu belli olduğu Nicelik belirten (ölçülerek belli özelliklerin özelliklerin sınıflarasınıflara ayrılarak yada sayılarak elde ayrılarak belirtildiği belirtildiği verilerdir. edilen) verilerdir. verilerdir. cinsiyet, medeni durum, yaş, ağırlık, boy gibi. cinsiyet, medeni durum, başarılı-başarısız gibi. başarılı-başarısız gibi. Nicel / Nitel Araştırma Nicel veriler objektif ve inkar edilemez gerçekleri, yani rakamları toplamak için tasarlanmıştır. Yapılandırılmış ve istatistiksel olan nicel veriler, araştırmanızdan genel sonuçlar elde etmeniz gerektiğinde size destek sağlar. Nitel veriler, bir konuyu ölçmekten ziyade tanımlamaya çalışan bilgileri toplar. İzlenimler, görüşler ve fikirlerden oluşur. Nitel anketler daha az yapılandırılmıştır: İnsanların motivasyonları, düşünceleri ve tutumları hakkında bilgi edinmek için konunun derinlemesine incelenmesini amaçlar. Bu da araştırma sorularınıza daha derin bir anlayış getirirken, sonuçların analiz edilmesini zorlaştırır. Niteliksel Veri Türleri Sıralanabilir Sınıflanabilir (Ordered) (Nominal) Nitelik verilerde belli bir Nitelik verilerde belli bir sıralama söz konusu ise bu sıralama yoksa bu tür verilere tür verilere sıralanabilir sınıflanabilir nitelik veriler nitelik veriler denir. denir. kötü-orta-iyi-mükemmel cinsiyet, medeni durum İki Sınıflı Çok Sınıflı Niceliksel Veri Türleri Kesikli (Süreksiz) Kesiksiz (Sürekli) Sayısal Sayısal Continuous numeric Discrete numeric variable variable Belirli bir aralıktaki tam Ölçümle belirtilirler ve bir sayıları alan veri türüdür. aralıktaki bütün değerleri Sınıftaki öğrenci sayısı, çocuk alırlar. sayısı Boy uzunluğu, yaş, günlük kalsiyum tüketim miktarı (mg) gibi. ÇıkarımsaI istatistik ÇıkarımsaI istatistik, veri analizi yoluyla verinin ait olduğu dağılımın özelliklerini anlama süreçlerini kapsar. Bir anakütlenin özellikleri hakkında çıkarımlar yapar: Çıkarımsal istatistik betimleyici istatistiğin zıddıdır. Betimleyici istatistik sadece gözlenen verilerin özellikleri ile ilgilenir ve eldeki verinin daha geniş bir anakütleden geldiğini varsaymaz. ÇıkarımsaI istatistik Doğruluk (Accuracy) : Ölçülen ya da hesaplanan değerin kendi gerçek değerine olan yakınlığı Kesinlik (Precision) : Aynı özelliğin bir çok kez ölçümü sonucunda elde edilen değerlerinin birbirine yakınlığı ÇıkarımsaI istatistik Örnekleme (Sampling) :Kitleden örnek seçmek amacıyla geliştirilen çeşitli yöntemler vardır. Uygun yöntemlerle kitleden örneklem seçme işlemine “örnekleme” denir. Tanımlayıcı istatistik Tanımlayıcı İstatistikler Yer Gösteren Ölçüler Yaygınlık Ölçüleri Merkezi Eğilim Konum Ölçüleri Ölçüleri Tanımlayıcı istatistik Bir dağılımı tanımlayabilmek için çeşitli yer gösteren ölçüler vardır. Bu ölçüler merkez ölçüleri ya da ortalama ölçüleri olabileceği gibi, dağılımdaki herhangi bir noktayı da gösteren ölçüler olabilir. Tanımlayıcı istatistik Tepe Geometri Aritmetik Ortanca Harmonik Yüzdelikl Değeri Oran kOrtalam Çeyrekler Ortalama (Medyan) Ortalama er (Mod) a Aritmetik Ortalama  Aritmetik ortalama, veri setindeki tüm değerlerin toplanması ve bu toplamın veri sayısına bölünmesiyle elde edilir.  Aşırı değerlerden etkilenir. Örnek: 9 kişinin yaşları 12, 13, 11, 12, 14, 29, 12, 13, 11 olsun. Buna göre yaş ortalaması n  xi 12 + 13 + 11 + 12 + 14 + 29 + 12 + 13 + 11 x i 1 = n 9 = 14,11 yıl Ortanca (medyan) Veri setindeki sayılar, küçükten büyüğe doğru sıralandığında ortadaki sayı bu dizinin ortancası (medyan) dır. ÖRNEK: 25, 13, 22, 19, 11 veri grubunun ortanca değeri Verileri küçükten büyüğe doğru sıralayalım: 11, 13, 19, 22, 25 Ortadaki sayı olan 19 bu veri grubunun ortanca değeridir. Eğer veri sayısı çift ise medyanı bulmak için ortadaki iki verinin aritmetik ortalaması alınır. ÖRNEK: 3, 5, 7, 8, 9, 10, 12, 18 Veri grubunun tam ortasında iki tane sayı olduğu için bu sayıların ortalaması medyandır. 8+9/2=8,5 Ortanca, dağılımın orta noktası hakkında bilgi verir ve aşırı değerlerden etkilenmez. Bu nedenle dağılımda aşırı gözlemlerin bulunduğu durumlarda, ortalama ölçüsü olarak ortancanın kullanılması daha doğrudur. Ortanca (medyan) Veri setindeki sayılar, küçükten büyüğe doğru sıralandığında ortadaki sayı bu dizinin ortancası (medyan) dır. ÖRNEK: 25, 13, 22, 19, 11 veri grubunun ortanca değeri Verileri küçükten büyüğe doğru sıralayalım: 11, 13, 19, 22, 25 Ortadaki sayı olan 19 bu veri grubunun ortanca değeridir. Eğer veri sayısı çift ise medyanı bulmak için ortadaki iki verinin aritmetik ortalaması alınır. ÖRNEK: 3, 5, 7, 8, 9, 10, 12, 18 Veri grubunun tam ortasında iki tane sayı olduğu için bu sayıların ortalaması medyandır. 8+9/2=8,5 Tepe Değer Bir veri grubunda en çok tekrar eden sayı o veri grubunun tepe değeridir. ÖRNEK: 3, 7, 5, 5, 6, 7, 7, 8, 10 veri grubunun tepe değerini bulalım. En çok tekrar eden veri 7 olduğu için tepe değer 7’dir. Veri grubunda her veri sadece bir kez verilmişse tepe değeri hesaplanamaz. ÖRNEK: 45, 57, 92, 53, 27 veri grubunun tepe değerini bulalım. Tekrar eden veri bulunmadığı için tepe değeri yoktur. Tepe değeri birden fazla olabilir. ÖRNEK: 12, 5, 12, 15, 17, 13, 9, 13 veri grubunun tepe değerini bulalım. Bu veri grubunda en çok tekrar eden veriler 12 ve 13 olduğu için tepe değeri 12 ve 13’tür. Her gözlemin tekrar sayısı aynı ise tepe değeri yoktur. En yüksek sayıya sahip tek bir değerin olduğu dağılımlara tek tepeli dağılım, iki değerin olduğu dağılımlara iki tepeli dağılım, ikiden fazla değerde ortaya çıkarsa çok tepeli dağılım adını alır. Tepe değeri, aritmetik ortama ve ortancaya göre daha az kullanılan bir ortalama ölçüsüdür. Geometrik Ortalama Harmonik Ortalama Tanımlayıcı istatistik Geometri Aritmetik Tepe Harmonik Yüzdelikl Ortanca Oran kOrtalam Çeyrekler Ortalama Değeri Ortalama er a Konum Ölçüleri Konum Ölçüleri Çeyrekler Dağılımı 4 eşit parçaya bölen değerlerdir. Bunlar, 1. Çeyrek (Ç1) 2. 2. Çeyrek Çeyrek (Ç2) (Ç2) 3. 3. Çeyrek Çeyrek (Ç3) (Ç3) Değerlerin %25’i Değerlerin %50’si Değerlerin %75’i Ç1’e eşit ya da Ç2’ye eşit ya da Ç3’e eşit ya da ondan küçüktür. ondan küçüktür. ondan küçüktür. Bu değer aynı zamanda ortancadır. Yaygınlık Ölçüleri Bir dağılımdaki değerlerin, birbirlerine ya da kendi ortalamalarına göre farklılıklarını gösterir. Bu farklılıkların derecesi dağılımın yaygınlığı kavramını oluşturur. İki dağılım aynı ortalama, ortanca ya da tepe değerine sahipken yaygınlıkları farklı olabilir. Dağılım I Dağılım II 6 3 1 7 6 X 6 6 X 6 15 5 Ortanca 6 Ortanca 6 6 6 2 Tepe D. 6 9 Tepe D. 6 Dağılım I’deki değerlerin aritmetik ortalamaya olan uzaklığı dağılım II’ye göre daha fazladır. Dağılım I, dağılım II’ye göre daha yaygındır. Dağılımların yaygınlığı hakkında bilgi veren ve en çok kullanılan ölçüler Dağılım (Değişim) Aralığı Standart Sapma Varyans Değişim Katsayısı Dağılım Aralığı (R) Dağılım aralığı en basit yaygınlık ölçüsüdür. Dağılımdaki en büyük değerden en küçük değerin çıkartılması ile bulunur. R ile gösterilir R= En Büyük Değer-En Küçük Değer Dağılım aralığı dağılımdaki diğer değerlerden oldukça farklı değerler alan aşırı değer(ler)den etkilenir. Dağılım aralığı dağılımdaki diğer değerlerden oldukça farklı değerler alan aşırı değer(ler)den etkilenir. Dağılımda yalnızca 2 gözleme ilişkin değer dikkate alındığı için kaba bir yaygınlık ölçüsüdür. Gözlemlerin çoğunun en büyük yada en küçük değere yakın olduğu durumlarda da gerçek değişkenlik hakkında bilgi vermez. Standart Sapma Bir dağılımın yaygınlığını gösteren en önemli yaygınlık ölçülerinden biridir. Dağılımdaki tüm değerlerin aritmetik ortalamaya olan uzaklıklarının ortalamasıdır. Dağılımın yaygınlığı arttıkça standart sapma büyür. Dağılımdaki değerler aynı ise yaygınlık yoktur ve standart sapma sıfırdır. Standart Sapma Standart sapma hesaplanırken dağılımdaki tüm değerler dikkate alınır. Standart sapma, aritmetik ortalama kullanıldığında bir yaygınlık ölçüsü olarak kullanılır. Çarpık dağılımlarda kullanılması önerilmez! Örnek Dağılım I için Standart Sapma n i 1 ( xi  x )2 Eşitliğine göre standart sapma hesaplanması S n 1 xi (xi  x) ( x i  x )2 6 0 0 1 -5 25 122 6 0 0 S   4 ,94 9 81 6 1 15 6 0 0 2 -4 16 122 Varyans Standart sapmanın karesine varyans denir (s2). Varyansın birimi karesel olduğu için yaygınlık ölçüsü olarak veriyi tanımlamakta pek kullanılmaz. Değişim Katsayısı Standart sapma, bir dağılımın yaygınlığını gösteren ölçülerden birisidir. Aritmetik ortalama büyüdükçe standart sapmanın büyüme eğilimi vardır. Standart sapmanın büyüklüğüne bakarak bir dağılımın yaygınlığı konusunda yargıya varmak her zaman doğru değildir. İki ya da daha fazla dağılımın yaygınlığını karşılaştırmak istediğimizde standart sapmayı doğrudan kullanamayız. Dağılımın yaygın olup olmadığına karar verebilmek için değişim katsayısını hesaplamalıyız. Değişim katsayısı dağılımdaki değerlerin ortalamaya göre yüzde kaçlık bir değişim gösterdiğini belirtir. s D K  100 x DK’nın sıfıra yaklaşması dağılımın yaygınlığının azaldığını gösterirken, DK’nın %25’in üzerinde olması incelenen dağılımın oldukça yaygın olduğunu gösterir. Dağılım I I Dağılım DağılımIIII Dağılım 4 ,9 4 2 DK  1 0 0  8 2 , 3 D K  100  33. 3 6 6 Dağılım I’deki değerler ortalamaya göre %82,3’lük bir değişim gösterirken, DağılımII’deki değerler %33,3’lük bir değişim göstermektedir. 10 bireyin boy ölçüleri cm. ve m. cinsinden aşağıda verilmiştir: 11.23 160 1.60 DK  100  6.6 180 1.80 170.2 165 1.65 174 1.74 190 1.90 0.1123 DK  100  6.6 1.702 182 1.82 155 1.55 165 1.65 171 1.71 Standart sapmalar farklı 160 1.60 olmasına rağmen x 170.2 1.702 değişim katsayıları SS DK 11.23 0.1123 aynıdır. Bağımsızlık ve bağımlılık Değişkenlerin bağımsızlığı: Tıp alanında değişkenler arasında ilişki olup olmadığını araştırırken, değişkenlerden bazılarına bakarak diğer değişkenlerin ne derece değiştiği kestirilmeye çalışılır. Birinci grup değişkenler bağımsız değişken, ikinci grup değişkenler bağımlı değişkendir. Grupların bağımsızlığı: Her grupta farklı denekler yer alır, bir gruptaki bir denek aynı zamanda başka gruplarda bulunmaz. (“denek” teriminden kişinin kendisi değil, kişiye ait veri kastedilmektedir) Dağılımın yaygınlık ölçütleri (yayılma ölçütleri) Değer aralığı (range, w): En büyük değer – en küçük değer Standart sapma (s, ): Kesinliği tanımlar Varyans (s2, 2) Varyasyon katsayısı (Coefficient of variation, CV): Standart sapmanın ortalamaya göre % değişimi [CV= 100 (s/x)] Standart hata (s/n) Laboratuvar ölçümlerinde CV’nin üst sınırı %10’dur. Dağılımın yer gösteren ölçütleri (merkezi eğilim ölçütleri) Aritmetik ortalama (x, µ): Değerler toplamı/denek sayısı. Standart hata ile birlikte gösterilmelidir. Ortanca (medyan): Dağılımın orta noktasındaki değer Tepe değeri (mod): Dağılımda en çok görülen değer Geometrik ortalama: Logaritmik skalada ölçümlerde.. Çeyrek ve yüzdelikler (persentil): %25-%50- %75 Simetrik (normal) dağılımda aritmetik ortalama, ortanca ve tepe değeri birbirine eşittir. Laboratuvar değerlerinde alt sınır: 2,5. Persentil; üst sınır: 97,5. Persentil Dağılım şekli ölçütleri Ortalama=ortanca=mod ise dağılım normal dağılımdır. Çarpıklık (skewess): Mod

Use Quizgecko on...
Browser
Browser