MüH 100 İstatiSTİk yrd. Doç. Dr. Veysel Gazi
tarix 28.08.2018 ölçüsü 445 b. #75542
MÜH 100 İSTATİSTİK TOBB Ekonomi ve Teknoloji Üniversitesi Elektrik-Elektronik Mühendisliği Bölümü
AMAÇ Kitle ve örneklem arasındaki farkı öğrenmek Betimsel istatistiği kullanmayı öğrenmek (veri sıralaması, merkezsel eğilim ölçüleri , dağılım ölçüleri, vs.) Histogram çizme ve okumayı öğrenmek Normal dağılımı ve standart normal dağılımı tanımlamak Olasılık hesabı için Z-tabloları kullanmak
İstatistik İstatistik olasılık kuramının yöntemlerine bağlı bir daldır - betimsel (descriptive) istatistik : veri toplamak, düzenlemek, özetlemek , sunmak ve incelemek tümevarımsal istatistik (statistical inference) : verilere dayanarak sonuçlar çıkarmak sonuçlara dayanarak kararlar almak mühendisler tarafından çok kullanılır (mesela kalite kontrol için)
Kitle ve Örneklem Kitle (Population) – üzerinde çalışılan tüm gruba yada istatistiksel sonuçların genişletileceği gruba kitle denir örnek: bütün sınıf, tüm ülke insanları, tüm kanser hastaları Örneklem (Sample) – kitlenin bir alt kümesidir örnek: bir takım, rasgele seçilen bazı insanlar Bütün kitle hakkında sonuçlara varabilmek için genelde örneklem kullanılır.
Neden örneklem kullanılır? Kitle çok büyük olabilir dünyadaki tüm insanlar, uzaydaki tüm yıldızlar. Kitleye ulaşmak imkansız olabilir Kitleyi incelemek tehlikeli olabilir araba enkazları/kazaları, patlamalar Kitleyi ölçmek zor olabilir atomların alt parçacıkları Ölçüm örneği kullanılmaz hale getiriyor olabilir
Örnek: Sağındaki ve solundaki kişilerin yaşlarının ve kendi yaşının ortalamasını alarak sınıf yaş ortalamasını tahmin et. Aldığın 3 kişilik örneklem hangi şartlarda sınıfı temsil etmez?
Merkezsel Eğilim Ölçüleri Bir kitleyi (yada bir örneklemi) tek bir sayı ile tanımlamak/betimlemek istersek ne kullanırız? Ortalama (Mean) – aritmetik ortalama Mod (Mode) – en çok tekrarlanan (en sık görülen) değer. Ortanca/Medyan (Median) – veri kümesinin “orta” değeri.
Ortalama nedir? Ortalama verilerin toplamının veri sayısına bölümüdür.
Kitle Ortalaması μ = kitle ortalaması xi = veriler N = kitledeki tüm gözlemlerin sayısı
Örneklem Ortalaması
Ağırlıklı Ortalama
Örnek
Mod Nedir? mod – kesikli verilerde (yada kesikli aralıklara gruplanmış verilerde) en fazla görülen değer .
Ortanca nedir? Ortanca (medyan) – veriler sıralanmış olmalı tek sayıda gözlem var ise ortanca orta değerdir çift sayıda gözlem var ise ortanca iki orta değerin ortalamasıdır Verilerde sapan değerler var ise ortanca verileri ortalamadan daha iyi betimler. Örnek: Şu an bu odadaki kişilerin yaş ortalaması.
Dağılım Ölçüleri Verilerin merkeze göre dağılımı tanımlayan ölçüler değişim aralığı ortalama mutlak sapma standart sapma varyans
Değişim Aralığı Nedir? Değişim Aralığı (Range) – en büyük ve en küçük değerler arasındaki fark. Örnek: A üniversitesinin B bölümünün tavan puanı 361 ve taban puanı 349 ise. En düşük (Minimum) = 349 puan En yüksek (Maksimum) = 361 puan Değişim aralığı = 361-349 = 12 puan
Ortalama Mutlak Sapma Herhangi bir verinin ortalamadan sapması Tüm sapmaların toplamı sıfırdır Ortalama Mutlak Sapma (OMS)
Standart Sapma
Standart Sapma Verilerin dağılımı hakkında önemli bilgi vermektedir. Matematiksel analiz için OMS’den daha uygun.
ve s Farkı s (örneklem varyansı) ‘nın (kitle varyansının) bir tahminidir. s’nin hesaplanmasında n-1 kullanılır ve bu daha iyi sonuç verir. Eğer n büyük ise n ve n-1 kullanımı arasındaki fark önemsizdir.
Önemli bir özellik Standart sapmayı Gauss 1700’lerde yıldızların ölçülen konumlarındaki gözlenen hataları açıklamak için icat etmiş. Bugün ise kalite kontrolden finansal risklerin ölçülmesi/hesaplanması’na kadar birçok yerde kullanılıyor.
Bir gözlemde yada deneyde elde edilen verilere ham veri (raw data) denir. Veriler genelde incelemeden önce büyükten küçüğe (yada tersi) sıralanır (sort edilir). Sıralanmış veriler sınıflandırılır . Sınıflar tüm verileri kapsayacak ve her veri sadece bir sınıfa dahil olacak şekilde tanımlanır. Her sınıftaki eleman sayısına sınıf frekansı denir. Veriler histogram kullanarak grafiksel olarak gösterilebilir.
Örnek Müh 100 dersinin notları aşağıdaki gibi olsun
Örnek Notlar büyükten küçüğe sıralanır. En yüksek not (maksimum) = 75 En düşük not (minimum) = 37 Not değişim aralığı = 75 – 37 = 38 Ortalama = 58’dir. Ortanca 83 veri olduğundan 42’ci değerdir ve 57’dir. Sıralanmış notlar 9 sınıfa ayrılır Sınıflar 35-39, 40-44,45-49,…,75-79’dır En fazla not 50-54 sınıfındadır – bu sınıf mod sınıfıdır.
Örnek
Veri Dağılımları Verinin “şekli” frekans histogramı ile anlaşılır. Frekans histogramlarında genelde oransal frekans (OF = sınıf frekansı/toplam frekans) kullanılır. Çoğunlukla veriler “çan-eğrisi ” şeklinde bir dağılım gösterirler ve bu tür dağılıma “normal” dağılım (distribution) denir. Gauss yıldızların konum hatalarının “normal” dağılım gösterdiğini gözledi.
Normal Dağılım Normal dağılım bazen “Gauss” dağılımı olarak da adlandırılır.
Standart Normal Dağılım
Bilinmesi Gereken Bazı Şeyler z=-1 ve z=1 (x=- ve x= arasındaki alan 0.6827’dır. z=-2 ve z=2 (x=-2 ve x=2 arasındaki alan 0.9545’dır. z=-3 ve z=3 (x=-3 ve x=3 arasındaki alan 0.9973’dır. z=-4 ve z=4 (x=-4 ve x=4 arasındaki alan pratik olarak 1.0’dır.
Bilinmesi Gereken Bazı Şeyler Normal eğrisinde orta değer alanı %50’lik iki eşit bölgeye ayırır. Normal dağılım eğrisi toplam 1.00 alana sahiptir. “z-Tabloları” standart normal dağılım eğrisinin altındaki alanı gösterir ve z-eksenindeki herhangi iki nokta arasındaki alanı hesaplamak için kullanılabilir.
Z-Tabloları Kullanarak Olasılık Hesabı Örnek: Kitabınızdaki Ek-C’deki Z-tablosunu kullanarak z= -1.0 ve z= 2.05 arasındaki alanı bulunuz. Tablodan: z = 1.0 için alan = 0.3413 Simetriden dolayı z = -1.0, için de alan = 0.3413 Tablodan: z= 2.05 için, alan = 0.4798 Toplam alan = 0.3413 + 0.4798 = 0.8211 “Kuyrukların” alanı = 1.0 - 0.8211 = 0.1789
Özet Merkezsel Ölçüler Dağılım Ölçüleri değişim aralığı varyans standart sapma Normal Dağılımı
Dostları ilə paylaş: