MüH 100 İstatiSTİk yrd. Doç. Dr. Veysel Gazi



Yüklə 445 b.
tarix28.08.2018
ölçüsü445 b.
#75542


MÜH 100 İSTATİSTİK

  • Yrd. Doç. Dr. Veysel Gazi

  • TOBB Ekonomi ve Teknoloji Üniversitesi

  • Elektrik-Elektronik Mühendisliği Bölümü


AMAÇ

  • Kitle ve örneklem arasındaki farkı öğrenmek

  • Betimsel istatistiği kullanmayı öğrenmek (veri sıralaması, merkezsel eğilim ölçüleri, dağılım ölçüleri, vs.)

  • Histogram çizme ve okumayı öğrenmek

  • Normal dağılımı ve standart normal dağılımı tanımlamak

  • Olasılık hesabı için Z-tabloları kullanmak



İstatistik

  • İstatistik olasılık kuramının yöntemlerine bağlı bir daldır

    • - betimsel (descriptive) istatistik: veri toplamak, düzenlemek, özetlemek, sunmak ve incelemek
    • tümevarımsal istatistik (statistical inference):
      • verilere dayanarak sonuçlar çıkarmak
      • sonuçlara dayanarak kararlar almak
  • mühendisler tarafından çok kullanılır (mesela kalite kontrol için)



Kitle ve Örneklem

  • Kitle (Population) – üzerinde çalışılan tüm gruba yada istatistiksel sonuçların genişletileceği gruba kitle denir

    • örnek: bütün sınıf, tüm ülke insanları, tüm kanser hastaları
  • Örneklem (Sample) – kitlenin bir alt kümesidir

    • örnek: bir takım, rasgele seçilen bazı insanlar
  • Bütün kitle hakkında sonuçlara varabilmek için genelde örneklem kullanılır.



Neden örneklem kullanılır?

  • Kitle çok büyük olabilir

    • dünyadaki tüm insanlar, uzaydaki tüm yıldızlar.
  • Kitleye ulaşmak imkansız olabilir

    • tarih öncesi insanları
  • Kitleyi incelemek tehlikeli olabilir

    • araba enkazları/kazaları, patlamalar
  • Kitleyi ölçmek zor olabilir

    • atomların alt parçacıkları
  • Ölçüm örneği kullanılmaz hale getiriyor olabilir



Örnek:

  • Sağındaki ve solundaki kişilerin yaşlarının ve kendi yaşının ortalamasını alarak sınıf yaş ortalamasını tahmin et.

  • Aldığın 3 kişilik örneklem hangi şartlarda sınıfı temsil etmez?



Merkezsel Eğilim Ölçüleri

  • Bir kitleyi (yada bir örneklemi) tek bir sayı ile tanımlamak/betimlemek istersek ne kullanırız?

    • Ortalama (Mean) – aritmetik ortalama
    • Mod (Mode) – en çok tekrarlanan (en sık görülen) değer.
    • Ortanca/Medyan (Median) – veri kümesinin “orta” değeri.


Ortalama nedir?

  • Ortalama verilerin toplamının veri sayısına bölümüdür.



Kitle Ortalaması

  • μ = kitle ortalaması

  • xi = veriler

  • N = kitledeki tüm gözlemlerin sayısı



Örneklem Ortalaması



Ağırlıklı Ortalama



Örnek



Mod Nedir?

  • mod – kesikli verilerde (yada kesikli aralıklara gruplanmış verilerde) en fazla görülen değer.



Ortanca nedir?

  • Ortanca (medyan) – veriler sıralanmış olmalı

    • tek sayıda gözlem var ise ortanca orta değerdir
    • çift sayıda gözlem var ise ortanca iki orta değerin ortalamasıdır
  • Verilerde sapan değerler var ise ortanca verileri ortalamadan daha iyi betimler.

    • Örnek: Şu an bu odadaki kişilerin yaş ortalaması.


Dağılım Ölçüleri

  • Verilerin merkeze göre dağılımı tanımlayan ölçüler

    • değişim aralığı
    • ortalama mutlak sapma
    • standart sapma
    • varyans


Değişim Aralığı Nedir?

  • Değişim Aralığı (Range) – en büyük ve en küçük değerler arasındaki fark.

    • Örnek: A üniversitesinin B bölümünün tavan puanı 361 ve taban puanı 349 ise.
      • En düşük (Minimum) = 349 puan
      • En yüksek (Maksimum) = 361 puan
      • Değişim aralığı = 361-349 = 12 puan


Ortalama Mutlak Sapma

  • Herhangi bir verinin ortalamadan sapması

  • Tüm sapmaların toplamı sıfırdır

  • Ortalama Mutlak Sapma (OMS)



Standart Sapma

  • Kitle için



Standart Sapma

  • Verilerin dağılımı hakkında önemli bilgi vermektedir.

  • Matematiksel analiz için OMS’den daha uygun.



 ve s Farkı

  • s (örneklem varyansı) ‘nın (kitle varyansının) bir tahminidir.

  • s’nin hesaplanmasında n-1 kullanılır ve bu daha iyi sonuç verir.

  • Eğer n büyük ise n ve n-1 kullanımı arasındaki fark önemsizdir.



Önemli bir özellik

  • Standart sapmayı Gauss 1700’lerde yıldızların ölçülen konumlarındaki gözlenen hataları açıklamak için icat etmiş.

  • Bugün ise kalite kontrolden finansal risklerin ölçülmesi/hesaplanması’na kadar birçok yerde kullanılıyor.



Verilerin Düzenlenmesi

  • Bir gözlemde yada deneyde elde edilen verilere ham veri (raw data) denir.

  • Veriler genelde incelemeden önce büyükten küçüğe (yada tersi) sıralanır (sort edilir).

  • Sıralanmış veriler sınıflandırılır.

  • Sınıflar tüm verileri kapsayacak ve her veri sadece bir sınıfa dahil olacak şekilde tanımlanır.

  • Her sınıftaki eleman sayısına sınıf frekansı denir.

  • Veriler histogram kullanarak grafiksel olarak gösterilebilir.



Örnek

  • Müh 100 dersinin notları aşağıdaki gibi olsun



Örnek

  • Notlar büyükten küçüğe sıralanır.

    • En yüksek not (maksimum) = 75
    • En düşük not (minimum) = 37
    • Not değişim aralığı = 75 – 37 = 38
    • Ortalama = 58’dir.
    • Ortanca 83 veri olduğundan 42’ci değerdir ve 57’dir.
  • Sıralanmış notlar 9 sınıfa ayrılır

    • Sınıflar 35-39, 40-44,45-49,…,75-79’dır
    • En fazla not 50-54 sınıfındadır – bu sınıf mod sınıfıdır.


Örnek



Veri Dağılımları

  • Verinin “şekli” frekans histogramı ile anlaşılır.

  • Frekans histogramlarında genelde oransal frekans (OF = sınıf frekansı/toplam frekans) kullanılır.

  • Çoğunlukla veriler “çan-eğrisi” şeklinde bir dağılım gösterirler ve bu tür dağılıma “normal” dağılım (distribution) denir.

  • Gauss yıldızların konum hatalarının “normal” dağılım gösterdiğini gözledi.



Normal Dağılım

  • Normal dağılım bazen “Gauss” dağılımı olarak da adlandırılır.



Standart Normal Dağılım



Bilinmesi Gereken Bazı Şeyler

  • z=-1 ve z=1 (x=- ve x= arasındaki alan 0.6827’dır.

  • z=-2 ve z=2 (x=-2 ve x=2 arasındaki alan 0.9545’dır.

  • z=-3 ve z=3 (x=-3 ve x=3 arasındaki alan 0.9973’dır.

  • z=-4 ve z=4 (x=-4 ve x=4 arasındaki alan pratik olarak 1.0’dır.



Bilinmesi Gereken Bazı Şeyler

  • Normal eğrisinde orta değer alanı %50’lik iki eşit bölgeye ayırır.

  • Normal dağılım eğrisi toplam 1.00 alana sahiptir.

  • “z-Tabloları” standart normal dağılım eğrisinin altındaki alanı gösterir ve z-eksenindeki herhangi iki nokta arasındaki alanı hesaplamak için kullanılabilir.



Z-Tabloları Kullanarak Olasılık Hesabı

  • Örnek: Kitabınızdaki Ek-C’deki Z-tablosunu kullanarak z= -1.0 ve z= 2.05 arasındaki alanı bulunuz.

    • Tablodan: z = 1.0 için alan = 0.3413
    • Simetriden dolayı z = -1.0, için de alan = 0.3413
    • Tablodan: z= 2.05 için, alan = 0.4798
    • Toplam alan = 0.3413 + 0.4798 = 0.8211
    • “Kuyrukların” alanı = 1.0 - 0.8211 = 0.1789


Özet

  • Merkezsel Ölçüler

    • ortalama
    • mod
    • ortanca
  • Dağılım Ölçüleri

    • değişim aralığı
    • varyans
    • standart sapma
  • Normal Dağılımı



  • vgazi@etu.edu.tr



Yüklə 445 b.

Dostları ilə paylaş:




Verilənlər bazası müəlliflik hüququ ilə müdafiə olunur ©muhaz.org 2024
rəhbərliyinə müraciət

gir | qeydiyyatdan keç
    Ana səhifə


yükləyin