Matematiksel istatistik - Vikipedi
Makale serilerinden |
Bilim portalı Kategori |
Matematiksel istatistik, istatistiksel veri toplama tekniklerinin aksine, matematiğin bir dalı olan olasılık teorisinin istatistiğe uygulanmasıdır. Bunun için kullanılan özel matematiksel teknikler arasında matematiksel analiz, doğrusal cebir, stokastik analiz, diferansiyel denklemler ve ölçü teorisi bulunur.[1][2]
Giriş
[değiştir | kaynağı değiştir]İstatistiksel veri toplama, özellikle rastgele deneylerin tasarımı ve rastgele örnekleme kullanılan anketlerin planlanmasıyla çalışmaların planlanmasıyla ilgilidir. Verilerin ilk analizi, genellikle yürütülen çalışmadan önce belirlenen çalışma protokolünü takip eder. Bir çalışmadan elde edilen veriler, ilk sonuçlardan esinlenen ikincil hipotezleri dikkate almak veya yeni çalışmalar önermek için de analiz edilebilir. Bir planlı çalışmadan elde edilen verilerin ikincil analizi veri analizi araçları kullanılarak yapılır ve bu analiz süreci matematiksel istatistiktir.
Veri analizi ikiye ayrılır:
- Tanımlayıcı istatistik - istatistiğin verileri tanımlayan, yani verileri ve tipik özelliklerini özetleyen kısmı.
- Çıkarımsal istatistik - istatistiğin verilerden (veriler için bir model kullanarak) sonuç çıkaran kısmı: Örneğin, çıkarımsal istatistikler, veriler için bir model seçmeyi, verilerin belirli bir modelin koşullarını karşılayıp karşılamadığını kontrol etmeyi ve ilgili belirsizliği sayıya dökmeyi (örneğin, güven aralıklarının kullanılması) içerir.
Veri analizi araçları en iyi rastgele çalışmalardan elde edilen veriler üzerinde çalışırken, aynı zamanda diğer veri türlerine de uygulanır. Örneğin, doğal deneylerden ve gözlemsel çalışmalardan elde edilen verilere uygulanan modeller istatistikçi tarafından seçilerek uygulanır ve bu nedenle özneldir.
Konular
[değiştir | kaynağı değiştir]Aşağıda matematiksel istatistikteki önemli konulardan bazıları verilmiştir:[3][4]
Olasılık dağılımları
[değiştir | kaynağı değiştir]Olasılık dağılımı, rastgele bir deney, araştırma veya istatistiksel çıkarım prosedürünün olası sonuçlarının tüm ölçülebilir alt kümelerine bir olasılık değeri atayan işlevdir . Örnekler, dağılımın kategorik olacağı, sayısal olmayan örnek uzayına sahip deneylerde; dağılımın bir olasılık kütle fonksiyonu ile tanımlanabildiği, ayrık rassal değişkenler tarafından kodlanan örnek uzaya sahip deneylerde ve dağılımın bir olasılık yoğunluk fonksiyonu ile tanımlanabildiği sürekli rassal değişkenler tarafından kodlanan örnek uzaya sahip deneylerde bulunur. Sürekli zamanda tanımlanan stokastik süreçleri içeren daha karmaşık deneyler, daha genel olasılık ölçülerinin kullanılmasını gerektirebilir.
Bir olasılık dağılımı tek değişkenli veya çok değişkenliolabilir. Tek değişkenli bir dağılım, çeşitli alternatif değerleri alan tek bir rastgele değişkenin olasılıklarını verir; çok değişkenli bir dağılım (bir ortak olasılık dağılımı), çeşitli değer kombinasyonlarını alan rastgele bir vektörün (iki veya daha fazla rastgele değişken kümesi) olasılıklarını verir. Tek değişkenli olasılık dağılımlarına, binom dağılımı, hipergeometrik dağılım ve normal dağılım örnek verilebilir. Çok değişkenli normal dağılım, yaygın olarak karşılaşılan çok değişkenli bir dağılım örneğidir.
Özel dağılımlar
[değiştir | kaynağı değiştir]- Normal dağılım, en yaygın kullanılan sürekli dağılımdır.
- Bernoulli dağılımı, tek bir Bernoulli denemesinin sonucu için (örneğin başarı/başarısızlık, evet/hayır) kullanılır.
- Binom dağılımı, sabit bir toplam bağımsız olay sayısı verildiğinde "pozitif oluşum" sayısı (örneğin başarılar, evet oyları, vb.) için kullanılır.
- Negatif binom dağılımı, ikili gözlemlerde, ilgilenilen değerin belirli sayıda başarı gerçekleşmeden önceki başarısızlıkların sayısı olduğu durumlarda kullanılır.
- Geometrik dağılım, ikili gözlemler için, ilgilenilen değerin ilk başarılı gözlem gerçekleşmeden önceki başarısızlıkların sayısı olduğu durumlarda kullanılır. Negatif binom dağılımının, başarılı gözlem sayısının bire eşit olduğu özel bir durumudur.
- Ayrık tekdüze dağılım, sonlu bir değerler kümesi için (örneğin, adil bir zar atışının sonucu) kullanılır.
- Sürekli tekdüze dağılım, sürekli dağıtılmış değerler için kullanılır.
- Poisson dağılımı, bir olayın belirli bir zaman diliminde meydana gelme sayısı için kullanılır.
- Üstel dağılım, bir sonraki Poisson türü olay gerçekleşmeden önceki süre için kullanılır.
- Gama dağılımı, takip eden k. Poisson tipi olay gerçekleşmeden önceki süre için kullanılır.
- Ki-kare dağılımı, standart normal değişkenlerin kareleri toplamının dağılımıdır; örneğin normal dağılmış örneklerin örnek varyansı ile ilgili çıkarımlar için yararlıdır (bkz ki-kare testi).
- Student'in t dağılımı, standart bir normal değişkenin ve ölçekli bir ki kare değişkenin karekökünün dağılım oranıdır; normal dağılıma uyan ve bilinmeyen varyansa sahip örneklerin ortalamasına ilişkin çıkarımlar için kullanışlıdır (bkz tek anakütle ortalaması için parametrik hipotez sınaması).
- Beta dağılımı, tek bir olasılık için (0 ile 1 arasında gerçek sayı) kullanılır; Bernoulli dağılımı ve binom dağılımıyla ilişkilidir.
İstatiksel çıkarım
[değiştir | kaynağı değiştir]İstatistiksel çıkarım, rastgele sapmaya, örneğin gözlemsel hatalara veya örnekleme varyasyonuna tabi olan verilerden sonuç çıkarma sürecidir.[5] Çıkarım ve tümevarım için böyle bir prosedür sisteminin ilk gereksinimleri, sistemin iyi tanımlanmış durumlara uygulandığında makul yanıtlar üretmesi ve bir dizi duruma uygulanacak kadar genel olmasıdır. Çıkarımsal istatistikler, hipotezleri test etmek ve örnek verileri kullanarak tahminler yapmak için kullanılır. Tanımlayıcı istatistikler bir örneklemi tanımlarken, çıkarımsal istatistikler örneklemin temsil ettiği daha büyük bir popülasyon hakkında çıkarım yapar.
İstatistiksel çıkarımın sonucu, "bundan sonra ne yapılmalı?" sorusuna cevap olabilir. İstatistiksel çıkarım çoğunlukla, rastgele örnekleme yoluyla ilgilenilen popülasyondan elde edilen verileri kullanıp popülasyon hakkında önerilerde bulunur. Daha genel olarak, rastgele bir süreç hakkındaki veriler, sınırlı bir süre boyunca gözlemlenen davranışından elde edilir. Hakkında çıkarım yapılmak istenen bir parametre veya hipotez verildiğinde, istatistiksel çıkarım en çok şunları kullanır:
- Randomizasyon kullanıldığında bilinen verileri üretmesi beklenen rastgele sürecin istatistiksel bir modeli ve
- rastgele sürecin belirli bir çevrimi; yani bir veri seti.
Regresyon
[değiştir | kaynağı değiştir]İstatistikte regresyon analizi, değişkenler arasındaki ilişkileri tahmin etmek için kullanılan istatistiksel bir süreçtir. Odak noktası bir bağımlı değişken ile bir veya daha fazla bağımsız değişken arasındaki ilişki olup bir ya da daha fazla değişkeni modellemek ve analiz etmek için birden fazla yol içerir. Daha spesifik olarak, regresyon analizi, diğer bağımsız değişkenler sabit tutulurken bağımsız değişkenlerden herhangi biri değiştiğinde, bağımlı değişkendeki (veya 'ölçüt değişken') değer değişiminin anlaşılmasına yardımcı olur. Regresyon analizi çoğunlukla, bağımsız değişkenler verildiğinde bağımlı değişkenin koşullu beklentisini, yani bağımsız değişkenler sabitlendiğinde bağımlı değişkenin ortalama değerini tahmin eder. Daha az yaygın olarak odak, verilen bağımsız değişkenlerle bağımlı değişkenin koşullu dağılımının çeyreklik veya başka bir konum parametresidir . Her durumda, tahmin hedefi bağımsız değişkenlerin bir fonksiyonu olan regresyon fonksiyonudur. Regresyon analizi, bağımlı değişkenin, bir olasılık dağılımı diye tanımlanabilen regresyon fonksiyonu etrafındaki sapma miktarlarını karakterize etmekle de ilgilenir.
Regresyon analizini için birçok teknik geliştirilmiştir. Doğrusal regresyon gibi bilinen yöntemler parametriktir, çünkü regresyon fonksiyonu, verilerden (örneğin, en küçük kareler yöntemi kullanılarak) tahmin edilen sonlu sayıda bilinmeyen parametre cinsinden tanımlanır. Parametrik olmayan regresyon, regresyon fonksiyonunun, sonsuz boyutlu olabilen belirli bir fonksiyonlar setinde yer almasına izin veren teknikleri ifade eder.
Parametrik olmayan istatistikler
[değiştir | kaynağı değiştir]Parametrik olmayan istatistikler, parametreli olasılık dağılım ailelerine dayandırmadan verilerden hesaplanan değerlerdir. Hem tanımlayıcı hem de çıkarımsal istatistikleri içerirler. Tipik parametreler ortalama, varyans ve benzeridir. Parametrik istatistiklerin aksine, parametrik olmayan istatistikler, değerlendirilen değişkenlerin olasılık dağılımları hakkında varsayımda bulunmaz.
Parametrik olmayan yöntemler, bir ile dört arası derecelendirilen film incelemeleri gibi, sıralı düzene sahip olan popülasyonları incelemek için yaygın olarak kullanılmaktadır. Parametrik olmayan yöntemlerin kullanımı, verilerin bir sıralaması mevcutken ancak tercih değerlendirirken olduğu gibi net bir sayısal yorum bulunmadığında gerekli olabilir. Ölçüm seviyeleri açısından, parametrik olmayan yöntemler "sıralı" verilerle sonuçlanır.
Parametrik olmayan yöntemler daha az varsayım yaptığından, uygulanabilirliği karşılık gelen parametrik yöntemlerden çok daha geniştir. Özellikle incelemeye konu olan soru hakkında daha az şey bilindiği durumlarda uygulanabilirler. Ayrıca,uygulanırken daha az varsayım yapılması nedeniyle parametrik olmayan yöntemler daha sağlamdır.
Parametrik olmayan yöntemlerin kullanımının bir başka gerekçesi basitliktir. Bazı durumlarda, parametrik yöntemlerin kullanımı gerekçelendirilse bile, parametrik olmayan yöntemlerin kullanımı daha kolay olabilir. Hem bu basitlik hem de daha sağlam olmaları nedeniyle, bazı istatistikçiler parametrik olmayan yöntemlerin yanlış kullanım ve yanlış anlama riskini azalttığı görüşündedir.
İstatistik, matematik ve matematiksel istatistikler
[değiştir | kaynağı değiştir]Matematiksel istatistik, istatistik biliminin önemli bir alt kümesidir. İstatistik teorisyenleri, matematikle istatistiksel prosedürleri inceler ve geliştirir; istatistiksel araştırma genellikle matematiksel sorular gündeme getirir. İstatistik teorisi, olasılık ve karar teorisine dayanır.
Gauss, Laplace ve CS Peirce gibi matematikçiler ve istatistikçiler, olasılık dağılımları ve kayıp fonksiyonları (veya fayda fonksiyonları) ile karar teorisini kullandılar. İstatistiksel çıkarıma karar-teorik yaklaşım, Abraham Wald ve halefleri[6][7][8][9][10][11][12] tarafından yeniden canlandırıldı ve bilimsel hesaplama, analiz ve optimizasyondan kapsamlı bir şekilde yararlanılmasını sağladı; deney tasarımı için istatistikçiler cebir ve kombinatorik kullanır.
Ayrıca bakınız
[değiştir | kaynağı değiştir]Kaynakça
[değiştir | kaynağı değiştir]- ^ Handbook of stochastic analysis and applications. New York: M. Dekker. 2002. ISBN 0824706609.
- ^ Theory of statistics. Corr. 2nd print. New York: Springer. 1995. ISBN 0387945466.
- ^ Hogg, R. V., A. Craig, and J. W. McKean.
- ^ Larsen, Richard J. and Marx, Morris L. "An Introduction to Mathematical Statistics and Its Applications" (2012).
- ^ Upton, G., Cook, I. (2008) Oxford Dictionary of Statistics, OUP. 978-0-19-954145-4
- ^ Sequential analysis. New York: John Wiley and Sons. 1947. ISBN 0-471-91806-7.
See Dover reprint, 2004: 0-486-43912-7
- ^ Statistical Decision Functions. John Wiley and Sons, New York. 1950.
- ^ Testing Statistical Hypotheses. 2nd. 1997. ISBN 0-387-94919-4.
- ^ Theory of Point Estimation. 2nd. 1998. ISBN 0-387-98502-6.
- ^ Mathematical Statistics: Basic and Selected Topics. Second (updated printing 2007). 1. Pearson Prentice-Hall. 2001.
- ^ Asymptotic Methods in Statistical Decision Theory. Springer-Verlag. 1986. ISBN 0-387-96307-3.
- ^ Statistical Decision Theory: Estimation, Testing, and Selection. Springer. 2008.
Konuyla ilgili yayınlar
[değiştir | kaynağı değiştir]- Borovkov, AA (1999). Matematiksel İstatistikler . CRC Basın.90-5699-018-7ISBN 90-5699-018-7
- Olasılık ve İstatistikte Sanal Laboratuvarlar (Ala. 5 Eylül 2017 tarihinde Wayback Machine sitesinde arşivlendi. -Huntsville) 5 Eylül 2017 tarihinde Wayback Machine sitesinde arşivlendi.
- StatiBot 27 Kasım 2020 tarihinde Wayback Machine sitesinde arşivlendi., istatistiksel testler üzerine etkileşimli çevrimiçi uzman sistem.
- Mathematiksel İstatistikler Mathematical Statistics. Ram Prasad & Sons. 1966. 978-9383385188 Manohar Ray tarafından, Har swarup Sharma Ram Prasad Agra tarafından yayınlandı.