Verilerinizde istatistiksel olarak anlamlı farklar var mı?
İki sayı arasındaki farkı herkes görebilirken, o farkın gerçekten istatistiksel anlama sahip olup olmadığını öğrenmek biraz çaba alır.
Diyelim ki şirketiniz için bir müşteri memnuniyeti anketi yaptınız ve analiz etmeniz gereken çok sayıda sonucunuz var. Patronunuza önce neyi analiz edeceğinizi sordunuz, o da kadınlarla erkeklerin farklı yanıtlar verip vermediğini öğrenmek istediğini söyledi. Örneğin, erkekler şirketinize ortalama olarak kadınlardan daha düşük Net Promoter Score℠ (NPS) mu veriyor?
Verilere ayrıntılı olarak baktığınızda erkek yanıtlayanların verdiği ortalama değerlendirmenin 9, kadın yanıtlayanların verdiği ortalama puanun 12 olduğunu gördünüz. 9 ile 12 arasında istatistiksel olarak anlamlı bir fark olup olmadığını nasıl bilirsiniz? T testi bu noktada devreye girer.
T testi iki rakamın birbirinden istatistiksel anlam bakımından farklı olup olmadığını belirlemenin bir yoludur. Birkaç t testi türü vardır ve her biri farklı bir formülle hesaplanır.
1. Bir örnekli t testi Test bir gruptaki ortalamanın (bu durumda genel NPS) belirlediğiniz bir değerden farklı olup olmadığına bakar.
Örnek: Şirketinizin hedefi, sektör standardı olan 5 puandan anlamlı ölçüde yüksek bir NPS puanına sahip olmaktır. Şirketinizin en son anketine göre NPS puanınız 10. NPS anketinde 10 puan, sektör standardı olan 5 puandan anlamlı ölçüde yüksek midir?
2. İki örnekli t testi: Bu test, iki bağımsız grubun ortalamalarının birbirinden anlamlı ölçüde farklı olup olmadığını inceler.
Örnek: Hipotezinize göre erkekler şirketinize kadınlardan daha düşük NPS puanı veriyorlar. Erkek yanıtlayanların verdiği ortalama NPS puanı 9 iken, kadınların ortalama puanı 12'dir. 9 ile 12 arasındaki fark istatistiksel olarak anlamlı mıdır?
3. Eşleştirilmiş t testi: Bu test, bir grup insana aynı testi iki kez vererek yapılır. Eşleştirilmiş t testi, ortalamanın birinci ve ikinci anket arasında değişip değişmediğini test etmenizi sağlar.
Örnek: Aynı müşteri grubuna biri Nisan'da biri de müşteriler yeni reklamınızı gördükten sonra Mayıs ayında olmak üzere iki kez anket yaptınız. Şirketinizin NPS puanı müşteriler reklamı gördükten sonra değişti mi?
T testleri size bir şeyin önemli ölçüde farklı olduğunu söyleyebilir, ancak bu farkın anlamlı olup olmadığına karar vermek size kalır. Örnek boyutu yeterince büyükse, küçük farklar istatistiksel olarak anlamlı olabilirler.
T testi 4 adımda yapılır:
1. T istatistiğini hesaplayın:
Her bir t testi türünde, t istatistiği farklı bir formülle hesaplanır (Bu üç formülü sayfada aşağıya kaydırarak görebilirsiniz).
2. Serbestlik derecelerini hesaplayın:
Serbestlik dereceleri ortalamanın değişiklik gösterebileceği yolların sayısıdır. Bu durumda, serbestlik dereceleri belirli bir yanıtlayan gurubunda alabileceğiniz NPS değerlendirmelerinin sayısıdır. T istatistiğine benzer şekilde, özgürlük derecelerinin formülü yaptığınız t testinin türüne bağlı olarak değişecektir.
3. Kritik değeri belirleyin:
Kritik değer, iki sayı arasındaki farkın istatistiksel olarak anlamlı kabul edildiği eşiktir.
4. T istatistiğinin mutlak değeri ile kritik değerini karşılaştırın:
T istatistiğiniz kritik değerinizden daha büyükse, farkınız anlamlıdır. T istatistiğiniz daha küçükse, iki sayı arasında istatistiksel bakımdan fark yoktur.
Örneğe en başından bakalım: Hipotezinize göre, erkekler şirketinize kadınlardan daha düşük bir NPS puanı veriyor. Erkeklerin verdiği ortalama NPS puanı 9 iken, kadınların verdiği ortalama puan 12. 9 ile 12 arasındaki fark istatistiksel olarak anlamlı mıdır? Bu, iki örnekli t testini kullanabileceğiniz durumlara bir örnektir.
1. T istatistiğini hesaplayın:
İki örnekli t testinin formülü aşağıdadır:
2. Serbestlik derecesi hesaplaması:
Bu formül, iki örnekli t testlerindeki serbestlik derecelerinin belirlenmesinde kullanılmalıdır. Diğer test türleri için kullanılacak formüller aşağıda verilmiştir.
3. Kritik değeri belirleyin:
Bu tabloya göre, 41 derece serbestlikte alfa seviyesi 0,05 olan iki kuyruklu bir test için kritik değer 2,02'dir. Çoğu analist, daha ılımlı olduğu için iki kuyruklu bir test yerine tek kuyruklu bir test kullanır. Bir kuyruklu ve iki kuyruklu testler arasındaki farklar hakkında daha fazla bilgi için Khan Academy'nin bu videosuna göz atın.
4. T istatistiğinin mutlak değeri ile kritik değerini karşılaştırın:
T istatistiğinin mutlak değeri 0,86 olduğu ve 2,02 olan kritik değerden küçük olduğu için, erkeklerin kadınlardan anlamlı ölçüde daha düşük NPS değerlendirmesi vermediği sonucuna varabilirsiniz.
T testlerini muhtemelen bir çalışma sayfasında ya da bir istatistik programı (Excel ya da SPSS gibi) üzerinde yapacaksınız, ancak matematik hesabını elle yapmak isterseniz diğer iki t testi türü için formüller aşağıdadır.
T testlerini birçok insanın yaptığı gibi bir çalışma sayfasında veya istatistik programında yapmaya karar verirseniz, süreç biraz farklı olacaktır. Çoğu program, t istatistiğini kritik değerle karşılaştırmak yerine, çoğu program alfa seviyenizle (en çok kullanılan değer 0,05'tir) eşdeğer bir p değerini hesaplar. Bu durumda, alfa seviyenizden küçük bir p değeri sayıların anlamlı ölçüde farklı olduğunu gösterir.
Net Promoter Score, Bain & Company, Inc., Satmetrix Systems, Inc. ve F. Reichheld'e ait bir ticari markadır.
Bulunduğunuz rolde ya da sektörde geribildirimden yararlanmanıza yardımcı olmak üzere tasarlanan araç takımlarımızı keşfedin.
İşten çıkış görüşmesi anketlerinizle çalışan kaybını azaltın. Hemen bugün çalışan formu oluşturma araçlarımızı ve şablonlarımızı kullanmaya başlayın.
Özel bir onay formu ile ihtiyacınız olan izinleri alın. Hemen ücretsiz kaydolun ve onay formu şablonlarımızla formlar oluşturun.
Gelen tüm talepleri almak için talep formları oluşturun ve bunları özelleştirin. Hemen başlamak için uzmanlarca hazırlanmış şablonlarımızı kullanın.