20 Nisan 2025 Pazar

Etkileşimli İstatistik Dersi

İstatistiksel Araştırma Süreci ve Veri Analizi

Konuyu Öğren ve Pekiştir

Bu bölümde istatistiksel araştırma sürecinin adımlarını, tek nicel değişkenli verilerin nasıl analiz edileceğini ve yorumlanacağını öğreneceğiz.

İstatistiksel Araştırma Süreci Nedir?

İstatistiksel araştırma süreci, verilerden anlamlı bilgilere ulaşmak, tahminlerde bulunmak veya kararlar vermek amacıyla yapılan sistematik ve bilimsel bir çalışmadır. Bu süreç, bir problemi çözmek, bir durumu anlamak veya bir hipotezi test etmek için verilerin toplanmasını, analiz edilmesini ve yorumlanmasını içerir. (Kaynak: PDF Sayfa 151)

Bu süreç, genellikle döngüsel bir yapıda ilerler ve aşağıdaki temel adımları kapsar (Döngüsel Şema - Kaynak: PDF Sayfa 152, 515):

  • Araştırma Sorusunu Oluşturma: Sürecin başlangıç noktasıdır. Merak edilen bir konu veya çözülmesi gereken bir problem net bir şekilde tanımlanır. Soru, araştırmanın amacını ve yönünü belirler. Örneğin, "Bir bölgedeki öğrencilerin ders çalışma süreleri ne kadar?" gibi bir soru bu aşamada oluşturulur.
  • Veri Toplama Planı Yapma ve Veri Toplama: Araştırma sorusuna cevap verebilmek için hangi verilerin, nasıl, ne zaman ve kimlerden toplanacağı planlanır. Ardından bu plana uygun olarak veriler toplanır. Bu aşamada, rastgelelik ve etik kurallara dikkat etmek kritik öneme sahiptir.
  • Verileri Analiz Etme: Toplanan veriler, istatistiksel yöntemler ve grafikler kullanılarak incelenir. Merkezi eğilim (ortalama, ortanca) ve yayılım (standart sapma, açıklık) gibi ölçüler hesaplanır; histogram veya kutu grafiği gibi araçlarla veriler görselleştirilir.
  • Sonuçları Yorumlama: Analiz sonuçları, araştırma sorusuna cevap verecek şekilde yorumlanır. Elde edilen bulgular, evrene genellenir veya karar alma süreçlerinde kullanılır. Ayrıca, yeni sorular ortaya çıkarsa süreç yeniden başlar.

Döngüsel Yapı: İstatistiksel araştırma süreci doğrusal bir çizgi gibi bitmez; sonuçlar yeni sorular doğurabilir veya eksiklikler fark edilirse önceki adımlara dönülebilir. Örneğin, analiz sonrası veri toplama yönteminin yetersiz olduğu fark edilirse, yeni bir planla süreç baştan başlatılabilir.

Önemli Not: Bu süreç, bilimsel bir yaklaşım gerektirir. Sistematik olmasının sebebi, sonuçların güvenilir, tutarlı ve tekrarlanabilir olmasını sağlamaktır. Rastgele veya düzensiz bir şekilde veri toplamak, yanlış çıkarımlara yol açabilir.

Pekiştirme Soruları

1. İstatistiksel araştırma sürecinin temel amacı nedir?

2. Araştırma sürecindeki ilk adım nedir?

3. İstatistiksel araştırma sürecinin döngüsel yapısı neyi ifade eder?

4. Verilerin analiz edilmesi hangi aşamada gerçekleşir?

5. Sürecin son aşamasında ne yapılır?

6. Araştırma süreci neden sistematik bir çalışma gerektirir?

7. Hangi durumda süreç yeniden başlatılabilir?

8. İstatistiksel araştırma sürecinde tahminler hangi aşamada kullanılır?

9. Araştırma sürecinde veri toplama neden önemlidir?

10. İstatistiksel araştırma süreci hangi özelliği ile bilimsel kabul edilir?

Temel Kavramlar ve Tanımlar

Veri Türleri ve Temel İstatistikler

  • Nicel Veri: Sayma veya ölçme yoluyla elde edilen sayısal verilerdir. (Örn: boy uzunluğu, sıcaklık, gelir miktarı) (Kaynak: PDF Sayfa 155)
  • Evren: Araştırma sonuçlarının genellenmek istendiği topluluktur. (Kaynak: PDF Sayfa 158, 167)
  • Örneklem: Evreni temsil etmesi amacıyla verilerin toplandığı alt kümedir. (Kaynak: PDF Sayfa 167)
  • Değişken: Gözlemlenen elemanlar arasında farklılık gösteren özelliklerdir. (Kaynak: PDF Sayfa 158)
Örnek Kutu Grafiği (Görsel Eklenecek)

Merkezi Eğilim Ölçüleri (Verilerin Nerede Toplandığını Gösterir)

  • Aritmetik Ortalama:

    Bir veri setindeki tüm değerlerin toplanıp, toplam veri sayısına bölünmesiyle elde edilir. Veri setinin "denge noktası"dır. Sembolü: x¯ veya μ. Verilerin genel merkezini gösterir ancak aykırı (uç) değerlerden çok etkilenir. (PDF S.181'de etkisi tartışılıyor).

  • Ortanca (Medyan):

    Sıralanmış veri setinin tam ortasındaki değerdir. Veri setini iki eşit parçaya böler. Aykırı değerlerden etkilenmez veya çok az etkilenir, bu nedenle çarpık dağılımlarda merkezi eğilimi ortalamadan daha iyi temsil edebilir. (PDF S.181'de aykırı değerlere karşı dayanıklılığı belirtiliyor).

Yayılım Ölçüleri (Verilerin Ne Kadar Yayıldığını Gösterir)

  • Açıklık (Range):

    Veri setindeki en büyük değer ile en küçük değer arasındaki farktır (Maks - Min). Verilerin toplam yayılım aralığını gösterir ama sadece uç değerlere baktığı için aykırı değerlerden çok etkilenir ve iç dağılım hakkında bilgi vermez. (PDF S.179, 359'da kullanılıyor).

  • Çeyrekler Açıklığı (IQR - Interquartile Range):

    Sıralanmış veri setinde üst çeyrek (Q3 - %75. nokta) ile alt çeyrek (Q1 - %25. nokta) arasındaki farktır (IQR = Q3 - Q1). Verilerin ortadaki %50'sinin yayılımını gösterir. Aykırı değerlerden etkilenmediği için açıklığa göre daha güvenilir bir yayılım ölçüsüdür. Kutu grafiğindeki kutunun uzunluğunu verir. (Kaynak: PDF Sayfa 176).

  • Standart Sapma:

    Verilerin, aritmetik ortalamadan tipik olarak ne kadar saptığını gösteren bir ölçüdür. Büyük standart sapma, verilerin ortalama etrafında daha çok yayıldığını; küçük standart sapma ise ortalamaya daha yakın kümelendiğini gösterir. Tüm verileri dikkate aldığı için hassas bir yayılım ölçüsüdür ancak aykırı değerlerden etkilenebilir. Sembolü: 's' veya 'σ'. (Kaynak: PDF Sayfa 178).

Değişebilirlik Türleri

Değişebilirlik (Variability) - Detaylı Açıklama

İstatistiksel bir araştırmada toplanan verilerin birbirinden farklı değerler alması durumudur. Bu farklılıkların neden kaynaklandığını anlamak, veriyi doğru yorumlamak için önemlidir. Dört ana türü vardır (Kaynak: PDF Sayfa 158, 160-161):

  • 1. Doğal Ortamdan Kaynaklı Değişebilirlik:

    Doğada var olan ve ölçülen özelliğin kendisinden kaynaklanan farklılıklardır. Araştırmacı müdahale etmez, sadece doğal durumu gözlemler.

    Örnekler:
    • Farklı günlerde deniz suyu sıcaklığının ölçülmesi.
    • Voleybol takımına seçilecek öğrencilerin kol uzunluklarının farklı olması.
    • Bir şehirdeki farklı su kaynaklarının kirlilik derecelerinin farklı olması.
  • 2. Ölçümden Kaynaklı Değişebilirlik:

    Ölçüm yapmak için kullanılan araçlardan (örn: cetvel, terazi, kronometre) veya ölçümü yapan kişinin farklı ölçüm tekniklerinden kaynaklanan farklılıklardır.

    Örnekler:
    • Bir öğrencinin aynı masanın uzunluğunu cetvelle tekrar tekrar ölçtüğünde biraz farklı sonuçlar bulması.
    • Bir kişinin kronometre ile topun düşme süresini birden fazla kez ölçtüğünde küçük farklılıklar elde etmesi.
  • 3. Müdahaleden Kaynaklı Değişebilirlik:

    Araştırmacının, belirli bir etkiyi (müdahaleyi) gözlemlemek için koşulları değiştirmesi sonucu ortaya çıkan farklılıklardır. Genellikle deneylerde görülür.

    Örnekler:
    • Farklı gübrelerin aynı tür bitkilerin büyümesine farklı etkileri.
    • Farklı tuzluluk oranlarının balık gelişimine etkisi.
    • Oksijenli ve oksijensiz ortamın bakteri üremesine etkisi.
  • 4. Örneklemden Kaynaklı Değişebilirlik:

    Aynı evrenden (ana kitle) rastgele farklı örneklemler (alt gruplar) seçildiğinde, bu örneklemlerden elde edilen sonuçların birbirinden farklı olmasıdır.

    Örnekler:
    • Rastgele seçilen iki farklı 150 kişilik grubun matematik ortalamalarının farklı çıkması.
    • Bir okuldan seçilen farklı öğrenci gruplarının yıl sonu not ortalamalarının farklı olması.

Pekiştirme Soruları

1. Nicel veri nedir?

2. Standart sapma neyi ölçer?

3. Ortanca (medyan) neden aykırı değerlerden az etkilenir?

4. Çeyrekler açıklığı (IQR) hangi verilerin yayılımını gösterir?

5. "Doğal ortamdan kaynaklı değişebilirlik" örneği hangisidir?

6. Evren ile örneklem arasındaki temel fark nedir?

7. Açıklık (range) neden aykırı değerlerden çok etkilenir?

8. Değişken nedir?

9. Aritmetik ortalama hangi durumda yanıltıcı olabilir?

10. "Müdahaleden kaynaklı değişebilirlik" için örnek nedir?

İstatistiksel Araştırma Sorusu Oluşturma

İstatistiksel araştırma sorusu, bir araştırmanın temel taşıdır ve tüm süreci yönlendirir. İyi bir soru, açık, net ve veriyle cevaplanabilir olmalıdır. Aşağıdaki özelliklere sahip olmalıdır (Kaynak: PDF Sayfa 159):

  • Amacı Net Olmalı: Soru, neyi anlamak veya çözmek istediğini açıkça belirtmelidir. Betimleyen (bir durumu tanımlayan) veya karşılaştıran (gruplar arası farkları inceleyen) bir yapıda olabilir.
  • Araştırmaya Değer Olmalı: Soru, çözülmesi anlamlı bir problemi veya merak uyandıran bir konuyu ele almalıdır. Örneğin, "Bir şehirdeki hava kirliliği seviyesi nedir?" anlamlıdır, ancak "Bir sokaktaki taşların sayısı nedir?" genellikle araştırmaya değmez.
  • İlgilenilen Grup (Evren) Açık Olmalı: Soru, hangi topluluğa odaklandığını netleştirmelidir. Örneğin, "9. sınıf öğrencileri" mi, yoksa "tüm lise öğrencileri" mi?
  • Değişken Açıkça Görülmeli: Ölçülecek veya analiz edilecek özellik (örneğin, ders çalışma süresi, boy uzunluğu) belirtilmelidir.
  • Veri Toplanarak Cevaplanabilmeli: Soru, gözlem veya ölçümle elde edilebilir verilere dayanmalıdır. Örneğin, "Öğrenciler ne düşünüyor?" yerine "Öğrencilerin haftalık ders çalışma süresi nedir?" daha uygundur.
  • Değişebilirliği Yansıtmalı: Verilerin farklılık gösterebileceği bir durum olmalıdır. "Tüm öğrencilerin boyu aynı mı?" yerine "Öğrencilerin boy uzunlukları nasıl dağılır?" daha iyi bir sorudur.
  • Odaklanılan Grup Analize İmkân Vermeli: Evren veya örneklem, istatistiksel analiz yapılabilecek kadar büyük ve uygun olmalıdır.
  • Nicel Veri Toplamaya Uygun Olmalı: Bu konu kapsamında, soru sayısal verilere dayanmalıdır. Örneğin, "Öğrencilerin en sevdiği renk nedir?" yerine "Öğrencilerin günlük su tüketimi kaç litredir?" daha uygundur.

Betimleyen ve Karşılaştıran Sorular:

  • Betimleyen Sorular: Bir grup veya durumun özelliklerini tanımlar. Örnek: "Bir lisedeki öğrencilerin haftalık fiziksel etkinlik süreleri nasıl bir eğilim göstermektedir?" Bu soru, tek bir grubun dağılımını ve eğilimini anlamaya yöneliktir.
  • Karşılaştıran Sorular: İki veya daha fazla grubu karşılaştırır. Örnek: "A lisesindeki kız ve erkek öğrencilerin ev ödevi süreleri nasıl farklılaşmaktadır?" Bu soru, gruplar arası farkları incelemeyi amaçlar.

Örnek Soru Türleri

Betimleyen Soru: "A lisesindeki 9. sınıf öğrencilerinin haftalık fiziksel etkinlik süreleri nasıl bir eğilim göstermektedir?" (Kaynak: PDF Sayfa 168)

Karşılaştıran Soru: "A lisesindeki öğrencilerin ev ödevi süresi, cinsiyete göre nasıl farklılaşmaktadır?" (Kaynak: PDF Sayfa 166)

Uygun Olmayan Soru: "Öğrenciler neyi sever?" (Bu soru belirsizdir, nitel veri içerir ve ölçülebilir değildir.)

Pekiştirme Soruları

1. İyi bir araştırma sorusu hangi özelliği taşımalıdır?

2. "9. sınıf öğrencilerinin haftalık ders çalışma süreleri nedir?" sorusu hangi türdendir?

3. "Kız ve erkek öğrencilerin matematik notları farklılık gösterir mi?" sorusu hangi türdendir?

4. Bir araştırma sorusu neden değişebilirliği yansıtmalıdır?

5. Hangi soru nicel veri toplamaya uygun değildir?

6. Araştırma sorusu neden net bir amaca sahip olmalıdır?

7. "Bir okulun öğrencilerinin yaş ortalaması nedir?" sorusu hangi özelliğe sahiptir?

8. İyi bir soruda evren neden açıkça belirtilmelidir?

9. Hangi soru araştırmaya değer olmayabilir?

10. "Öğrencilerin boy uzunlukları nasıl dağılır?" sorusu hangi özelliği taşır?

Veri Toplama Planı

Veri toplama planı, araştırma sorusuna cevap verecek verilerin nasıl elde edileceğini düzenleyen bir yol haritasıdır. Verilerin güvenilir, geçerli ve yanlılıktan uzak olmasını sağlamak için bu aşama kritik öneme sahiptir. İyi bir plan, aşağıdaki unsurları içermelidir (Kaynak: PDF Sayfa 167, 279):

  • Veri Toplama Aracı: Veriler hangi yöntemle toplanacak? Anket (soru formu), ölçüm (cetvel, termometre), gözlem veya deney gibi araçlar seçilir. Araç, değişkenin doğasına uygun olmalıdır. Örneğin, boy uzunluğu için cetvel, etkinlik süresi için anket kullanılabilir.
  • Evren ve Örneklem: Veriler kimlerden toplanacak? Evren (örneğin, bir okulun tüm öğrencileri) ve örneklem (örneğin, rastgele seçilen 100 öğrenci) tanımlanır. Örneklemin evreni temsil etmesi için rastgele seçim yöntemleri (örneğin, kura çekme) kullanılmalıdır.
  • Değişkenler: Hangi özellikler ölçülecek? Örneğin, "haftalık fiziksel etkinlik süresi" açıkça belirtilmelidir. Değişkenlerin netliği, analiz aşamasını kolaylaştırır.
  • Verilerin Nerede, Ne Zaman, Nasıl ve Kimler Tarafından Toplanacağı: Veri toplama süreci detaylıca planlanır. Örneğin, "Okulda, Nisan 2025'te, ders çıkışında, araştırmacılar tarafından" gibi. Zamanlama, verilerin tutarlılığını etkileyebilir (örneğin, tatil dönemi farklı sonuçlar verebilir).
  • Verilerin Nasıl Kaydedileceği: Veriler kağıt üzerinde mi, dijital bir tabloda mı saklanacak? Kayıt yöntemi, veri kaybını önler ve analiz için hazır hale getirir. Örneğin, Excel veya Google Sheets kullanılabilir.
  • Gizlilik, Etik Kurallar ve Nesnellik: Katılımcıların gizliliği korunmalı, katılım gönüllü olmalı ve araştırmacı yanlılıktan kaçınmalıdır. Örneğin, kişisel bilgiler paylaşılmamalı ve veri manipüle edilmemelidir.

Neden Önemli? Plansız veri toplama, eksik, yanlış veya yanlı sonuçlara yol açabilir. Örneğin, bir okulda sadece başarılı öğrencilerin seçilmesi, evreni temsil etmez ve sonuçları çarpıtır. Rastgelelik ve sistematik bir yaklaşım, bu sorunları önler.

Örnek: Fiziksel Etkinlik Araştırması Planı (Detaylı)

Amaç: A Lisesi 9. sınıf öğrencilerinin haftalık fiziksel etkinlik sürelerini belirlemek.

Araç: Anket (Öğrencilere cinsiyet ve haftalık etkinlik süresi sorulacak; süre dakika cinsinden ölçülecek).

Evren: A Lisesi'ndeki tüm 9. sınıf öğrencileri (620 kişi).

Örneklem: Rastgele seçilecek 100 öğrenci (Örneğin, öğrenci numaraları bir torbaya atılıp kura ile çekilecek).

Değişken: Haftalık fiziksel etkinlik süresi (nicel, dakika cinsinden).

Uygulama: Anketler, Nisan 2025'te, ders çıkışında okul bahçesinde, iki araştırmacı tarafından yüz yüze uygulanacak. Alternatif olarak, Google Forms ile dijital toplama yapılabilir.

Kayıt: Veriler, bir elektronik tabloya (Excel) girilecek ve yedeklenecek.

Etik: Öğrencilerin kimlik bilgileri gizli tutulacak, katılım isteğe bağlı olacak ve veriler sadece araştırma için kullanılacak.

(Kaynak: PDF Sayfa 168-169)

Pekiştirme Soruları

1. Veri toplama planında ilk olarak ne belirlenmelidir?

2. Örneklem nasıl seçilmelidir?

3. Veri toplama planında etik kurallar neden önemlidir?

4. "Anket" hangi tür veri toplama aracıdır?

5. Veri toplama planında "değişkenler" neden belirtilir?

6. Rastgelelik örneklem seçiminde neden önemlidir?

7. Veri toplama planında zamanlama neden belirtilir?

8. Hangi yöntem veri toplama aracı olarak kullanılamaz?

9. Veri toplama planında gizlilik neden önemlidir?

10. Veri toplama planında veriler nasıl kaydedilmelidir?

Veri Analizi ve Görselleştirme

Toplanan verileri anlamlandırmak için çeşitli grafikler ve özet ölçüler kullanılır.

Histogram

Sürekli veya gruplandırılmış nicel verilerin dağılımını görselleştirmek için kullanılır. Verilerin belirli aralıklarda (sınıflar/bin'ler) ne sıklıkla bulunduğunu gösterir. Sütunlar bitişiktir ve yükseklikleri frekansı temsil eder. Veri dağılımının şekli (simetrik, çarpık vb.), merkezi ve yayılımı hakkında görsel bilgi sunar. Sınıf aralığı seçimi görünümü etkiler. (Kaynak: PDF Sayfa 175)

Örnek: Avlanan Sazan Balığı Miktarı (Histogram)

Bu histogram, illerde avlanan sazan miktarlarının (ton) hangi aralıklarda yoğunlaştığını gösterir. Örneğin, 0-50 ton arası avlanan il sayısı en fazladır.

Örnek Histogram Grafiği (Görsel Eklenecek)

(Kaynak: PDF Sayfa 175)

Kutu Grafiği (Box Plot)

Veri setinin dağılımını "Beş Sayılı Özet" (Minimum, Q1, Ortanca, Q3, Maksimum) ile gösterir. Kutunun kenarları Q1 ve Q3'ü, içindeki çizgi ortancayı gösterir. "Bıyıklar" genellikle aykırı olmayan en uç değerlere uzanır. Aykırı değerler ayrı noktalarla gösterilir. Verilerin merkezini, yayılımını (özellikle IQR), simetrisini ve aykırı değerleri hızlıca görmeyi sağlar. Grupları karşılaştırmak için idealdir. (Kaynak: PDF Sayfa 176, 180-181).

Örnek: 100m Koşu Dereceleri (Kutu Grafiği)

Bu kutu grafiği, atletlerin 100m derecelerinin dağılımını gösterir. Ortanca derece, derecelerin %50'sinin hangi aralıkta (Q1-Q3 = IQR) yoğunlaştığı ve aykırı dereceler görülebilir.

Örnek Kutu Grafiği (Görsel Eklenecek)

(Kaynak: PDF Sayfa 180-181)

Nokta Grafiği (Dot Plot)

Basit bir grafik türüdür. Sayı doğrusu üzerinde her bir veri noktası bir nokta ile temsil edilir. Aynı değere sahip birden fazla veri varsa, noktalar o değer üzerinde dikey olarak üst üste yığılır. Veri setinin genel dağılımını, kümelenmeleri, boşlukları ve aykırı değerleri görmek için kullanışlıdır, özellikle küçük veri setleri için. (Kaynak: PDF Sayfa 152, 157 - Grafik 6.2, 174)

Özet İstatistiklerin Yorumlanması

Grafiklerin yanı sıra hesaplanan istatistikler de önemlidir:

  • Ortalama ve Ortanca: Merkezi eğilimi gösterir. Aralarındaki fark, dağılımın çarpıklığı hakkında fikir verebilir. Ortanca, aykırı değerlere karşı daha dirençlidir.
  • Açıklık, IQR ve Standart Sapma: Yayılımı gösterir. IQR, verilerin orta %50'sinin yayılımını verir ve aykırı değerlerden etkilenmez. Standart sapma, ortalamadan tipik sapmayı gösterir ve tüm verileri kullanır.

Örnek: Katı Atık Miktarı Yorumlama

Farklı yıllara ait katı atık miktarı verileri (örneğin kutu grafikleri veya ortalama/ortanca/standart sapma değerleri ile) karşılaştırılarak yıllar içindeki değişim eğilimi ve yayılımı yorumlanabilir. (Kaynak: PDF Sayfa 183-185)

Karşılaştırmalı Kutu Grafikleri (Görsel Eklenecek)

Pekiştirme Soruları

1. Histogram hangi tür veriler için uygundur?

2. Kutu grafiğinde "bıyıklar" neyi gösterir?

3. Nokta grafiği hangi durumda kullanışlıdır?

4. Ortalama ile ortanca arasındaki fark neyi gösterebilir?

5. Histogramda sınıf aralığı artırılırsa ne olur?

6. Kutu grafiği hangi özet ölçüleri gösterir?

7. Nokta grafiğinde aynı değerdeki veriler nasıl gösterilir?

8. Veri analizi neden görselleştirme ile desteklenir?

9. Kutu grafiğinde aykırı değerler nasıl gösterilir?

10. Histogramda sütunların yüksekliği neyi temsil eder?

Hiç yorum yok:

Yorum Gönder