1.2. Verilerin Toplanması ve Rölöve (Derleme) Kavramı
İstatistik; kollektif olayların incelenmesine, gözlenmesine ve analiz edilmesine yönelik olarak kullanılan yöntemler topluluğudur. Dolayısıyla, istatistik çalışmalarda ilk aşama gözlem yapma ya da veri toplama aşamasıdır. Başka bir deyişle, incelenen olaya yönelik sayım ya da ölçüm yoluyla veri toplamak istatistik çalışmanın ilk aşamasını oluşturmaktadır. Bu aşamaya, ilk bilgilerin veya verilerin toplanması anlamına gelen rölöve veya derleme denir.

İstatistik çalışmalarda araştırmacılar başlıca iki tür veri toplama yöntemini kullanırlar. Bunlara “veri kaynakları” da denilmektedir.

İlk olarak, araştırmacılar bir kurum ya da kuruluş tarafından toplanmış veya düzenlenmiş verileri kullanabilirler. Söz gelimi, nüfus, dış ticaret, enflasyon, milli gelir vb. veriler Türkiye İstatistik Kurumu tarafından toplanmakta, düzenlenmekte ve yayınlanmaktadır. Burada veri bizzat araştırmacı tarafından toplanmadığından bu verilere ikincil veri denmektedir.

Veri toplama işlemi yukarıda olduğu gibi, resmi bir kurum tarafından yapılabileceği gibi, bir başka kurum ve hatta kişi tarafından da yapılabilir. Örneğin, sigorta sektöründe faaliyet gösteren bir firma ile ilgili olarak bir takım analizler yapmayı amaçlıyorsak, ilgili sigorta şirketinden veri temin etme yoluna gideriz. Benzer şekilde, belirli bir hastalık ile ilgili bir çalışma yapıyorsak kamu ya da özel bir hastanenin bu konudaki verilerini kullanabiliriz.

Bazı durumlarda araştırmacılar, araştırma yaptıkları konu ile ilgili veriyi kendileri toplar. Bu tür veri toplama işlemine ise birincil veri toplama yöntemi denmektedir. Örneğin, bir üniversitede eğitim görmekte olan öğrencilerin yemekhane ve kantin memnuniyetini belirlemeyi amaçlıyorsak, veriyi bizzat toplamamız gerekir. Bu durumda, ilgili üniversitede eğitim görmekte olan tüm öğrencileri temsil etmek üzere yeterli sayıda öğrenci ile görüşerek veri toplanması yoluna gidilir.

Rölöve kavramı, araştırmacının veri toplama işini bizzat gerçekleştirdiği durumu ifade eden bir kavram olarak kullanılmaktadır. Bu açıdan bakıldığında; rölöve kavramından, veri toplama işini gerçekleştiren kişi ya da kurum farkı gözetmeksizin, bir veri yaratma süreci anlaşılmalıdır. Örneğin, Türkiye İstatistik Kurumu milli gelir ya da dış ticaret için veri toplar ve yayınlar. Burada, daha önce mevcut olmayan bir veri yaratma süreci ve bu sebeple birincil veri kaynağı söz konusudur. Araştırmacıların Türkiye İstatistik Kurumu tarafından toplanarak yayınlanan milli gelir ya da dış ticaret verilerini bu kurumdan temin etmesi ise ikincil veri kaynağı olarak nitelendirilmektedir. Dolayısıyla, ikincil veri niteliği taşıyan veriler de, verinin ilk yaratılma süreci açısından birincil veri niteliği taşımaktadır.

Birincil veri toplama yöntemlerini;

Deney tasarımı yoluyla veri toplama
Anket, soru formu yöntemiyle veri toplama
Gözlem yoluyla veri toplama
şeklinde sıralayabiliriz.

Deney tasarımı yoluyla veri toplama yöntemi sağlık alanında yapılan çalışmalarda çokça kullanılan bir yöntemdir. Örneğin yeni geliştirilmiş bir ilacın, belirli bir hastalığı tedavi etmede etkili olup olmadığı tespit edilmek istendiğinde, bu hastalığa sahip hastalar (denekler) kontrol ve deney grubu olarak ikiye ayrılarak, bir gruba bilinen ilaç diğerine ise yeni geliştirilen ilaç verilerek tedavi sonunda arada bir fark olup oluşmadığı istatistik testler kullanılarak test edilir.

Benzer şekilde, yeni bir cerrahi yöntemin operasyon sonrası iyileşme sürecini kısalttığı ya da karmaşa riskini azalttığı iddia ediliyorsa cerrahi müdahale geçirecek olan hastalar kontrol ve deney grubu olarak iki gruba ayrılarak bir gruba bilinen cerrahi yöntem, diğerine yeni geliştirilen cerrahi yöntem uygulanarak ameliyat sonrası iyileşme süreci izlenir ve istatistik testler kullanılarak yeni geliştirilen yöntemin daha etkili bir yöntem olup olmadığı tespit edilir.

Anket ya da soru formu yoluyla veri toplama yönteminin en bilinen örneği seçim araştırmalarıdır. Seçim öncesinde seçmenlerin siyasi eğilimleri, bütün seçmen kitlesini temsil etmek üzere seçilen bir örnek üzerinden yapılır. Bu örnek grup içinde yer alan seçmenlere seçim günü kime oy verecekleri sorulur. Böylelikle elde edilen cevaplar analiz edilerek partilerin oy oranları tahmin edilir.

Benzer şekilde, bir sağlık kurumundan sağlık hizmeti alan hastaların memnuniyet dereceleri ölçülmek istendiğinde, hastalara isteğe bağlı olarak, bir anket formu doldurtulur ve verdikleri cevaplar üzerinden hizmet kalitesi ya da hizmet memnuniyeti belirlenmeye çalışılır.

Anket yoluyla veri toplama işlemi yüz yüze görüşme şeklinde yapılabileceği gibi, internet üzerinden veya telefon görüşmesi şeklinde de yapılabilir.

Gözlem yoluyla veri toplama yönteminde ise, araştırmacı incelediği konuya yönelik olarak birimleri doğal ortamlarında gözler ve davranışlarını kaydeder. Örneğin, bir müzeyi ziyaret etmekte olan ziyaretçilerin, ziyaretleri süresince davranışları izlenerek, kaydedilir. Ziyaretçiler izlendiğini bilmemekte ve doğal bir ziyaret eylemi içinde müzeyi gezmektedir. Hangi objeler ile ilgilenildiği, en çok ilgi çeken objeler, gezi güzergâhı, sorunlar vb. hepsi araştırmacı tarafından izlenerek kaydedilir. Daha sonra, çeşitli analizler vasıtasıyla genel bir değerlendirme yapılmış olur.

Verilerin toplanması başlığı altında son olarak veri toplama aşamasının önemini vurgulamak istiyoruz. Şöyle ki, veri toplama aşaması istatistik çalışmaların ilk aşamasını oluşturmakta ve bu aşamada toplanan veriler üzerinden tüm değerlendirme ve analizler yapılmakta ve bir takım sonuçlara ulaşılmakta ya da kararlar verilmektedir. Dolayısıyla, alınan kararların veya elde edilen sonuçların doğruluğu toplanan verinin doğruluğuna bağlıdır. Ancak doğru veri ile doğru sonuçlara ulaşılabilir.

1.3. İstatistik Metodolojisine Yönelik Temel Kavramlar
1.3.1. Anakütle, Örnek Kütle, Parametre ve İstatistik
İstatistiğin konusunun kollektif olaylar olduğunu belirtmiştik. Şimdi bazı temel kavramlar üzerinde durmak istiyoruz.

Veri toplama işlemi incelemeye konu olan tüm birimlerin incelenip incelenmediğine göre ikiye ayrılır:

Bütüne yönelik rölöve, tam sayım
Kısmi rölöve, örnekleme
Araştırmaya konu olan kollektif olaya ilişkin tüm birimlerin oluşturduğu topluluğa anakütle denir. Anakütlede yer alan tüm birimlerin incelenmesi işlemine de tam sayım ya da bütüne yönelik rölöve adı verilir. Burada, kollektif olaya ilişkin hiçbir birim dışarıda tutulmaksızın bir araştırma gerçekleştirilmekte yani tüm birimler araştırmaya dâhil edilmektedir.

Türkiye’nin nüfusunu tespit etmeye yönelik çalışmalar anakütle düzeyinde gerçekleştirilir. Yani amaç, Türkiye nüfusunu oluşturan herkesin yaş, cinsiyet, eğitim, medeni durum vb. özellikleri açısından değerlendirilmesidir.

Ancak, bazı hallerde tüm birimlerin gözlenmesi ya da incelenmesi çok maliyetli olmakta veya çok zaman almaktadır. Söz gelimi, bir siyasi partinin seçim öncesi seçmenlerin siyasi eğilimlerini tespit etmek ve partisinin oy oranını tahmin etmek istediğini düşünelim. Bu durumda, tüm seçmenlere ulaşılarak hangi partiye oy vereceklerini sormak gerekecektir. Milyonlarca seçmen olduğu düşünüldüğünde böyle bir işlem çok sayıda anketör kullanımı gerektirecek ve oldukça maliyetli olacaktır. Öte yandan, milyonlarca seçmen ile görüşmek çok zaman alacaktır. Uzun zaman gerektirecek böyle bir zaman aralığı içinde, ülke gündemi değişebilecek ve buna bağlı olarak seçmenlerin tercihleri farklılaşacak, ölümler ve yeni seçmen niteliği kazanan insanlar olması sonucunda seçmen sayısı ve bileşimi değişecektir. Dolayısıyla, belirli bir an itibarıyla yapılması gereken seçim araştırmasının uzaması neticesinde A partisine oy vereceğini söyleyen bir seçmenin zaman içinde fikir değiştirerek B partisine kayması, C partisine oy verecek bir seçmenin hayatını kaybetmesi, Seçmen niteliği taşımayan birinin seçmen niteliği taşır hale gelmesine rağmen araştırma dışında kalması vb. değişimler olabilecektir.

Hattâ bazı durumlarda anakütlenin tamamını gözlemek mümkün dahi olamamaktadır. Sözgelimi bal arılarıyla ilgili bir çalışma yapmayı planlayalım. Tabiatta bulunan bütün arıları gözlemek, incelemek mümkün olamayacaktır. Zira, bütün arıları, hiçbirini dışlamayacak şekilde, bir araya toplamak ve incelemek mümkün değildir.

Zaman, maliyet ve fiili imkânsızlık durumlarında anakütlenin tamamını gözlemek yerine, anakütleyi temsil edecek nitelik ve yeterlilikte birimi gözlemek yoluna gidilmekte ve az sayıda birimden oluşan ve örnek kütle ya da örneklem adı verilen kütlede yer alan birimler gözlenmektedir.

Bu durumda, örneklem ya da örnek kütle üzerinden veri toplama işlemi gerçekleştirilir ki buna kısmi rölöve denmektedir. Kısmi rölöve ile toplanan veriler üzerinden yapılan analizler sonucunda anakütleye ilişkin çıkarımlarda bulunulur. Bu durumu bir örnek ile açıklamaya çalışalım. Bir ülkede 50 milyon seçmen olduğunu varsayalım. Seçimden birkaç hafta önce, seçim sonuçlarını tahmin etmek isteyelim. 50 milyon seçmenden oluşan anakütle içinden, bu anakütleyi temsil edebilecek bir örnek kütle seçmemiz gerekecektir. Burada önemli olan husus, seçilen örneğin anakütleyi yeterince temsil edebilecek bileşimde ve sayıda seçilmesidir. Bu seçimin nasıl yapılacağına yönelik çok sayıda örnekleme yöntemi vardır. 50 milyon seçmeni temsil edecek 3000 kişi seçtiğimizi varsayalım. Örnek kütlemizde yer alan bu 3000 kişiye bugün seçim olsa hangi partiye oy vereceği sorularak, partilerin oy dağılımı belirlenir.

Hesaplanan oy dağılımı 3000 kişi üzerinden belirlenen oy dağılımı olmakla beraber, 50 milyon seçmen için ortaya çıkacak oy dağılımının tahmini olma özelliği taşır. Dolayısıyla, amaç 50 milyon seçmen için oy dağılımını tahmin etmektir ve bu tahmin 3000 kişi üzerinden yapılmaktadır.

Konunun daha iyi anlaşılması için örnekleme çalışmalarına yönelik basit bir örnek vermek istiyoruz. Bir tencerede dört kişilik bir çorba yaptığımızı varsayalım. Çorbanın içinde çeşitli malzemeler, tuz, baharat vb. bulunacaktır. Çorbayı hazırlayıp pişirdikten sonra, tadı, tuzu ve kıvamının yerinde olup olmadığını anlamak üzere hepsini içmemiz gerekmez. Tencerenin içinden aldığımız tek bir kaşık bize bilgi vermesi açısından yeterlidir. Dolayısıyla, burada bir örnekleme çalışması söz konusudur.

Örneğimizi biraz geliştirelim. Şimdi de, dört kişilik değil, bir öğrenci yemekhanesini için 1000 kişilik bir çorba yaptığımızı varsayalım. Yaptığımız çorbanın miktarı artmıştır. Bu durumda, çorbanın tadı, tuzu ve kıvamını anlamak üzere bir kaşık değil bir kâse mi çorba içmek gerekecektir. Tabii ki hayır.. Yine bir kaşık çorba ile bu tahmini yapabilir ve çorbanın kıvamı, tadı, tuzu hakkında bilgi sahibi olabiliriz. Bir kaşık çorba, tenceredeki çorba miktarı artmış dahi olsa, yine yeterli bir tahmin aracı olacaktır. Hangi koşulda? Büyük bir tencerenin içindeki çorbanın çok iyi karıştırılmış olması durumunda.

Tencerenin içindeki çorbanın çok iyi karıştırılmış olması sağlandığında, tencereden alınan tek bir kaşık, tencerenin içindeki çorbanın tamamını temsil edebilecek bileşimdedir. Karıştırma işlemiyle, çorbadan aldığımız o bir kaşığın içine, çorbada yer alan bütün malzemelerden biraz girmiş olmasını sağlamış oluruz. Dolayısıyla, başarılı bir örnekleme çalışması, çok fazla sayıda örnek çekmekle değil, anakütleyi oluşturan farklı nitelikteki birimlere örnekte yer vermek suretiyle gerçekleştirilebilir.

Örnek seçme işleminin nasıl yapılacağına yönelik, anakütlenin yapısını, birim sayısını ve araştırma yapılan konuyu temel alan çok sayıda örnekleme yöntemi mevcuttur. Bu tekniklere, örnekleme başlığı altında değineceğiz.

Bu başlık altında son olarak parametre ve istatistik kavramlarına değinmek istiyoruz. Anakütleyi karakterize eden değerlere parametre, örnek kütle ya da örneklemi karakterize eden değerlere ise istatistik ya da statistik denir.

Seçim araştırması örneğimizi hatırlayalım. Ülkede 50 milyon seçmen olduğunu ve 3000 seçmen ile görüşerek hangi partiye oy vereceğini sorduğumuzu varsaymıştık. 3000 kişiye sormak suretiyle elde ettiğimiz oy oranları, örnek kütle için hesaplanmıştır ve istatistik adını almaktadır. 50 milyon seçmen için hesaplanan oy oranları ise parametredir.

Dikkat edilecek olursa, örnek istatistiği seçilen örneğe göre farklılık, değişkenlik gösterebilirken parametre o anakütle için tek ve kesin değerdir. Şöyle ki, seçtiğimiz 3000 kişi değişirse, örnek istatistiğimiz de değişir. Farklı örnek kütleler, farklı oy dağılımları ve dolayısıyla farklı örnek istatistikleri yaratır. Oysa, anakütle için hesaplanacak oy dağılımı yani parametre değerleri tek ve kesin değer olmaktadır.

Daha önce istatistiğin tanımı ve konusu başlığı altında tümevarım ya da çıkarsama istatistiği olarak adlandırdığımız çalışma alanı yukarıda bahsettiğimiz örnek istatistiğinden hareketle anakütle parametresini tahmin etme alanıdır.

Bu başlık altında son olarak veri toplama aşamasında yapılan hatalara yani rölöve hatalarına değinmek istiyoruz.

1.3.2. Rölöve Hataları
Çok çeşitli sebeplerle ortaya çıkabilecek rölöve hatalarını çalışmanın bütününe yönelik etkileri açısından tesadüfi hatalar ve sistematik hatalar olmak üzere iki başlıkta inceliyoruz:

Tesadüfi hatalar, farklı yönlerde ve genellikle zıt yönlerde ortaya çıkan hatalar olup, genel olarak değerlendirildiğinde çalışmanın bütününe yönelik etkisi düşük düzeyde olan hatalardır. Örneğin, sayım görevlilerinin bir kadını erkek ya da bir erkeği kadın olarak kodlaması. Bu tür bir hata hep aynı yönde gerçekleşmez. Yani, devamlı olarak erkekler kadın ya da kadınlar erkek olarak kodlanmaz. Dolayısıyla, her iki yönde de yapılabilecek bu tip bir hatanın çalışma üzerinde etkisi, zıt yönde gerçekleşen hatalar birbirini yok edeceği için, çok düşük olacaktır.

Sistematik hatalar ise hep aynı yönde tezahür eden, gerçekleşen hatalardır. Bu tür hatalara örnek olarak, genç görünmek arzusuyla yaşın olduğundan küçük söylenmesi ya da vergi korkusu ile gelirin olduğundan düşük beyan edilmesi verilebilir.

Sistematik hataları tesadüfi hatalardan ayıran en temel özellik, hataların hep aynı yönde gerçekleşmesi ve birim sayısını arttırmak suretiyle bu tür hataların azaltılamamasıdır. Oysa, birim sayısı arttıkça tesadüfi hatalar hem oransal olarak azalmakta hem de artı ve eksi yönde gerçekleştikleri için birbirlerinin etkisini nötr hale getirmektedirler.

Sonuç olarak, tesadüfi hatalar çalışmanın sonuçları üzerinde etkili bir hata olmamakta ancak sistematik hatalar ise dikkate alınması gereken ve çalışmanın sonuçlarını doğrudan etkileyen hatalar olarak karşımıza çıkmaktadır.

Bölüm Özeti
Bu bölümde, istatistiğin tanımı ve konusu üzerinde durduk. Bu bağlamda önce, veri toplama, toplanan verileri düzenleme, özetleme ve sunmayı amaçlayan istatistik alanı olan betimsel istatistikten söz ettik. Daha sonra, tümevarım istatistiği alanına değinerek bu alanla ilgili temel kavramları öğrendik.

İstatistik disiplininde kullanılan temel kavramlardan olan, anakütle, örnek kütle, parametre, istatistik kavramlarını ayrıntılı olarak ele alarak, rölöve hataları üzerinde durduk.

cdn-acikogretim.istanbul.edu.tr/auzefcontent/19_20_Bahar/istatis...



Eklenme Tarihi - 11-09-2020 | Son Güncelleme - 11-09-202094 kez gösterildi.