Loading

Rabu, 25 Desember 2013

cleaning data logika


TUGAS
COMPUTER
“Cleaning Data Logika”


 





Oleh:
SISKA NOVRIMA SARI





PRODI D III KEBIDANAN PADANG 
POLITEKNIK KESEHATAN PADANG
2013/2014

Cleaning Data Logika untuk Memeriksa Konsistensi Data
Cleaning data ditujukan untuk membersihkan data dari data yang tidak lengkap, tidak jelas dan tidak konsisten. Hal ini dilakukan untuk menghindari GIGI (garbage In Garbage Out).
Data yang tidak konsisten bisa terjadi pada data bersyarat yang terkait antar 1 variabel dengan variabel lainnya. Misalnya antara keikut sertaan ker-KB dengan pemakaian kontrasepsi. Responden yang akseptor harus merespon alat kontrasepsi yang dipakainya. Demikian juga apabila dia tidak akseptor maka harus memberikan alasan kenapa tidak ber KB. Responden yang ber KB tapi tidak menyebutkan cara ber KB yang ia lakukan dikatakan tidak konsisten, atau sebaliknya responden yang tidak ber KB tapi menggunakan salah satu kontrasepsi yang ada juga tidak konsisten.
Pada kasus ini akan dilakukan cleaning pada 2 kasus :
1.         Pada Pemeriksaan kehamilan [pernah] dengan frekuensi pemeriksaan kehamilan [kali] dan layanan yang didapat pada pemeriksaan pertama kali [fundus, tensi, ukurtb, tfe dan itt]
2.       Keikut sertaan ber KB [akseptor], kontrasepsi yang dipakai [ksepsi], dan alasan kenapa tidak ber KB [alasan].
Langkah-langkah mengerjakannya adalah sebagai berikut
KASUS 1 : pernah, kali dan ([fundus, tensi, ukurtb, tfe dan itt])
1.         Buat distribusi frekuensi 7 variabel di atas sekaligus
2.       Periksa apakah jumlah yang pernah memeriksakan sudah sama dengan yang merespon berapa kali pemeriksaan kehamilan dan 5 variabel layanan pertama kali.
3.       Jika terdapat perbedaan angka berarti data tidak konsisten.


Pemeriksakan Kehamilan

Frequency
Percent
Valid Percent
Cumulative Percent
Valid
Pernah
3156
94.0
94.0
94.0
Tidak
200
6.0
6.0
100.0
Total
3356
100.0
100.0


Pada output di atas terdapat 3.156 sampel yang menjawab perneah memeriksakan kehamilan, sedangkan pada output frekuensi pemeriksaan kehamilan ada 3.160 yang memberikan jawaban frekuensi. Berarti terdapat perbedaan angka sebanyak 4 orang.
Angka yang 4 berarti ada responden yang tidak pernah memeriksakan kehamilan tapi memberikan jawab berapa kali diperiksa. Hal ini mustahil ditemukan pada alam nyata.  Pada saat mendisain check jika responden yang tidak pernah memeriksakan kehamilan maka kursor akan jumping ke pertanyaan berikutnya tanpa melewati frekuensi pemeriksaan kehamilan. Seharusnya responden yang tidak pernah diperiksa maka frekuensinya akan missing (tidak ada isian).
Frekuensi Pemeriksakan Kehamilan

Frequency
Percent
Valid Percent
Cumulative Percent
Valid
1
158
4.7
5.0
5.0
2
350
10.4
11.1
16.1
3
540
16.1
17.1
33.2
4
735
21.9
23.3
56.4
5
394
11.7
12.5
68.9
6
336
10.0
10.6
79.5
7
151
4.5
4.8
84.3
8
114
3.4
3.6
87.9
9
68
2.0
2.2
90.1
10
104
3.1
3.3
93.4
11
62
1.8
2.0
95.3
12
41
1.2
1.3
96.6
13
26
.8
.8
97.4
14
15
.4
.5
97.9
15
15
.4
.5
98.4
16
8
.2
.3
98.6
17
5
.1
.2
98.8
19
1
.0
.0
98.8
20
3
.1
.1
98.9
21
5
.1
.2
99.1
22
2
.1
.1
99.1
23
3
.1
.1
99.2
31
5
.1
.2
99.4
41
10
.3
.3
99.7
51
5
.1
.2
99.9
61
2
.1
.1
99.9
67
1
.0
.0
100.0
91
1
.0
.0
100.0
Total
3160
94.2
100.0

Missing
System
196
5.8


Total
3356
100.0









Pertanyaan berikutnya adalah bagaimana menemukan 4 record yang tidak konsisten tersebut ?
4.        Temukan record yang missing (tidak konsisten) tersebut.
Untuk menemukan record yang inkonsisten pada kasus ini harus dimengerti lebih dahulu kode variabel. Kode untuk variabel pernah adalah 1=pernah, 2=tidak. Oleh karena ketentuan yang benar semua responden yang tidak pernah maka frekuensi pemeriksaannya harus missing, maka tugas kita adalah mencari responden yang tidak pernah tapi frekuensinya terisi.
Perintah SPSS yang dapat digunakan untuk menemukan record adalah sort (mengurutkan data). Pengurutan data dilakukan untuk 2 variabel sekaligus (pernah dan kali).
Urutkan variabel pernah dengan sort cases descending (agara kode 2 tidak terletak di atas) dan variabel kali dengan sort order descending juga agar dari semua yang tidak pernah memeriksakan kehamilan tapi frekuensinya ada akan terletak paling atas dari urutan data.


Seharusnya responden yang tidak pernah memeriksakan kehamilan frekuensinya missing, maka pada gambar di atas setelah disort terlihat 4 record terisi frekuensinya. Inilah data yang dilaporkan tidak konsisten pada perintah frequencies pada langkah 1 di atas.
5.       Lakukan pengecekan pada kuesioner fisik tentang ketidak konsistenan ini. Jika diperlukan perlu melakukan pegukuran kembali ke objek ukur.







KASUS 2 : akseptor, ksesi dan alasan
Pada kasus 2 ini akan diperiksa apakah yang menggunakan kontrasepsi hanyalah responden yang ber KB saja, atau apakah ada responden yang tidak ber KB tapi menggunakan kontrasepsi juga. Langkah mengerjakannya pada prinsipnya sama dengan langkah pada kasus 1.
1.         Periksa konsistensi ketiga variabel dengan perintah frequencies. Hasil output analysis SPSS sebagai berikut :

Akseptor KB  (Y/T)

Frequency
Percent
Valid Percent
Cumulative Percent
Valid
Tidak
939
28.0
28.0
28.0
Ya
2417
72.0
72.0
100.0
Total
3356
100.0
100.0



Kontrasepsi yang Dipakai

Frequency
Percent
Valid Percent
Cumulative Percent
Valid
IUD
851
25.4
35.2
35.2
Kondom
403
12.0
16.7
51.9
Pil
834
24.9
34.5
86.4
Susuk
162
4.8
6.7
93.1
Lain2
166
4.9
6.9
100.0
Total
2416
72.0
100.0

Missing
System
940
28.0


Total
3356
100.0




Alasan Tidak ber-KB

Frequency
Percent
Valid Percent
Cumulative Percent
Valid
Masih Ingin Punya Anak
401
11.9
40.5
40.5
Dilarang Suami
402
12.0
40.6
81.1
Tidak Sesuai Keyakinan
164
4.9
16.6
97.7
Lain2
23
.7
2.3
100.0
Total
990
29.5
100.0

Missing
System
2366
70.5


Total
3356
100.0



Jumlah responden yang ber KB (tabel 2.a) adalah 2.417 sedangkan yang menggunakan kontrasepsi (Tabel 2.b) sebanyak 2.416. Artinya ada 1 orang responden yang mengaku ber KB tapi tidak menggunakan kontrasepsi apapun (tidak konsisten)
Selanjutnya ada 939 responden yang tidak ber KB tapi yang memberikan alasan kenapa tidak ber KB (Tabel 2.c) sebanyak 990. Artinya ada sebanyak 51 responden yang akseptor tapi masih memberikan alasan kenapa TIDAK ber KB. Jelas hal ini tidak konsisten.
Terdapat 2 inkonsistensi pada data di atas, yaitu ada 1 orang responden ber KB tapi tidak menggunakan kontrasepssi apapun dan ada 51 orang responden yang ber KB  tapi memberikan juga alasan kenapa ia tak ber KB.
2.       Menemukan Record yang Missing
Untuk menemukan record yang inkonsisten pada kasus ini harus dimengerti lebih dahulu kode variabel. Kode untuk variabel pernah adalah 1=ya, 0=tidak. Oleh karena ketentuan yang benar semua responden yang tidak menjadi akseptor harus missing, maka tugas kita adalah mencari responden yang tidak menjadi akseptor tapi kontrasepsi nya terisi.
Perintah SPSS yang dapat digunakan untuk menemukan record adalah sort (mengurutkan data). Pengurutan data dilakukan untuk 2 variabel sekaligus (akseptor dan ksepsi).
Urutkan variabel ya dengan sort order asscending (agara kode 2  tidak terletak di atas) dan variabel ksepsi dengan sort order asscending juga agar dari semua yang tidak menjadik akseptor tapi memakai kontrasepsi.



                          





Seharusnya responden yang tidak menjadi akseptor maka tidak menggunakan alat kontasepsi, maka setelah disort terlihat 1 record terisi kontrasepsi. Inilah data yang dilaporkan tidak konsisten pada perintah frequencies pada langkah 1 di atas.
Lakukan pengecekan pada kuesioner fisik tentang ketidak konsistenan ini. Jika diperlukan perlu melakukan pegukuran kembali ke objek ukur.

Tidak ada komentar:

Posting Komentar