, caothuthao1993 chez caothuthao1993
Published on
8.phuong phap chon mau, co mau
1. MẪU VÀ PHƯƠNG PHÁP CHỌN MẪU
2. 2 Mục tiêu học tập 1. Xác định được quần thể đích, quần thể nghiên cứu, đơn vị mẫu 2. Lựa chọn được phương pháp chọn mẫu thích hợp 3. Dự kiến được các loại sai số trong quá trình chọn mẫu và các biện pháp khắc phục. 4. Tính được cỡ mẫu cho một nghiên cứu
3. 3 Khái niệm Quần thể NC Mẫu Chọn ? ? Quần thể đích
4. 4 Đơn vị lấy mẫu, khung mẫu Đơn vị lấy mẫu: là đơn vị của quần thể được chọn vào mẫu Khung mẫu: Danh sách các đơn vị mẫu hoặc bản đồ phân bố mẫu. Đơn vị nghiên cứu: là một chủ thể mà sự quan sát hoặc đo lường sẽ được thực hiện trên chủ thể (người hoặc vật thí nghiệm)
5. 5 Nghiên cứu về sử dụng hố xí tại xã X 200 hộ Chủ hộ Đại diện hgđ PVDanh sách Các hộ gia đình trong xã Chọn Đơn vị lấy mẫu Khung mẫu Đơn vị NC
6. 6 Không đủ kinh phí Sai số trong điều tra toàn thể Mẫu đủ lớn sẽ ngoại suy ra toàn quần thể Lý do chọn mẫu
7. 7 CÁC PHƯƠNG PHÁP CHỌN MẪU
8. 8 Các phương pháp chọn mẫu Chọn mẫu có xác suất Ngẫu nhiên đơn Ngẫu nhiên hệ thống Phân tầng Mẫu cụm Nhiều giai đoạn Chọn mẫu không xác suất Thuận tiện Chỉ tiêu Mục đích
9. 9 Chọn mẫu ngẫu nhiên đơn
10. 10 Là mẫu mà tất cả các thể trong quần thể có cùng cơ hội để chọn vào mẫu. Cách chọn: Lập danh sách toàn bộ những đơn vị mẫu trong quần thể Sử dụng phương pháp “bốc thăm” hoặc sử dụng bảng số ngẫu nhiên để chọn đơn vị mẫu Chọn mẫu ngẫu nhiên đơn
11. 11 Chọn mẫu ngẫu nhiên đơn Ưu điểm: Cách làm đơn giản, tính đại diện cao Có thể lòng vào các kỷ thuật chọn mẫu khác Hạn chế: Cần phải có khung mẫu Các cá thể được chọn vào mẫu có thể phân bố tản mạn.
12. 12 Chọn mẫu ngẫu nghiên hệ thống Sampling interval’s width is determined and individuals selected.
13. 13 Chọn mẫu ngẫu nghiên hệ thống Những cá thể được chọn theo một khoảng cách đều đặn Cách chọn Ghi một danh sách đơn vị mẫu Xác định khoảng cách mẫu k=N/n Chọn một số ngẫu nhiên (i) giữa 1 và k. Các cá thể có số thứ tự i + 1k, i + 2k, i + 3k… sẽ được chọn vào mẫu
14. 14 Chọn mẫu phân tầng
15. 15 Chọn mẫu phân tầng Là việc phân chia các cá thể của quần thể nghiên cứu thành các nhóm riêng lẽ Lý do phân tầng: Có sự khác biệt về đặc tính nghiên cứu của các cá thể ở các tầng Tầng có thể phân chia theo: Khu vực địa lý, giới, tuổi, nghề nghiệp… Ví dụ: Để khảo sát các yếu tố nguy cơ gây bệnh Đái tháo đường tại thành phố CT, nhà nghiên cứu có thể phân chia tầng theo thành thị và nông thôn
16. 16 Cách chọn mẫu tầng Thành phố CT Nông thôn Thành thị PhườngXã
17. 17 Cluster sample Chọn mẫu chùm (cụm)
18. 18 Chọn mẫu chùm (cụm) Do không có khung mẫu hoặc nghiên cứu trên địa bàn rộng Có được các nhóm của các đơn vị nghiên cứu có sẵn (các làng, các trường học) Việc chọn những nhóm các đơn vị nghiên cứu (các cụm) thay cho việc chọn cá nhân những đơn vị nghiên cứu.
19. 19 Chọn mẫu chùm (cụm) Các cụm thường là những đơn vị địa lý (xã, ấp/khu vực) hoặc những đơn vị tổ chức (các phòng khám, trường học…). Số lượng cụm, tuỳ vào số cụm. Nên chọn 30 Ví dụ: Chọn mẫu cụm trong xác định tỷ lệ bao phủ tiêm chủng trẻ dưới 5 tuổi của tỉnh X
20. 20 Dân số chọn mẫu Mẫu cụm bậc 1 Mẫu cụm bậc 2 Chọn mẫu chùm (cụm)
21. 21 Chọn mẫu PPS – Xác suất tỷ lệ với kích cỡ của quần thể Sử dụng khi nghiên cứu trên cộng đồng lớn, kích thước các cộng đồng không đều nhau Các bước thực hiện 1. Liệt kê các cụm và dân số 2. Xếp các cụm theo một trình tự và cộng dồn 3. Chọn khoảng cách mẫu k = Dscd/số cụm 4. Chọn ngẫu nhiên con số i nào đó, chọn cụm đầu tiên có dân số cộng dồn lớn hơn hoặc bằng i 5. Các cụm kế tiếp tính bằng cách lấy i + k
22. 22 Ví dụ Một nghiên cứu về tình trạng sâu răng của học sinh tiểu học tại quận Ninh kiều TPCT. Cỡ mẫu: 300 học sinh Số lượng trường tiểu học là 10 Số lượng trường tiểu học cần chọn là 4 Các bước chọn theo PPS?
23. 23 Tên trường và số lượng học sinh Tên Trường Số lượng 1 400 2 700 3 800 4 1200 5 1800 6 300 7 800 8 900 9 1100 10 1000 Tổng 9000
24. 24 Cộng dồn Tên Trường Số lượng Cộng dồn 1 400 400 2 700 1100 3 800 1900 4 1200 3100 5 1800 4900 6 300 5200 7 800 6000 8 900 6900 9 1100 8000 10 1000 9000 Tổng 9000
25. 25 Tính khoảng cách k Tên Trường Số lượng Cộng dồn Khoảng cách k 1 400 400 2250 2 700 1100 3 800 1900 4 1200 3100 5 1800 4900 6 300 5200 7 800 6000 8 900 6900 9 1100 8000 10 1000 9000 Tổng 9000
26. 26 Chọn số ngẫu nhiên i <= k Tên Trường Số lượng Cộng dồn Khoảng cách Chọn cụm 1 400 400 2250 2 700 1100 679 3 800 1900 4 1200 3100 5 1800 4900 6 300 5200 7 800 6000 8 900 6900 9 1100 8000 10 1000 9000 Tổng 9000
27. 27 Chọn các cụm còn lại Tên Trường Số lượng Cộng dồn Khoảng cách Chọn cụm 1 400 400 2250 2 700 1100 679 3 800 1900 4 1200 3100 2929 5 1800 4900 6 300 5200 5179 7 800 6000 8 900 6900 9 1100 8000 7429 10 1000 9000 Tổng 9000
28. 28 Tính tổng học sinh của các trường được chọn Tên Trường Số lượng Cộng dồn Khoảng cách Chọn cụm Mẫu 1 400 400 2250 2 700 1100 679 3 800 1900 4 1200 3100 2929 5 1800 4900 6 300 5200 5179 7 800 6000 8 900 6900 9 1100 8000 7429 10 1000 9000 Tổng 9000 3300 0
29. 29 Tính cỡ mẫu cho các trường ni= (n x Ni)/N Tên Trường Số lượng Cộng dồn Khoảng cách Chọn cụm Mẫu 1 400 400 2250 2 700 1100 679 64 3 800 1900 4 1200 3100 2929 109 5 1800 4900 6 300 5200 5179 27 7 800 6000 8 900 6900 9 1100 8000 7429 100 10 1000 9000 Tổng 9000 3300 300
30. 30 Chọn mẫu nhiều giai đoạn Trong những quần thể rất lớn và rải khắp mẫu có thể được tiến hành theo hai hoặc nhiều giai đoạn Thường là những nghiên cứu dựa trên cộng đồng, trong đó người được phỏng vấn thuộc những làng khác nhau, và những làng này đã được chọn từ những khu vực khác nhau
31. 31 Ví dụ Ví dụ: ĐBSCL có 13 tỉnh, mỗi tỉnh có nhiều huyện, mỗi huyện có nhiều xã… Giai đọan 1: Chọn ngẫu nhiên 3 tỉnh; Giai đọan 2: Chọn ngẫu nhiên 2 huyện từ các tỉnh đã được chọn ở giai đoạn 1 Giai đọan 3: Chọn ngẫu nhiên 2 xã từ các huyện đã được chọn ở giai đoạn 2,… Giai đoạn 4: Chọn ngẫu nhiên 2 ấp từ xã Giai đoạn 5: Chọn ngẫu nhiên 30 cá thể từ mỗi ấp
32. 32 Chọn mẫu không xác xuất Chọn mẫu thuận tiện Đạt được trên cơ sở các cá thể có sẵn khi thu thập số liệu. Ví dụ: Tất cả các bệnh nhân đến khám tại phòng khám hằng ngày. Đây là cách chọn mẫu hay gặp trong nghiên cứu lâm sàng.
33. 33 Chọn mẫu không xác xuất Chọn mẫu chỉ tiêu Là phương pháp đảm bảo rằng một số nhất định các đơn vị mẫu từ các loại khác nhau của quần thể nghiên cứu với các tính đặc trưng sẽ có mặt trong mẫu.
34. 34 Chọn mẫu không xác xuất Chọn mẫu mục đích Nhà nghiên cứu đã xác định trước các nhóm quan trọng để tiến hành thu thập số liệu. Các nhóm khác nhau sẽ có tỷ lệ mẫu khác nhau. Đây là cách hay dùng trong các điều tra thăm dò, phỏng vấn sâu.
35. 35 Các sai số thường gặp trong chọn mẫu Sự không đáp ứng Nghiên cứu với người tình nguyện Sai số do mùa Sai số do đường xá
36. 36 Sự không đáp ứng Là hiện tượng các cá thể từ chối tham gia nghiên cứu. Thường hay gặp trong thử nghiệm lâm sàng Cách khắc phục: Chuẩn hoá phương pháp thu thập số liệu Giải thích các đối tượng trước khi thu thập số liệu Nếu vằng mặt thì người điều tra phải quay lại gặp cho bằng được. Nếu đối tượng không muốn hợp tác thì phải xem xét lại đối tượng này để tìm ra các đặc điểm khác với những đối tượng tham gia. Có thể chọn thêm đối tượng vào mẫu để thay thế những người không tham gia.
38. 38 Các yếu tố ảnh hưởng đến cỡ mẫu Loại thiết kế nghiên cứu Phương pháp chọn mẫu Độ lớn của tham số được nghiên cứu Mức độ sai lệch tham số mẫu và tham số quần thể Khả năng thực thi
39. 39 Cỡ mẫu cho việc ước tính tỷ lệ trong quần thể 2 2 2/1 )1( d pp Zn −× = −α Cỡ mẫu Tỷ lệ ước đoán Khoảng sai lệch Mức ý nghĩa thống kê Hệ số tin cậy 0,1 0,05 0,05 0,01
40. 40 Giá trị Z Giá trị Z thu được từ bằng cách tra bảng Z Với α = 0,1 ; Z = 1,645 Với α = 0,05; Z = 1,96 Với α = 0,01; Z= 2,58
41. 41 Ví dụ Trưởng phòng y tế huyện muốn xác định tỷ lệ SDD của trẻ dưới 5 tuổi trong huyện hiện tại là bao nhiêu. Giả sử rằng bạn sử dụng kỷ thuật chọn mẫu ngẫu nhiên, hãy tính cỡ mẫu cần thiết cho cuộc điều tra này. Biết rằng tỷ lệ SDD chung của quốc gia là 30%, độ tin cậy là 95%, khoảng sai lệch 5%.
42. 42 Cách tính cỡ mẫu nghiên cứu đối với ước tính một tỷ lệ trong QT 2 2 2/1 )1( d pp Zn −× = −α Cỡ mẫu Tỷ lệ ước đoán Khoảng sai lệch Mức ý nghĩa thống kê Hệ số tin cậy 0,050,05 1,96 0,3 323
43. VD: Muốn ước lượng tỷ lệ hộ gia đình có người mắc bệnh A, dựa vào tài liệu của một số nghiên cứu trước chúng ta biết tỷ lệ này là 35%. Nếu chúng ta sử dụng độ chính xác là 99% , sai số tuyệt đối là 5% thì cỡ mẫu cần thiết là bao nhiêu?
44. 44 Quần thể hữu hạn P là kích thước của dân số đích và Nhc là cỡ mẫu sau khi đã hiệu chỉnh Với ví dụ trên, dân số trẻ dưới 5 tuổi trong huyện là 1000 thì số trẻ cần cho nghiên cứu? PN PN Nhc + × =
45. 45 Cỡ mẫu trong nghiên cứu đối với giá trị trung bình 2 2 2 2/1 d Zn σ α−= n: là cỡ mẫu nghiên cứu cần có σ: Độ lệch chuẩn quần thể
46. VD: Nhà nghiên cứu muốn ước lượng cân nặng trung bình của trẻ em mới sinh ra trong cộng đồng. Có một báo cáo từ một nghiên cứu khác ở địa bàn tương tự cộng đồng này đã cho biết độ lệch chuẩn là 600gr. Người nghiên cứu cần có một mẫu trong đó độ rộng khoảng tin cậy dao động không quá 60gr với độ tin cậy là 99%. Vậy cỡ mẫu nghiên cứu là bao nhiêu?
47. 47 Hiệu lực thiết kế (Design Effect): D Sử dụng trong nhiều trường hợp chọn mẫu: mẫu cụm, chọn mẫu nhiều giai đoạn. Đễ đảm bảo tính chính xác của mẫu, nhà nghiên cứu thường nhân cỡ mẫu với một hệ số gọi là hiệu lực thiết kế (ký hiệu D). Giá trị của D: 1,5 – 2…Thông thường chọn D = 2.
48. Một nghiên cứu nhằm khảo sát tỷ lệ hút thuốc lá của sinh viên nam tại trường Đại học Tây Đô. Theo một số nghiên cứu khác cho thấy tỷ lệ Hút thuốc lá trong Nam sinh viên của các trường Đại học là 30%. a) Tính cỡ mẫu cho nghiên cứu b) Giả sử số liệu các lớp sinh viên trong trường theo bảng, hãy sử dụng phương pháp chọn mẫu thích hợp chọn ra học sinh (Phương pháp chọn, cách chọn, lớp được chọn, học sinh trong lớp được chọn….)
49. Lớ p D1 D2 D3 D4 D5 D6 D7 Số sv 270 232 278 300 250 130 120 Lớ p D8 ĐD 1 ĐD 2 ĐD 3 ĐD 4 CT D 2 CT D 3 Số sv 67 150 105 76 54 86 67