Giáo trình ứng dụng thống kê trong nghiên cứu sinh học

1 ĐẠI HỌC QUỐC GIA HÀ NỘI TRƯỜNG ĐẠI HỌC KHOA HỌC TỰ NHIÊN  ĐỀ CƯƠNG MÔN HỌC THỐNG KÊ SINH HỌC VÀ ỨNG DỤNG TIN HỌC TRONG SINH HỌC 1. Thông tin về giảng viên - Họ và tên: Chu Văn Mẫn - Chức danh, học hàm, học vị: Giảng viên chính, Thạc sĩ - Thời gian, địa điểm làm việc: Giờ hành chính các ngày trong tuần, Bộ môn Nhân học - Sinh lí học, phòng 330, nhà T1, Trường Đại học KHTN - Địa chỉ liên hệ: Khoa Sinh học, nhà T1, 334 Nguyễn Trãi, Thanh Xuân, Hà Nội E-mail: - Các hướng nghiên cứu chính: Di truyền học người, Sinh học người, Sinh học phân tử,Quản lý và phân tích số liệu sinh học. - Họ và tên: Trịnh Hồng Thái - Chức danh, học hàm, học vị: Giảng viên chính, phó giáo sư, tiến sỹ - Thời gian, địa điểm làm việc: Giờ hành chính các ngày trong tuần, Bộ môn Nhân học-Sinh lý học (P.330, nhà T1) hoặc Phòng Proteomic thuộc PTNTĐ Công nghệ Enzym-Protein (P.440, nhà T1). - Địa chỉ liên hệ: Khoa Sinh học, Trường Đại học Khoa học Tự nhiên, 334 Nguyễn Trãi, Thanh Xuân, Hà Nôi. - Điện thoại, email: - Các hướng nghiên cứu chính: Proteomic huyết tương người, sinh học phân tử người, nghiên cứu protein-enzym và ứng dụng trong y học, nông nghiệp. - Họ và tên: Phạm Trọng Khá - Chức danh, học hàm, học vị: Giảng viên, Thạc sĩ 2 - Thời gian, địa điểm làm việc: Các giờ hành chính trong ngày, Phòng thí nghiệm Sinh lý học người và động vật, Khoa Sinh học, Trường ĐHKHTN – ĐHQGHN. - Địa chỉ liên hệ: Bộ môn Nhân học – Sinh lý học, Khoa Sinh học, Trường Đại học Khoa học Tự nhiên. - Điện thoại: email: email: , . - Các hướng nghiên cứu chính: Sinh học thần kinh, nội tiết, huyết học. 2. Thông tin về môn học - Tên môn học: Thống kê sinh học và ứng dụng tin học trong sinh học - Mã môn học: - Số tín chỉ: 3 - Giờ tín chỉ đối các hoạt động: + Nghe giảng lý thuyết trên lớp: 15 + Làm bài tập trên lớp: 30 - Đơn vị phụ trách môn học: + Bộ môn: Bộ môn Nhân học - Sinh lí học + Khoa: Sinh học - Các môn học tiên quyết: + Tn học cơ sở + Xác suất thống kê toán học + Các môn sinh học cơ sở - Các môn học kế tiếp: không 3. Mục tiêu của môn học - Mục tiêu về kiến thức: +Cung cấp cho sinh viên về cách thu thập số liệu trong nghiên cứu sinh học, sắp xếp hệ thống hoá số liệu đã thu được, tìm ra những tham số đặc trưng cho bộ số liệu này. + Cung cấp các phương pháp phân tích các quy luật biến thiên của các bộ số liệu thu được, xác định mối liên hệ giữa nhiều hệ thống số liệu. + Cung cấp phương pháp giải bài toán sinh học, xử lí thống kê và quản lí số liệu, khai thác một cơ sở dữ liệu nghiên cứu sinh học bằng phần mềm excel - Mục tiêu về kỹ năng: Hình thành kỹ năng tổ chức lưu trữ, quản lý, khai thác và phân 3 tích dữ liệu tự động, thể hiện thông tin phục vụ thực tế; sử dụng thành thạo các thủ tục phân tích thống kê, giải bài toán mô tả biến động quần thể bằng phần mềm excel. - Các mục tiêu khác (thái độ học tập ): Rèn luyện sinh viên có tính thận trọng, tỉ mỉ và sáng tạo trong khi thao tác với dữ liệu. 4. Tóm tắt nội dung môn học: Giới thiệu về Microsoft Excel, với những khái niệm cơ bản, những thủ thuật và thao tác với bảng tính Excel, giải các bài toán sinh học trên bảng điện tử excel. Khái niệm mẫu và tổng thể, các đặc trưng thống kê của mẫu; phương pháp gọi hàm trong excel để tính các đặc trưng thống kê của mẫu; phương pháp ước lượng các tham số thống kê của tổng thể, ước lượng dung lượng mẫu và các phương pháp tính trên bảng tính điện tử excel. Các phương pháp xử lý thống kê số liệu nghiên cứu sinh học các công cụ phân tích thống kê trong excel; phân tích thống kê nhiều biến số trong nghiên cứu Sinh học hay phân tích tương quan hồi quy trên excel; Thiết kế thí nghiệm thực nghiệm và giải bài toán tìm cự trị bằng phần mềm excel; quản lý và khai thác một cơ sở dữ liệu trong nghiên cứu Sinh học bằng bảng tính excel. 5. Nội dung chi tiết môn học: Chương 1. GIỚI THIỆU PHẦN MỀM EXCEL 1.1. Các khái niệm cơ bản 1.2. Các thao tác cơ bản trong bảng tính 1.3. Giải các bài toán sinh học bằng phần mềm excel Chương 2. CÁC KHÁI NIỆM CƠ BẢN VỀ THỐNG KÊ SINH HỌC 2.1. Nhắc lại một vài khái niệm và kí hiệu 2.2. Tổng thể và mẫu 2.3. Đặc trưng thống kê của mẫu 2.3.1. Đại lượng trung bình 2.3.2. Các chỉ số phân tán 2.4. Tính các đặc trưng thống kê mẫu bằng hàm trong excel Chương 3. ƯỚC LƯỢNG CÁC THAM SỐ CỦA TỔNG THỂ DỰA TRÊN MẪU NGHIÊN CỨU 3.1. Đặt vấn đề và một vài khái niệm 3.2. Ước lượng số trung bình, phương sai và xác suất của tổng thể 4 3.2.1. Ước lượng số trung bình, phương pháp tính trong excel 3.2.2. Ước lượng phương sai, phương pháp tính trong excel 3.2.3. Ước lượng xác suất (tỷ lệ) của một tổng thể, phương pháp tính trong excel 3.3. Xác định dung lượng mẫu cần thiết, phương pháp tính trong excel Chương 4. KIỂM ĐỊNH GIẢ THIẾT THỐNG KÊ VỀ CÁC THAM SỐ CỦA ĐẶC TRƯNG SINH HỌC 4.1. Đặt bài toán và một vài khái niệm 4.2. Phương pháp so sánh kết quả thống kê các mẫu nghiên cứu 4.2.1. Ý nghĩa 4.2.2. So sánh kết quả thống kê các mẫu nghiên cứu độc lập 4.2.2.1. Kiểm định giả thiết Ho: µ1 = µ2 4.2.2.2. Kiểm định giả thiết Ho: µ1 = = µk với k≥3 4.2.3. So sánh kết quả thống kê các mẫu nghiên cứu liên hệ 4.2.3.1. Kiểm định giả thiết Ho: µ1 = µ2 4.2.3.2. Kiểm định giả thiết Ho: µ1 = = µk với k≥3 4.2.4. Kiểm định tính độc lập và so sánh các tỷ lệ 4.2.4.1. So sánh tỷ lệ 4.2.4.2. Kiểm định tính độc lập của các yếu tố thí nghiệm 4.3. Phương pháp phân tích phương sai (analysis of variance - ANOVA) 4.3.1. Đặt bài toán 4.3.2. Phân tích phương sai một nhân tố đối với các thí nghiệm ngẫu nhiên hoàn toàn (fully randomized designs) 4.3.3. Phân tích phương sai hai nhân tố Chương 5. MÔ HÌNH HÓA QUY LUẬT PHÂN BỐ CỦA MỘT ĐẶC TRƯNG SINH HỌC 5.1. Tiêu chuẩn χ2 5.2. Kiểm định một mẫu theo một hàm phân phối 5.2.1. Hàm phân phối chuẩn 5.2.2. Luật xác suất nhị thức 5.2.3. Luật xác suất Poisson 5.2.4. Phân bố giảm (phân bố mũ hàm Meyer) 5.2.5. Phân bố Weibull 5.2.6. Phân bố khoảng cách 5 Chương 6. PHÂN TÍCH TƯƠNG QUAN VÀ HỒI QUY 6.1. Khái niệm về phân tích thống kê nhiều biến số 6.2. Xác định mức độ liên hệ giữa các đại lượng - hệ số tương quan R 6.3. Phân tích tương quan hồi quy 6.3.1. Hồi quy tuyến tính một lớp 6.3.2. Liên hệ tuyến tính nhiều lớp 6.4. Phân tích tương quan phi tuyến tính 6.4.1. Giới thiệu một số hàm phi tuyến tính 6.4.2. Phân tích mối liên hệ giữa các đại lượng tương quan phi tuyến 6.5. Thiết lập tương quan hồi quy bằng biểu đồ 6.5.1. Giới thiệu chế độ biểu đồ của phần mềm excel 6.5.2. Thiết lập biểu đồ tương quan Chương 7. THIẾT KẾ THÍ NGHIỆM 7.1. Khái niệm cơ bản 7.1.1. Khái niệm về thiết kế thí nghiệm 7.1.2. Mô hình thiết kế thí nghiệm 7.1.3. Các bước thực hiện thiết kế thí nghiệm 7.2. Thiết kế thí nghiệm 7.2.1. Mục tiêu 7.2.2. Lựa chọn các biến 7.2.3. Lựa chọn thiết kế thí nghiệm 7.2.4. Thiết kế thí nghiệm bậc 1 7.3. Tối ưu hoá thực nghiệm 7.3.1. Phương pháp thực nghiệm theo đường dốc nhất 7.3.2. Phương pháp khảo sát mặt mục tiêu 7.3.3. Phương pháp đơn hình 7.3.4. Bài toán ví dụ Chương 8. PHÂN TÍCH CƠ SỞ DỮ LIỆU 8.1. Những khái niệm cơ bản 8.2. Thao tác với cơ sở dữ liệu 8.2.1. Tạo lập một cơ sở dữ liệu 8.2.2. Chỉnh và sửa cơ sở dữ liệu 3. Sắp xếp cơ sở dữ liệu 4. Chọn lọc dữ liệu (Data Filter) 6 4.1. Lọc dữ liệu bằng lệnh Auto Filter 4.2. Lọc dữ liệu bằng Advanced Filter 5. Phân tích dữ liệu bằng kỹ thuật Pivot Table 5.1. Tạo Pivot Table 5.2. Hiệu chỉnh và khai thác Pivot Table 6. Tính tần số các giá trị trong một cơ sở dữ liệu 6.1. Phương pháp dùng hàm Countif trong fx của thanh công cụ 6.2. Phương pháp dùng Tools/ Data analysis/ Histogram để khảo sát hàm phân phối tần số 6. Học liệu Học liệu bắt buộc: 1. Chu Văn Mẫn. 2003. Ứng dụng tin học trong sinh học. NXB ĐHQG Hà Nội 2. Chu Văn Mẫn, Đào Hữu Hồ, 2001.Thống kê Sinh học. NXB Khoa học và Kỹ thuật, Hà Nội, 162 tr. 3. Huỳnh Tấn Dũng, 1996. Cẩm nang tra cứu Excel 4.0 & 5.0 Hàm và Macro. NXB Thống kê, 589 tr. Học liệu tham khảo: 4. Bruce Hallberg,1998. Excel toàn tập. NXB trẻ, TP Hồ Chí Minh, 805 tr.(Bản dịch) 5. Đào Hữu Hồ, 1996. Xác suất thống kê. NXB Đại học Quốc gia Hà Nội 6. Phan Quốc Phô, 1999. Giáo trình Windows 95, Word, Excel 7.0. NXB Khoa học và Kỹ thuật, Hà Nội, 332 tr. 7. Ngô Như Hoà, 1981. Thống kê trong nghiên cứu Y học, tập I, Nxb Y học Hà Nội. 8. Ngô Như Hoà, 1982. Thống kê trong nghiên cứu Y học, tập II, Nxb Y học Hà Nội. 9. Nguyễn Văn Út, 1989. Giáo trình ứng dụng xác suất và thống kê trong sinh học.Tập I, II. Đại học Tổng hợp TP Hồ Chí Minh. 10. Nguyễn Minh Tuyển, Phạm Văn Thiêm. Kỹ thuật hệ thống công nghệ hoá học. Tập I. Cơ sở mô hình hoá các quá trình công nghệ hoá học. Nxb. Khoa học và Kỹ thuật Hà Nội. 11. Mark J. Schervish, 1997. Theory of Statistics. Springer-Verlag New York, Inc. USA.724pp 9. Ruxton G.D. and N. Colegrave, 2003. Experimental Design for Life Sciences. Oxford University Press. 7 7. Hình thức tổ chức dạy học: 7.1. Lịch trình chung Nội dung Hình thức tổ chức dạy học môn học Tổng Lên lớp Thực hành trên máy tính PC Tự học, tự nghiên cứu Lý thuyết Bài tập Thảo luận Chương 1 2 4 6 Chương 2 1 2 3 Chương 3 1 2 3 Chương 4 3 6 9 Chương 5 2 4 6 Chương 6 2 4 6 Chương 7 2 4 6 Chương 8 2 4 6 Tổng 15 30 45 7.2. Lịch trình tổ chức dạy học cụ thể (1 tuần 2 giờ tín chỉ) Tuần Nội dung chính Yêu cầu sinh viên chuẩn bị Hình thức tổ chức dạy học Ghi chú 1 Chương 1: mục 1, Các khái niệm cơ bản, Đọc trước tài liệu [1]: tr 9÷13; Lý thuyết Chương 1: Giải bài toán sinh học bằng phần mềm excel Đọc trước tài liệu [1]: tr 53÷55; tr 58÷63 Làm bài tập trên máy tính PC. 2 Chương 1: muc 2 các thao tác trong bảng tính Đọc trước tài liệu [1]: tr 15÷23 Lý thuyết Chương 1: Giải bài toán sinh học bằng phần mềm excel (tiếp theo) Đọc trước tài liệu [1]: tr 53÷55; tr 58÷63 Làm bài tập trên máy tính PC. Chương 2: mục 2, mục 3 Đặc trưng thống kê của mẫu Đọc trước tài liệu [2]: tr 11÷13; tr 28÷31; Lý thuyết 8 3 tr 36÷39 Chương 2: Tính các đặc trưng thống kê của mẫu bằng hàm trong excel Đọc trước tài liệu [4]: tr 122÷ 167 Làm bài tập trên máy tính PC. 4 Chương 3: mục 2, mục 3 Ước lượng trung bình, phương sai, xác suất Đọc trước tài liệu [2]: tr 48÷55; Lý thuyết Chương 3: Bài tập ước lượng các tham số của tổng thể Đọc trước tài liệu [1]: tr 53÷ 55 Làm bài tập trên máy tính PC. 5 Chương 4: mục 1, mục 2.2: Kiểm định giả thiết về đại lượng trung bình mẫu độc lập Đọc trước tài liệu [1]: tr 118÷122; tr 127; tr:138 ÷141 Đọc trước tài liệu [2]: tr 63÷68; Lý thuyết Chương 4: - Kiểm đinh giải thiết Ho: µ1 = µ2 - Kiểm đinh giải thiết Ho: µ1 = µ2 = = µm với m>= 3 Đọc trước tài liệu [1]: tr 122÷126; Đọc trước tài liệu [2]: tr 70; tr 116÷118; Làm bài tập trên máy tính PC. 6 Chương 4: mục 2.3, mục 2.4: Kiểm định giả thiết về đại lượng trung bình mẫu liên hệ và so sánh các tỷ lệ Đọc trước tài liệu [1]: tr 141÷146; tr 148; tr 150÷151 Đọc trước tài liệu [2]: tr 71÷72; tr 114÷116; Lý thuyết Chương 4: - Kiểm đinh giải thiết Ho: µ1 = µ2 - Kiểm đinh giải thiết Ho: µ1 = µ2 = = µm với m>= 3 - Kiểm đinh giả thiết Ho: p1= Đọc trước tài liệu [1]: tr147÷148; tr149; tr152÷154 Đọc trước tài liệu [2]: tr 70; tr 72; tr 116÷118 Làm bài tập trên máy tính PC. 9 p2, p1=…= pk 7 Chương 4 mục 3.1, mục 3.2, mục 3.3: Phân tích phương sai Đọc trước tài liệu [1]: tr 154 ÷159; tr163 ÷168; tr 174 ÷176 Đọc trước tài liệu [2]: tr 71; tr 73÷77; tr 83÷85 Lý thuyết Chương 4: - Kiểm định giả thiết Ho: Fstát > Fα - Kiểm định giả thiết Ho: Fstát A > FαA; Fstát B > FαB Fstát AB > FαAB Đọc trước tài liệu [1]: tr 159 ÷163; tr 169 ÷174; tr 177 ÷179 Đọc trước tài liệu [2]: tr 77÷82; tr 86÷92; Làm bài tập trên máy tính PC. 8 Chương 5: Mục1 Tiêu chuẩn χ2 Đọc trước tài liệu [1]: tr106; tr109 ÷115 ; tr 116 Đọc trước tài liệu [2]: tr 98 ÷100; Lý thuyết Chương 5: Kiểm định một mẫu theo một hàm phân phối chuẩn, Luật xác suất nhị thức; Luật xác suất Poisson Đọc trước tài liệu [2]: tr102÷104; tr106÷110 tr: 112 ÷114 Làm bài tập trên máy tính PC. 9 Chương 5: Mục 2.4; 2.5; 2.6 Phân bố giảm; Phân bố Weibull; Phân bố khoảng cách Đọc trước tài liệu [1]: tr 107; tr 113; tr 116 Lý thuyết Chương 5: Tìm quy luật phân bố lí thuyết của: Phân bố giảm; Phân bố Weibull; Phân bố khoảng cách Đọc trước tài liệu [1]: tr 109; tr 115; tr 117 Làm bài tập trên máy tính PC. Chương 6: Mục 1; 2, 3 Phân tích tương quan hồi quy tuyến tính Đọc trước tài liệu [1]: tr190 ÷197;tr 207÷208 Đọc trước tài liệu [2]: Lý thuyết 10 10 tr 120 ÷122; tr 124 ÷126 Chương 6: Thiết lập phương trình lí thuyết y = aX+b; y=ao + a1X1 + ….+ ak Xk. Đọc trước tài liệu [1]: tr197 ÷121; tr 209÷210 Đọc trước tài liệu [2]: tr 120 ÷122; tr 124 ÷126 Làm bài tập trên máy tính PC. 11 Chương 6: Mục 4,5 Phân tích tương quan hồi quy phi tuyến Đọc trước tài liệu [1]: tr214 ÷215; tr 221 Đọc trước tài liệu [2]: tr 127 ÷128; tr 132 ÷138. Lý thuyết Chương 6: Thiết lập phương trình lí thuyết phi tuyến Đọc trước tài liệu [1]: tr 216 ÷220 Đọc trước tài liệu [2]: tr 129 Làm bài tập trên máy tính PC. 12 Chương 7: Mục 1:(1.1; 1.2; 1.3); Mục 2 (2.1; 2.2) Khái niệm cơ bản, thiết kế thí nghiệm bậc 1 Đọc trước tài liệu [3]: Tr 1 ÷ 27 ; Lý thuyết Chương 7: Thiết kê thí nghiệm bậc 1: đầy đủ và rút gọn theo n yếu tố (n = 4,5,6.7) Đọc trước tài liệu [1]: tr 53 ÷ 64 Làm bài tập trên máy tính PC. 13 Chương 7: Thiết kê thí nghiệm tối ưu Đọc trước tài liệu [3]: Tr 55 ÷ 70; Lý thuyết Chương 7: Giải bài toán tìm cực trị bằng công cụ tools/ solve trong excel Thu thập số liệu N/C Làm bài tập trên máy tính PC. 14 Chương 8: Mục 1; 2; 3; 4 Phân tích cơ sở dữ liệu Đọc trước tài liệu [1]: tr 225 ÷ 236 Lý thuyết Chương 8: Tạo một cơ sở dữ liệu; tìm kiếm dữ liệu bằng Data/form; Sắp xếp dữ liệu bằng Data/sort; lọc dữ liệu bằng data / filter Thu thập số liệu N/C Làm bài tập trên máy tính PC. 11 15 Chương 8: Mục 5, mục 6 Phân tích dữ liệu; Khảo sát hàm phân bố tần số Đọc trước tài liệu [1]: tr 237 ÷ 246 Lý thuyết Chương 8: Kĩ thuật pivot table; phân tích tần số bằng Tools/ data analysis/ Histogram Thu thập số liệu N/C Làm bài tập trên máy tính PC. 8. Yêu cầu của giảng viên đối với môn học: - Các giờ tín chỉ lý thuyết và bài tập phải được ưu tiên thực hiện ở phòng học có máy tính PC và phương tiện trình chiếu (phòng học tin học). - Các giờ tín chỉ lên lớp lý thuyết, bài tập có thể xen kẽ với trao đổi dữ liệu, hướng dẫn tính toán, sinh viên phải luôn mang theo sách giáo khoa, tham khảo, tài liệu hướng dẫn, phương tiện lưu trữ thông tin, tính toán - Từng sinh viên phải thực hiện bài tập và thực hành theo đúng lịch trình - Học viên phải tích lũy đủ các điểm kiểm tra đánh giá theo quy định của môn học 9. Phương pháp và hình thức kiểm tra, đánh giá môn học - Các loại điểm kiểm tra và trọng số của từng loại điểm: + Thực hành máy : 20% + Kiểm tra giữa kì: 20% + Thi cuối kì: 60% - Lịch thi và kiểm tra: + Bài tập: Làm bài tập trên máy hàng tuần theo lịch trình dạy học cụ thể + Kiểm tra giữa kì: sau tuần 8 + Thi cuối kì: sau tuần 15 + Thi lại: sau thi cuối kì từ 3 đến 5 tuần -Tiêu chí đánh giá các loại bài tập và các nhiệm vụ mà giảng viên giao cho sinh viên: - Giải được về mặt toán (con số) theo yêu cầu của đề trên bảng tính điện tử excel 70 % số điểm - Nhận xét ý nghĩa sinh học của bài toán 30% số điểm