CSDL NVSS: tác giả Việt nam có bài công bố khoa học Scopus, ISI, Nafosted

Khó khăn trong triển khai nghiên cứu kinh tế xã hội: góc nhìn của tác giả giàu thành tựu công bố quốc tế

SSHPA (12-04-2018; theo ý kiến của TS Nguyễn Việt Cường, tiêu đề của SSHPA) - Cảm ơn mọi người đã quan tâm và nhận xét về topic liên quan tới học vấn và quản lý. Các nhận xét đều rất chính xác, và nó cho thấy thực hiện một nghiên cứu thuyết phục là không dễ dàng. Mình xin tóm tắt một chút về những khó khăn trong nghiên cứu, dựa trên ví dụ bài trước của mình, hy vọng giúp ích cho các bạn đang muốn tìm hiểu về nghiên cứu.

Đầu tiên là xác định câu hỏi nghiên cứu, chẳng hạn đơn giản là xem học giỏi ở trường thì có tăng khả năng lãnh đạo hay không. Tiếp theo chúng ta phải xác định tổng thể nghiên cứu và tham số của tổng thể (parameters), chẳng hạn tổng thể là sinh viên mới ra trường 2 năm và tham số là xếp loại tốt nghiệp và làm quản lý. Chúng ta phải chọn một mẫu ngẫu nhiên (random sample) đủ lớn để ít nhất ước lượng được hai tham số này với sai số chấp nhận được. Chúng ta cần mẫu ngẫu nhiên vì ước lượng dựa trên mẫu ngẫu nhiên là ước lượng không chệch (unbiased estimator) của tham số tổng thể. Chọn mẫu thì chúng ta dựa vào công thức chọn mẫu.

Sau khi thu thập số liệu thì có thể nảy sinh hai vấn đề. Thứ nhất là sai số chọn mẫu (sampling errors), chủ yếu là do từ chối hoặc không tiếp cận được người cần được điều tra. Chẳng hạn trong ví dụ trên, sinh viên nếu thất nghiệp hoặc không có việc làm có xu hướng từ chối trả lời, và điều này làm sai lệch ước lượng. Chúng ta có thể sửa bằng cách điều chỉnh quyền số chọn mẫu (sampling weight) hoặc điều chỉnh mẫu bằng phương pháp ghép nối (matching). Thứ hai là sai số phi chọn mẫu (non-sampling errors), do câu hỏi chưa tốt, trả lời không đầy đủ hay nói dối. Ví dụ một số người nhận xét rằng sinh viên “nổ” quá nên tỷ lệ làm quản lý mới cao, hoặc biến “quản lý” được đo lường quá đơn giản. Sai số này thì chỉ có đối chiếu với thông tin từ các điều tra khác mới đánh giá được, và hầu như không thể sửa được.

Phân tích số liệu thì đơn giản. Trong điều tra chọn mẫu thì chúng ta chú ý tới quyền số chọn mẫu, và khi tính sai số (standard error) thì lưu ý là nếu các quan sát có tương quan với nhau trong cùng cụm (cluster correlation) thì phải tính đến. Sai số đơn giản thường giả định hiệp phương sai (covariance) giữa các quan sát là bằng 0, nhưng điều này không đúng nếu như các quan sát ở gần nhau về mặt địa lý hay thời gian. Tương quan có thể cho phép ở nhiều mức độ, chẳng hạn tương quan lớn cho các hộ trong cùng làng và yếu hơn chút nếu chỉ ở cùng huyện. Lý thuyết hơi phức tạp nhưng phần mềm thống kê xử lý rất đơn giản mấy thứ này.

Khó khăn chính là ước lượng tương quan giữa hai biến chẳng nói được quan hệ nhân quả. Chính vì thế mà mọi người nhận xét rằng học lực và quản lý liên hệ với nhau chẳng qua là do khác biệt về giới tính, họ tự kinh doanh hay con ông cháu cha. Trong nghiên cứu vấn đề này gọi là nội sinh (endogeneity) hay tự lựa chọn (self-selection). Có một số phương pháp để xử lý vấn đề này như thực hiện thí nghiệm hay có bạn nhận xét là dùng biến công cụ (instrumental variables), và nó lại yêu cầu chúng ta phải dự kiến nó ngay từ khâu thiết kế nghiên cứu. Phương pháp được tin tưởng khi các giả định mà nó dựa vào nhiều khả năng là đúng.

Giải thích kết quả mới là thách thức lớn trong nghiên cứu định lượng. Giả sử chúng ta chứng mình được học kém thì tăng khả năng làm quản lý, nhưng chẳng biết nguyên nhân tại sao. Việc không rõ nguyên nhân làm cho tính suy rộng (external validity) bị kém đi. Liệu mối liên hệ chúng ta tìm ra chỉ là cá biệt và ngẫu nhiên? Xử lý điều này buộc chúng ta phải tìm hiểu cơ chế và thêm các biến vào trong điều tra.

Cuối cùng kết quả nghiên cứu nên được xuất bản trên tạp chí để mọi người tin tưởng. Vì nghiên cứu thường phức tạp nên nếu không có nơi kiểm định chất lượng thì mọi người sẽ chẳng tin. Mọi người cũng chẳng có thời gian để tìm hiểu đúng sai, việc đó để cho Ban biên tập làm. Xuất bản bài báo là quá trình gian nan, với lại những chất vấn từ phản biện về các vấn đề như nêu ở trên. Rồi thỉnh thoảng có những câu hỏi tế nhị như liệu có publication bias hay cherry picking không, kiểu như chạy hàng trăm mô hình hay hàng trăm biến hay thực hiện hàng chục experiments rồi chọn cái hay nhất để công bố. Vì vậy phân tích về học lực và quản lý của mình chỉ là mô tả trong một trường hợp và cần thêm các nghiên cứu tiếp để xác nhận. À cuối cùng nếu bảo vệ luận văn, hội đồng có hỏi cherry picking thì các bạn sinh viên đừng nhầm là picking cherry in the field nhé. Trả lời nhầm “Yes I love picking cherry” là “Khôn 5 năm dại một giờ” đó.

** Bài viết được đăng tải trên facebook cá nhân của tác giả Nguyễn Việt Cường (NEU, MDRI; Google Scholar Page 12-4-2018). SSHPA đăng tải lại với sự đồng ý của tác giả.


Bài liên quan:


Ý kiến bạn đọc (1):

  • Trả lời Hoàng (4/12/2018 5:21 PM): Tác giả Việt Cường công phu giới thiệu và chia sẻ kinh nghiệm thực tiễn. Thật cảm ơn vì hành động nghĩa cả, mã thượng.