Thủ Thuật Hướng dẫn Cách tính giá trị p. của t-test Chi Tiết
You đang tìm kiếm từ khóa Cách tính giá trị p. của t-test được Update vào lúc : 2022-11-30 00:11:08 . Với phương châm chia sẻ Mẹo Hướng dẫn trong nội dung bài viết một cách Chi Tiết 2022. Nếu sau khi đọc tài liệu vẫn ko hiểu thì hoàn toàn có thể lại Comment ở cuối bài để Tác giả lý giải và hướng dẫn lại nha.
Xin chào những bạn,
Nội dung chính
- Giải phẫu phương pháp t-test
- t = fracbarx – mu _0fracssqrtn
- Phần tử số là Tín Hiệu
- Phần mẫu số là Nhiễu
- Giá trị t-value là tỉ lệ của Tín Hiệu so với Nhiễu
- Thông điệp về ý nghĩa thống kê
- Bài viết bạn hoàn toàn có thể quan tâm
- Độ khác lạ (tín hiệu) là chưa đủ lớn. Bạn không thể làm gì được hơn nếu điều này xẩy ra, giả sử rằng nghiên cứu và phân tích của bạn sử dụng đúng phương pháp và mẫu tài liệu mà bạn tích lũy mang tính chất chất đại diện thay mặt thay mặt cho quần thể.
- Độ xấp xỉ tài liệu (nhiễu) quá rộng. Đây là nguyên do tại sao việc remove những điểm không bình thường (outlier) trong tài liệu của bạn là yếu tố rất quan trọng. Bạn hoàn toàn có thể dùng control chart để phát hiện và loại trừ những điểm outlier thoát khỏi tài liệu trước lúc thực thi t-test.
- Mẫu tài liệu quá nhỏ. Mức độ xấp xỉ sẽ nhỏ đi nếu kích thước tài liệu lớn. Điều này nghĩa là nếu có cùng một độ khác lạ và cùng một giá trị xấp xỉ, nếu kích thước tài liệu càng lớn thì sẽ càng hoàn toàn có thể đạt được ý nghĩa thống kê như biểu đồ phía dưới.
Đây là bài dịch tiếng Việt của tớ về một nội dung bài viết rất hay lý giải ý nghĩa của phương phápt-test(hay phương pháp kiểm định t trong nội dung bài viết tôi chỉ gọi là t-test cho ngắn gọn) của tác giảPatrick Runkel. Bài gốc bằng tiếng Anh mang tên khá đầy đủ là What Is a t-test? And Why Is It Like Telling a Kid to Clean Up that Mess in the Kitchen? và những bạn hoàn toàn có thể đọc bài gốc tại đây.
Phương pháp t-test là một trong những thủ tục được sử dụng phổ cập nhất trong khoa học thống kê.
Nhưng thậm chí còn những người dân tiêu dùng t-test một cách thường xuyên cũng không biết đúng chuẩn phương pháp này hoạt động và sinh hoạt giải trí ra làm sao bởi toàn bộ những tài liệu đều được xử lý sau tấm màn che của những ứng dụng thống kê, ví như Minitab.
Và thật là đáng để toàn bộ chúng ta bỏ một chút ít thời hạn để xem phương pháp t-test hoạt động và sinh hoạt giải trí ra làm sao ở đằng sau tấm màn che đó.
Bởi vì nếu bạn hiểu được cách phương pháp t-test hoạt động và sinh hoạt giải trí, bạn hoàn toàn có thể hiểu ở một mức độ sâu hơn về tài liệu của bạn nhờ vào kết quả mà phương pháp t-test mang lại. Và bạn cũng hiểu sâu hơn tại sao kết quả nghiên cứu và phân tích của bạn đạt được (hoặc không đạt được) ý nghĩa thống kê (statistical significant).
Thực tế là nếu bạn có một người con đang trong tuổi teen thích ăn chơi nhiều hơn nữa là thích thao tác nhà thì có lẽ rằng là bạn đã có một trải nghiệm in như những nguyên tắc cơ bản đằng sau phương pháp t-test.
Giải phẫu phương pháp t-test
Phương pháp t-test được sử dụng một cách phổ cập để xác lập xem liệu giá trị trung bình của một quần thể (the mean of a population) có khác lạ với một giá trị nào đó (gọi là giá trị trung bình giả thuyết a hypothesized mean) hoặc với giá trị trung bình của một quần thể khác.
Ví dụ, phương pháp 1-sample t-test (hay phương pháp kiểm định t cho một mẫu) được sử dụng để kiểm định xem liệu thời hạn chờ trung bình của những bệnh nhân trong một phòng khám y khoa có lâu hơn so với thời hạn mong ước là 15 phút hay là không, nhờ vào tài liệu từ một nhóm ngẫu nhiên những bệnh nhân.
Để xác lập xem liệu sự khác lạ (giữa thời hạn chờ thực tiễn và thời hạn mong ước) có ý nghĩa thống kê hay là không, phương pháp t-test sẽ tính toán một giá trị gọi là t-value (giá trị p.-value nổi tiếng cũng khá được lấy trực tiếp từ t-value). Giá trị này được xem như sau:
t = fracbarx – mu _0fracssqrtn
Công thức toán học này trông có vẻ như bí hiểm nhưng thực ra bạn hoàn toàn hoàn toàn có thể làm chủ được nó nếu bạn hiểu được hai động lực quan trọng đằng sau nó : thành phần số (ở phía trên) và phần mẫu số (ở phía dưới).
Phần tử số là Tín Hiệu
Phần tử số trong công thức 1-sample t-test đo lường độ mạnh mẽ và tự tin của tín hiệu (signal): sự khác lạ giữa giá trị trung bình của mẫu tài liệu của bạn (barx) và giá trị trung bình giả thuyết của quần thể (mu_0).
Trở lại với ví dụ về thời hạn chờ của những bệnh nhân, giá trị trung bình giả thuyết là 15 phút.
Nếu những bệnh nhân trong mẫu tài liệu ngẫu nhiên của bạn có thời hạn chờ trung bình là 15.1 phút, tín hiệu bằng 15.1 15 = 0.1 phút. Giá trị khác lạ này tương đối nhỏ, do vậy tín hiệu ở thành phần số thì yếu.
Tuy nhiên, nếu thời hạn chờ trung bình của bệnh nhân là 68 phút, sự khác lạ sẽ to nhiều hơn và bằng 68-15=53 phút. Do vậy, tín hiệu sẽ mạnh hơn.
Phần mẫu số là Nhiễu
Phần mẫu số đo lường mức độ xấp xỉ hay nhiễu (noise) trong mẫu tài liệu của bạn.
Kí hiệu là độ lệch chuẩn (standard deviation) mô tả mức xấp xỉ trong tài liệu của bạn. Nếu bạn có một bệnh nhân chờ 50 phút, một bệnh nhân khác chờ 12 phút, một người khác nữa chờ 0.5 phút, một người khác nữa chờ 175 phút, thì hoàn toàn có thể nói rằng rằng tài liệu của bạn có thật nhiều xấp xỉ. Điều này còn có nghĩa rằng nếu giá trị s càng lớn, mức độ nhiễu trong tài liệu của bạn càng lớn. Mặc khác, nếu bạn có một bệnh nhân chờ 14 phút, một người khác chờ 16 phút, một bệnh nhân khác chờ 12 phút, thì hoàn toàn có thể nói rằng rằng tài liệu của bạn có ít xấp xỉ. Điều này còn có nghĩa rằng nếu giá trị scàng nhỏ thì tài liệu của bạn sẽ ít nhiễu hơn.
Còn kí hiệu sqrtn ở phía dưới scó ý nghĩa là gì? Đó là căn bậc hai kích thước mẫu tài liệu của bạn (ví dụ nếu mẫu của bạn có 30 người thì n = 30). Nếu mọi thứ đều bằng nhau thì tài liệu của bạn sẽ bị nhiễu nhiều hơn nữa nếu kích thước mẫu tài liệu của bạn nhỏ và sẽ ít nhiễu hơn nếu kích thước mẫu tài liệu của bạn lớn.
Giá trị t-value là tỉ lệ của Tín Hiệu so với Nhiễu
Công thức phía trên đã cho toàn bộ chúng ta biết t-value đơn thuần và giản dị là so sánh độ mạnh mẽ và tự tin của tín hiệu với độ nhiễu trong mẫu tài liệu của bạn.
Nếu tín hiệu tương đối yếu so với mức độ nhiễu thì t-value sẽ nhỏ hơn. Do đó mức độ khác lạ sẽ ít hoàn toàn có thể có ý nghĩa thống kê.
Ở biểu đồ bên phải của hình phía trên, sự khác lạ giữa giá trị trung bình của tài liệu barx và giá trị trung bình giả thuyết mu_0là 16 phút. Nhưng chính bới những tài liệu trong mẫu bị trải rộng ra nên sự khác lạ này sẽ không còn còn ý nghĩa thống kê. Tại sao lại như vậy? Bởi vì t value tỉ lệ giữa tín hiệu và nhiễu thì tương đối bé do mẫu số lớn.
Tuy nhiên, nếu tín hiệu thì mạnh tương đối so với nhiễu, kích thước (tuyệt đối) của t-value sẽ to nhiều hơn. Do đó, sự khác lạ giữa barx và mu_0sẽ có được nhiều kĩ năng có ý nghĩa thống kê hơn.
Ở hình trên, sự khác lạ giữa barx và mu_0 cũng là 16 phút. Kích thước tài liệu cũng bằng nhau. Nhưng lần này, những điểm tài liệu co cụm lại gần nhau hơn. Vì tài liệu ít xấp xỉ hơn, nên sự khác lạ của 16 phút giờ đây lại mang ý nghĩa thống kê.
Thông điệp về ý nghĩa thống kê
Phương pháp t-test là ra làm sao với việc bảo nhóc teenager nhà bạn đi lau nhà bếp?
Nếu như nhóc teenager đang nghe nhạc, đang chơi video trò chơi, gửi tin nhắn nhắn cho bạn bè, hoặc bị sao nhãng bởi những nguồn nhiễu khác, bạn nên phải nói to nhiều hơn và mạnh hơn để hoàn toàn có thể đạt được mức ý nghĩa. Hoặc nếu bạn hoàn toàn có thể xóa khỏi được những nguồn nhiễu thì bạn hoàn toàn tránh việc phải ăn to nói lớn với nhóc teenager nhà bạn.
Một cách tương tự, nếu như kết quả t-test của bạn không đạt được ý nghĩa thống kê thì hoàn toàn có thể là vì một trong những nguyên nhân sau này:
( Điều này lý giải tại sao một mẫu tài liệu có kích thước cực lớn hoàn toàn có thể tạo ra được ý nghĩa thống kê tuy nhiên độ khác lạ rất nhỏ và hoàn toàn không còn ảnh hưởng thực tiễn.)
Công thức này cũng lý giải tại sao những nhà thống kê học lại than vãn trong phản ứng với ngôn từ đôi lúc được sử dụng để kết luận về một kết quả t-test. Ví dụ, một kết quả t-test không mong đợi sẽ tiến hành phát biểu :There is no significant difference
Không nhất thiết phải như vậy
Thực tế là hoàn toàn có thể có một độ khác lạ mang ý nghĩa. Nhưng hoàn toàn có thể chính bới mẫu tài liệu của bạn quá nhỏ, hoặc hoàn toàn có thể độ xấp xỉ của những điểm tài liệu quá rộng làm cho nghiên cứu và phân tích của bạn không thể hiện được ý nghĩa thống kê. Bạn hoàn toàn có thể phát biểu một cách bảo vệ an toàn và uy tín hơn rằng: Nghiên cứu của chúng tôi đang không tìm thấy chứng cứ của một độ khác lạ mang ý nghĩa thống kê.
Bài viết bạn hoàn toàn có thể quan tâm
Sự rất khác nhau giữa thống kê và học máy
Xây dựng một quy mô học máy phân loại đa lớp (multi-class classification)
Im Viet, the founder of this website with 6+ years experience in data analytics. My sharing is focus on data, which specialize on both Analytics and Business Intelligence platform as well as Data Science and Machine Learning platform.
Go to trang chủ PageChia sẻ nội dung bài viết
Reply
7
0
Chia sẻ
Chia Sẻ Link Down Cách tính giá trị p. của t-test miễn phí
Bạn vừa đọc Post Với Một số hướng dẫn một cách rõ ràng hơn về Clip Cách tính giá trị p. của t-test tiên tiến và phát triển nhất và Chia SẻLink Tải Cách tính giá trị p. của t-test miễn phí.
Giải đáp vướng mắc về Cách tính giá trị p. của t-test
Nếu sau khi đọc nội dung bài viết Cách tính giá trị p. của t-test vẫn chưa hiểu thì hoàn toàn có thể lại Comment ở cuối bài để Admin lý giải và hướng dẫn lại nha
#Cách #tính #giá #trị #của #ttest