5 เรื่องสำคัญที่ต้องรู้เกี่ยวกับขอบของข้อผิดพลาดในการเลือกตั้ง

5 เรื่องสำคัญที่ต้องรู้เกี่ยวกับขอบของข้อผิดพลาดในการเลือกตั้ง

ในการเลือกตั้งประธานาธิบดี แม้แต่การเปลี่ยนแปลงเพียงเล็กน้อยในผลสำรวจการแข่งม้าก็ดูเหมือนจะเต็มไปด้วยความหมายลึกซึ้ง แต่พวกเขามักจะพูดเกินจริง นักสำรวจความคิดเห็นเปิดเผยส่วนต่างของข้อผิดพลาดเพื่อให้ผู้บริโภคเข้าใจว่ามีความแม่นยำมากเพียงใดที่คาดหวังได้อย่างสมเหตุสมผล แต่การรายงานผลสำรวจความคิดเห็นอย่างใจเย็นนั้นยากกว่าที่คิด เนื่องจากกฎทั่วไปทางสถิติบางข้อที่ผู้บริโภคที่ชาญฉลาดอาจคิดว่านำไปใช้นั้นเหมาะสมกว่าที่เห็น กล่าวอีกนัยหนึ่ง มันซับซ้อนเหมือนจริงในชีวิตต่อไปนี้คือเคล็ดลับบางประการเกี่ยวกับวิธีคิดเกี่ยวกับข้อผิดพลาดของแบบสำรวจ และความหมายของสิ่งต่างๆ ที่เรามักจะพยายามเรียนรู้จากข้อมูลการสำรวจ

1ขอบของข้อผิดพลาดคืออะไร?

เนื่องจากแบบสำรวจพูดคุยกับกลุ่มตัวอย่างเท่านั้น เราจึงรู้ว่าผลลัพธ์อาจไม่ตรงกับผลลัพธ์ “จริง” ที่เราจะได้หากเราสัมภาษณ์ทุกคนในกลุ่มประชากร ระยะขอบของข้อผิดพลาดในการสุ่มตัวอย่างจะอธิบายว่าเราคาดหวังผลการสำรวจได้ใกล้เคียงกับค่าประชากรจริงมากน้อยเพียงใด ส่วนต่างของข้อผิดพลาดบวกหรือลบ 3 จุดเปอร์เซ็นต์ที่ระดับความเชื่อมั่น 95% หมายความว่าหากเราทำแบบสำรวจเดียวกัน 100 ครั้ง เราคาดว่าผลลัพธ์จะอยู่ภายใน 3 จุดเปอร์เซ็นต์ของค่าประชากรจริง 95 ของจำนวนครั้งดังกล่าว

ขอบของข้อผิดพลาดที่โดยปกติแล้วผู้สำรวจความคิดเห็นจะรายงานถึงจำนวนของความแปรปรวนที่เราสามารถคาดหวังได้จากระดับการสนับสนุนของผู้สมัครแต่ละคน ตัวอย่างเช่น ในกราฟิกประกอบ โพลล์ A สมมุติฐานแสดงผู้สมัครจากพรรครีพับลิกันที่ได้รับเสียงสนับสนุน 48% บวกหรือลบ 3 เปอร์เซ็นต์ของข้อผิดพลาดจะหมายความว่าการสนับสนุนของพรรครีพับลิกัน 48% อยู่ในช่วงของสิ่งที่เราคาดหวังหากระดับการสนับสนุนที่แท้จริงในประชากรทั้งหมดอยู่ที่ 3 คะแนนในทิศทางใดทิศทางหนึ่ง เช่น ระหว่าง 45% ถึง 51%. 

2ฉันจะรู้ได้อย่างไรว่าลีดของผู้สมัครนั้น ‘อยู่นอกขอบเขตของข้อผิดพลาด’

รายงานข่าวเกี่ยวกับการหยั่งเสียงมักจะบอกว่าผู้นำของผู้สมัคร “อยู่นอกขอบเขตของข้อผิดพลาด” เพื่อระบุว่าผู้นำของผู้สมัครนั้นมากกว่าที่เราคาดไว้จากข้อผิดพลาดในการสุ่มตัวอย่าง หรือระบุว่าการแข่งขันเป็น “การเสมอกันทางสถิติ” หากใกล้เกินไป โทร. ไม่เพียงพอที่ผู้สมัครคนหนึ่งจะนำหน้ามากกว่าขอบของข้อผิดพลาดที่รายงานสำหรับผู้สมัครแต่ละคน (เช่น นำหน้ามากกว่า 3 คะแนนในตัวอย่างของเรา) ในการตัดสินว่าการแข่งขันใกล้จะถึงเวลาแล้วหรือไม่ เราจำเป็นต้องคำนวณส่วนต่าง ของข้อผิดพลาดใหม่ระหว่างระดับการสนับสนุนของผู้สมัครทั้งสอง โดยทั่วไปขนาดของระยะขอบนี้จะประมาณสองเท่าของระยะขอบสำหรับผู้สมัครแต่ละคน ข้อผิดพลาดที่ใหญ่กว่านั้นเกิดจากความจริงที่ว่าหากส่วนแบ่งของพรรครีพับลิกันสูงเกินไปโดยบังเอิญ ส่วนแบ่งของพรรคเดโมแครตน่าจะต่ำเกินไปและในทางกลับกัน

สำหรับแบบสำรวจ A ระยะขอบของข้อผิดพลาด 3 

เปอร์เซ็นต์สำหรับผู้สมัครแต่ละรายจะกลายเป็นระยะขอบของข้อผิดพลาดประมาณ 6 จุดสำหรับความแตกต่างระหว่างทั้งสอง ซึ่งหมายความว่าแม้ว่าเราจะสังเกตเห็นคะแนนนำ 5 คะแนนสำหรับพรรครีพับลิกัน แต่เราสามารถคาดหวังได้อย่างมีเหตุผลว่าตำแหน่งที่แท้จริงของพวกเขาเมื่อเทียบกับพรรคเดโมแครตจะอยู่ระหว่าง –1 ถึง +11 คะแนนเปอร์เซ็นต์ พรรครีพับลิกันจะต้องนำหน้า 6 เปอร์เซ็นต์ขึ้นไปเพื่อให้เรามั่นใจว่าผู้นำไม่ได้เป็นเพียงผลจากข้อผิดพลาดในการสุ่มตัวอย่าง

ในการสำรวจความคิดเห็น B ซึ่งมีข้อผิดพลาด 3 จุดสำหรับผู้สมัครแต่ละคนและส่วนต่าง 6 จุดสำหรับความแตกต่าง คะแนนนำของพรรครีพับลิกัน 8 เปอร์เซ็นต์นั้นมากพอที่จะไม่น่าจะเกิดจากข้อผิดพลาดในการสุ่มตัวอย่างเพียงอย่างเดียว

3ฉันจะรู้ได้อย่างไรว่ามีการเปลี่ยนแปลงในการแข่ง?

เมื่อมีหมายเลขการเลือกตั้งใหม่ออกมาทุกวัน เป็นเรื่องปกติที่จะเห็นรายงานของสื่อที่อธิบายถึงผู้นำของผู้สมัครว่าเพิ่มขึ้นหรือลดลงจากแบบสำรวจไปยังแบบสำรวจ แต่เราจะแยกแยะการเปลี่ยนแปลงที่แท้จริงจากสัญญาณรบกวนทางสถิติได้อย่างไร เช่นเดียวกับความแตกต่างระหว่างผู้สมัครสองคน ระยะขอบของข้อผิดพลาดสำหรับความแตกต่างระหว่างสองแบบสำรวจอาจมากกว่าที่คุณคิด

ในตัวอย่างในกราฟิกของเรา ผู้สมัครรับเลือกตั้งจากพรรครีพับลิกันย้ายจากคะแนนนำ 5 เปอร์เซ็นต์ในแบบสำรวจ A ไปเป็นผู้นำ 8 คะแนนในแบบสำรวจ B สำหรับการเปลี่ยนแปลงสุทธิ +3 คะแนนเปอร์เซ็นต์ แต่คำนึงถึงความแปรปรวนของการสุ่มตัวอย่าง ส่วนต่างของข้อผิดพลาดสำหรับการเปลี่ยนแปลง 3 จุดนั้นเป็นบวกหรือลบ 8 เปอร์เซ็นต์ กล่าวอีกนัยหนึ่ง การเปลี่ยนแปลงที่เราสังเกตเห็นนั้นสอดคล้องกันทางสถิติตั้งแต่การลดลง 5 จุดไปจนถึงการเพิ่มขึ้น 11 จุดในตำแหน่งของพรรครีพับลิกันเมื่อเทียบกับพรรคเดโมแครต นี่ไม่ได้หมายความว่าการเปลี่ยนแปลงขนาดใหญ่ดังกล่าวมีแนวโน้มที่จะเกิดขึ้นจริง (หรือไม่มีการเปลี่ยนแปลงเกิดขึ้น) แต่หมายความว่าเราไม่สามารถแยกความแตกต่างของการเปลี่ยนแปลงที่แท้จริงจากเสียงรบกวนได้อย่างน่าเชื่อถือจากการสำรวจเพียงสองครั้งนี้

แม้ว่าเราจะเห็นการเปลี่ยนแปลงอย่างมากในการสนับสนุนจากแบบสำรวจหนึ่งไปยังอีกแบบหนึ่ง เราควรใช้ความระมัดระวังในการยอมรับตามมูลค่าที่ตราไว้ ตั้งแต่วันที่ 1 มกราคม 2012 จนถึงการเลือกตั้งในเดือนพฤศจิกายน Huffpost Pollster ได้จัดทำแบบสำรวจระดับชาติ 590 รายการเกี่ยวกับการแข่งขันชิงตำแหน่งประธานาธิบดีระหว่าง Barack Obama และ Mitt Romney เมื่อใช้เกณฑ์ 95% แบบเดิม เราคาดว่า 5% (ประมาณ 30) ของแบบสำรวจเหล่านั้นจะสร้างค่าประมาณที่แตกต่างจากค่าประชากรจริงมากกว่าค่าเผื่อข้อผิดพลาด สิ่งเหล่านี้บางอย่างอาจห่างไกลจากความจริง

บ่อยครั้งที่แบบสำรวจที่ผิดปกติเหล่านี้จบลงด้วยการได้รับความสนใจอย่างมากเพราะพวกเขาบอกเป็นนัยถึงการเปลี่ยนแปลงครั้งใหญ่ในสถานะของการแข่งขันและบอกเล่าเรื่องราวที่น่าทึ่ง เมื่อเผชิญกับผลลัพธ์ที่น่าประหลาดใจหรือน่าทึ่ง คุณควรอดทนและดูว่าผลลัพธ์จะซ้ำรอยในการสำรวจครั้งต่อๆ ไปหรือไม่ ผลลัพธ์ที่ไม่สอดคล้องกับแบบสำรวจอื่นๆ ไม่จำเป็นต้องผิด แต่การเปลี่ยนแปลงจริงในสถานะของแคมเปญควรปรากฏในแบบสำรวจอื่นๆ ด้วย

จำนวนความแม่นยำที่สามารถคาดหวังได้สำหรับการเปรียบเทียบระหว่างสองแบบสำรวจจะขึ้นอยู่กับรายละเอียดของแบบสำรวจเฉพาะที่กำลังเปรียบเทียบ ในทางปฏิบัติ การสำรวจความคิดเห็นเกือบสองรายการในตัวเองจะพิสูจน์ได้ว่าไม่เพียงพอสำหรับการวัดการเปลี่ยนแปลงในการแข่งม้าได้อย่างน่าเชื่อถือ แต่ชุดของแบบสำรวจที่แสดงให้เห็นการเพิ่มขึ้นอย่างค่อยเป็นค่อยไปของผู้สมัครมักจะนำมาเป็นหลักฐานสำหรับแนวโน้มที่แท้จริง แม้ว่าความแตกต่างระหว่างแบบสำรวจแต่ละรายการจะอยู่ในขอบของข้อผิดพลาดก็ตาม ตามกฎทั่วไป การดูแนวโน้มและรูปแบบที่เกิดขึ้นจากโพลต่างๆ จำนวนมากสามารถให้ความมั่นใจได้มากกว่าการดูเพียงหนึ่งหรือสองแบบ

4ขอบของข้อผิดพลาดใช้กับกลุ่มย่อยอย่างไร

โดยทั่วไป ขอบเขตของข้อผิดพลาดที่รายงานสำหรับแบบสำรวจจะใช้กับการประมาณการที่ใช้ตัวอย่างทั้งหมด (เช่น ผู้ใหญ่ทั้งหมด ผู้ลงคะแนนที่ลงทะเบียนทั้งหมด หรือผู้มีสิทธิเลือกตั้งทั้งหมดที่ได้รับการสำรวจ) แต่โพลล์มักจะรายงานเกี่ยวกับกลุ่มย่อย เช่น คนหนุ่มสาว ชายผิวขาว หรือคนเชื้อสายสเปน เนื่องจากการประมาณการแบบสำรวจในกลุ่มย่อยของประชากรมีกรณีน้อยกว่า ระยะขอบของข้อผิดพลาดจึงมากกว่า – ในบางกรณีอาจใหญ่กว่ามาก

ตัวอย่างสุ่มอย่างง่ายจำนวน 1,067 กรณีมีข้อผิดพลาดบวกหรือลบ 3 จุดเปอร์เซ็นต์สำหรับการประมาณการสนับสนุนโดยรวมสำหรับผู้สมัครแต่ละคน สำหรับกลุ่มย่อย เช่น ฮิสแปนิก ซึ่งคิดเป็นประมาณ 15% ของประชากรผู้ใหญ่ในสหรัฐฯ ขนาดของกลุ่มตัวอย่างจะอยู่ที่ประมาณ 160 กรณีหากแสดงตามสัดส่วน นี่หมายถึงส่วนต่างของข้อผิดพลาดบวกหรือลบ 8 เปอร์เซ็นต์สำหรับผู้สมัครแต่ละคน และส่วนต่างของข้อผิดพลาดบวกหรือลบ 16 เปอร์เซ็นต์สำหรับความแตกต่างระหว่างผู้สมัครสองคน ในทางปฏิบัติ กลุ่มย่อยทางประชากรศาสตร์บางกลุ่ม เช่น ชนกลุ่มน้อยและคนหนุ่มสาวมักจะไม่ค่อยตอบสนองต่อการสำรวจและจำเป็นต้อง “เพิ่มน้ำหนัก” ซึ่งหมายความว่าการประมาณการสำหรับกลุ่มเหล่านี้มักจะใช้ขนาดตัวอย่างที่เล็กกว่า องค์กรเลือกตั้งบางแห่ง รวมถึง Pew Research Center

5อะไรเป็นตัวกำหนดจำนวนข้อผิดพลาดในการประมาณการแบบสำรวจ

ผู้เฝ้าดูแบบสำรวจจำนวนมากทราบดีว่าส่วนต่างของข้อผิดพลาดสำหรับแบบสำรวจนั้นมาจากขนาดของกลุ่มตัวอย่างเป็นหลัก แต่มีปัจจัยอื่น ๆ ที่ส่งผลต่อความแปรปรวนของการประมาณการ สำหรับการสำรวจความคิดเห็นสาธารณะ ผู้ร่วมให้ข้อมูลที่สำคัญเป็นพิเศษคือการให้น้ำหนัก หากไม่มีการปรับเปลี่ยน โพลล์มีแนวโน้มที่จะเป็นตัวแทนของคนที่เข้าถึงได้ง่ายกว่าและเป็นตัวแทนของคนประเภทที่สัมภาษณ์ได้ยากกว่า ในการทำให้ผลลัพธ์ของพวกเขาเป็นแบบสำรวจความคิดเห็นที่เป็นตัวแทนมากขึ้น ให้น้ำหนักข้อมูลของพวกเขาเพื่อให้ตรงกับประชากร ซึ่งโดยปกติจะขึ้นอยู่กับมาตรการทางประชากรศาสตร์จำนวนหนึ่ง การให้น้ำหนักเป็นขั้นตอนสำคัญสำหรับการหลีกเลี่ยงผลลัพธ์ที่มีอคติ แต่ก็มีผลในการทำให้ส่วนต่างของข้อผิดพลาดใหญ่ขึ้นด้วย นักสถิติเรียกความแปรปรวนที่เพิ่มขึ้นนี้ว่าเอฟเฟกต์การออกแบบ

เป็นสิ่งสำคัญที่ผู้สำรวจความคิดเห็นจะต้องคำนึงถึงผลการออกแบบเมื่อพวกเขารายงานส่วนต่างของข้อผิดพลาดสำหรับแบบสำรวจ หากไม่เป็นเช่นนั้น แสดงว่าพวกเขาอ้างว่ามีความแม่นยำมากกว่าแบบสำรวจที่รับประกันจริง สมาชิกของAmerican Association for Public Opinion Research’s Transparency Initiative (รวมถึง Pew Research Center) จะต้องเปิดเผยวิธีการถ่วงน้ำหนักของพวกเขา และไม่ว่าส่วนต่างของข้อผิดพลาดที่รายงานจะส่งผลต่อการออกแบบหรือไม่

ฝาก 100 รับ 200