ข้อมูลสำมะโนประชากรอาจค่อนข้างละเอียดอ่อน – ไม่ใช่ไฮโลออนไลน์แค่จำนวนคนที่อาศัยอยู่ในละแวกใกล้เคียง เมือง รัฐ หรือประเทศโดยรวม ทุกๆ 10 ปี สำนักงานสำรวจสำมะโนประชากรจะสอบถามเกี่ยวกับอายุภูมิหลังทางเชื้อชาติและชาติพันธุ์ ความสัมพันธ์ส่วนตัวกับผู้อื่นที่พวกเขาอาศัยอยู่ด้วย และอื่นๆ เป็นข้อมูลที่หลายคนไม่เปิดเผยกับเพื่อนบ้านหรือเพื่อนร่วมงาน ซึ่งน้อยกว่ารัฐบาลกลาง
ผู้ที่ไม่ไว้วางใจสำนักสำรวจสำมะโนประชากรให้เก็บข้อมูลของตนไว้เป็นส่วนตัวและปลอดภัย จะมีโอกาสน้อยที่จะตอบตามความจริงหรือตอบเลย
กฎหมายของรัฐบาลกลางห้ามไม่ให้สำนักงานและพนักงานแบ่งปันข้อมูลกับใครก็ตามรวมถึงหน่วยงานของรัฐอื่นๆ เช่น ตำรวจและกรมสรรพากร และสำนักสำรวจสำมะโนประชากรกำลังดำเนินการขั้นตอนใหม่เพื่อปกป้องข้อมูลสำมะโนปี 2020 ให้มากยิ่งขึ้น
ข้อมูลสำมะโนสามารถเผยแพร่ได้เฉพาะเป็นการรวบรวมสถิติเท่านั้น แต่ในยุคที่บริษัทจำนวนมากกำลังรวบรวมข้อมูลเกี่ยวกับผู้คนจำนวนมาก แม้แต่สถิติที่ไม่ระบุชื่อก็อาจทำให้เกิดความเสี่ยงต่อความเป็นส่วนตัวได้ นักวิจัยสำรวจสำมะโนประชากรได้ใช้ข้อมูลเชิงพาณิชย์บางส่วนในการโจมตีข้อมูลของตนโดยจำลอง และสามารถจับคู่กับ ผู้ ที่ตอบสนองต่อการสำรวจสำมะโนประชากรปี 2553 ได้มากถึง 17%
อย่างไรก็ตาม การคุ้มครองใหม่กำลังก่อให้เกิดความกังวลในหมู่ผู้สนับสนุนชุมชน เจ้าหน้าที่ของรัฐ และนักวิชาการที่สังเกตว่าวิธีการที่สำนักสำรวจสำมะโนประชากรใช้เพื่อเพิ่มความเป็นส่วนตัวทำให้ผลลัพธ์มีความแม่นยำน้อยลง พวกเขากังวลว่าการสำรวจสำมะโนส่วนตัวอาจมีประโยชน์น้อยกว่า
ในฐานะนักภูมิศาสตร์ที่ศึกษาวิธีสร้างและใช้ข้อมูลทางภูมิศาสตร์ ฉันได้มีส่วนร่วมตลอดทศวรรษที่ผ่านมาในความพยายามที่จะปรับปรุงสำมะโนปี 2020 ให้ทันสมัย และทำให้คุ้มทุนมากขึ้น ฉันเห็นความสำคัญของการสร้างสมดุลระหว่างการปกป้องความเป็นส่วนตัวของเราและการมีสถิติที่แม่นยำสำหรับการตัดสินใจตามข้อมูล
กลไกของรัฐบาลและเศรษฐกิจ
วัตถุประสงค์หลักของการสำรวจสำมะโนประชากรตามมาตราของรัฐธรรมนูญที่กำหนดให้เกิดขึ้นทุกๆ 10 ปี คือการนับจำนวนคนที่อาศัยอยู่ในแต่ละรัฐเพื่อกำหนดจำนวนสมาชิกสภาผู้แทนราษฎรที่แต่ละรัฐควรได้รับ
ง่ายพอ และสามารถทำได้โดยไม่ต้องรวบรวมหรือเผยแพร่ข้อมูลส่วนบุคคลเลย แต่การสำรวจที่น่าจะเข้าถึงทุกครัวเรือนในประเทศนั้นมีโอกาสน้อยที่จะถามคำถามอื่นๆ ด้วย ดังนั้น จากครั้งแรกในปี พ.ศ. 2333สำมะโนมีมากกว่าแค่จมูก
ข้อมูลที่รวบรวม ซึ่งรวมถึงอายุ ข้อมูลเชื้อชาติและชาติพันธุ์ และอัตราการเป็นเจ้าของบ้าน ช่วยกำหนดวิธีที่รัฐบาลกลางจัดสรรเงิน 1.5 ล้านล้านดอลลาร์สหรัฐในการใช้จ่ายทุกปี รัฐ รัฐบาลท้องถิ่น นักวิจัย และภาคธุรกิจต่างใช้ข้อมูลสำมะโนเพื่อจัดทำแผนการใช้จ่ายและวิเคราะห์ลักษณะของชุมชน
สหรัฐอเมริกามีการสำรวจสำมะโนประชากรที่แม่นยำและเชื่อถือได้มากที่สุด แห่งหนึ่ง ในโลก ข้อมูลที่ได้มีส่วนสำคัญในการสร้างความมั่งคั่งทางเศรษฐกิจและการเติบโตของสหรัฐอเมริกา
วิทยาศาสตร์ข้อมูลทำลายการปกป้องความเป็นส่วนตัว
สำนักสำรวจสำมะโนประชากร – และนักวิเคราะห์ทางสถิติส่วนใหญ่เช่นกัน – เคยคิดว่าความเป็นส่วนตัวของผู้คนได้รับการคุ้มครองโดยการรวบรวมข้อมูลเข้าด้วยกันเป็นจำนวนมาก ดังนั้น จุดเน้นคือการปกป้องความเป็นส่วนตัวในกลุ่มประชากรขนาดเล็ก แทนที่จะบอกว่ามีชาวฮิสแปนิกสองคนในละแวกหนึ่งโดยเฉพาะ ข้อมูลสำมะโนประชากรจะบอกว่ามีน้อยกว่าสามคน
ในกรณีอื่นๆ คอมพิวเตอร์ของสำนักสำรวจสำมะโนประชากรได้สลับตัวเลขสำหรับครัวเรือนในพื้นที่ทางภูมิศาสตร์ต่างๆ เพื่อผสมข้อมูลเพียงเล็กน้อย การเปลี่ยนแปลงเหล่านั้นเล็กน้อยและไม่ได้ทำการเปลี่ยนแปลงที่สำคัญกับความถูกต้องโดยรวมของข้อมูล
เมื่อเร็ว ๆ นี้ในปี 2012 การวิจัยเชิงวิชาการระบุว่าความเสี่ยงของการเปิดเผยข้อมูลส่วนตัวของบุคคลในข้อมูลสำมะโนประชากรมีน้อย โดย ต่ำ เพียง0.04% แต่เพียงไม่กี่ปีต่อมา การวิจัยใหม่ ได้เปลี่ยนการค้นพบกลับ หัวกลับหาง
ในปี 2560 และ 2561 สำนักสำรวจสำมะโนประชากรพบว่านักวิทยาศาสตร์ข้อมูลที่เข้าถึงฐานข้อมูลเชิงพาณิชย์และสาธารณะสามารถจับคู่ข้อมูลนั้นกับสถิติสำมะโนในลักษณะที่สามารถระบุถึง 17% ของชาวอเมริกันที่ทำสำมะโนเสร็จในปี 2010
ระดับความเปราะบางนั้นไม่สามารถยอมรับได้สำหรับเจ้าหน้าที่สำมะโน และการแข่งขันกำลังดำเนินไปเพื่อสร้างการป้องกันที่ดีขึ้นทันเวลาสำหรับการสำรวจสำมะโนประชากรครั้งต่อไป
ความเป็นส่วนตัวที่แตกต่างกันคืออะไร?
หลังจากการวิจัยและการอภิปรายสำนักสำรวจสำมะโนประชากรประกาศว่าจะใช้วิธีการที่เรียกว่า ” ความเป็นส่วนตัวที่แตกต่างกัน ” เพื่อปกป้องข้อมูลของผู้ตอบแบบสอบถามในการสำรวจสำมะโนประชากรปี 2020
ความท้าทายอย่างหนึ่งสำหรับเจ้าหน้าที่และนักวิชาการอย่างฉันคือระบบอธิบายยากมาก นักวิทยาศาสตร์คอมพิวเตอร์ของฮาร์วาร์ด Cynthia Dworkได้ยอมรับว่า “ มันเป็นความฝันของฉันที่จะเรียนรู้วิธีอธิบายสิ่งนี้จริงๆ เพื่อให้เข้าถึงได้อย่างกว้างขวาง”
โดยสรุป ความเป็นส่วนตัวที่แตกต่างกันนั้นไม่ได้รายงานตัวเลขที่แม่นยำอย่างแน่ชัด เช่น “5 คนในเมืองบิ๊กทาวน์เป็นชายฮิสแปนิก” แต่เป็นตัวเลขสุ่มที่ค่อนข้างใกล้เคียงกับตัวเลขที่ถูกต้อง เช่น 11 ข้อผิดพลาดแบบสุ่มเหล่านี้ทำให้ข้อมูลยากขึ้นมาก นักวิทยาศาสตร์ให้กลับไปหาว่าชายฮิสแปนิกคนใดในเมืองนั้นที่อาจเชื่อมโยงกับบันทึกสาธารณะที่เฉพาะเจาะจง และประชาชนก็มีข้อมูลบางส่วนถึงแม้จะไม่ถูกต้องหรือครบถ้วนทุกประการก็ตาม
ระบบซับซ้อนมากเพราะต้องตรวจสอบให้แน่ใจว่าการประมาณที่สร้างแบบสุ่มทั้งหมดมีความสมเหตุสมผลซึ่งกันและกัน ตัวอย่างเช่น จำนวนผู้ชายบวกจำนวนผู้หญิงต้องเท่ากับจำนวนคนทั้งหมด และผลรวมของประชากรมณฑลทั้งหมดในเทนเนสซีต้องเท่ากับจำนวนประชากรของรัฐเทนเนสซี
นอกจากนี้ เพื่อให้เป็นไปตามข้อกำหนดของรัฐธรรมนูญ ประชากรทั้งหมดของแต่ละรัฐจะต้องถูกต้องทุกประการ – ไม่ได้ปรับตามความเป็นส่วนตัวที่ต่างกันเลย – แม้ว่าจำนวนรวมของเมืองและเขตอาจมีการสุ่มอยู่บ้าง
การเปลี่ยนแปลงที่น่าหนักใจ
แนวคิดในการเพิ่มข้อผิดพลาดโดยเจตนาเป็นการเปลี่ยนแปลงอย่างมากสำหรับสำมะโน เพื่อช่วยให้ผู้ใช้เข้าใจวิธีการใหม่นี้ สำนักงานสำรวจสำมะโนประชากรจึงจัดทำชุดข้อมูลทดสอบ โดยนำความเป็นส่วนตัวส่วนต่างไปใช้กับผลการสำรวจสำมะโนประชากรปี 2553
ผมเป็นหนึ่งในกลุ่มผู้เชี่ยวชาญที่วิเคราะห์ข้อมูลการทดสอบ สิ่งที่เราพบทำให้อุ่นใจ: จำนวนประชากรของรัฐนั้นแม่นยำโดยการออกแบบโดยสมบูรณ์ และการประมาณการสำหรับประชากรจำนวนมาก เช่น จำนวนคนอายุ 20 ปีในเวอร์จิเนีย หรือจำนวนชาวฮิสแปนิกในลอสแองเจลิสนั้นค่อนข้างแม่นยำ
แต่สิ่งที่เราพบส่วนใหญ่ตกตะลึง การนับจำนวนน้อยมักผิดพลาดอย่างไม่อาจยอมรับได้ ในกรณีที่รุนแรงที่สุด เคาน์ตี้คาลาวาวเล็กๆ ของฮาวาย อดีตอาณานิคมโรคเรื้อนที่เข้าถึงได้เฉพาะทางอากาศ ทะเล หรือล่อมีการสุ่มเพิ่มมากจนทำให้จำนวนประชากรเพิ่มขึ้นจาก 90 เป็น 716
การค้นพบของกลุ่มวิจัยในรัฐเทนเนสซีที่ฉันอาศัยและทำงาน แสดงให้เห็นว่าข้อผิดพลาดเหล่านี้อาจส่งผลกระทบอย่างใหญ่หลวงต่อรัฐบาลท้องถิ่น ตัวอย่างเช่น รัฐเทนเนสซีใช้การสำรวจสำมะโนประชากรเพื่อกำหนดจำนวนเงินจากภาษีการขาย แอลกอฮอล์ และน้ำมันเพื่อส่งกลับไปยังเมืองต่างๆ ในปีปกติ รัฐจะส่งเงินประมาณ 120 ดอลลาร์ต่อคนไปยังแต่ละเมือง
อย่างไรก็ตาม การสุ่มแยกความเป็นส่วนตัวจะสร้างลอตเตอรีเสมือนจริง โดยเมืองต่างๆ จะได้รับเงินตั้งแต่ 80 ถึง 180 ดอลลาร์ต่อคนแทนที่จะเป็น 120 ดอลลาร์สำหรับทุกคน สำหรับชุมชนชนบทขนาดเล็ก การทำเช่นนี้อาจสร้างความแตกต่างได้ว่าจะซ่อมแซมถนนสายหลักหรือเลิกจ้างเจ้าหน้าที่ตำรวจประจำ
ข้อค้นพบ ที่น่าเป็นห่วงอื่น ๆได้แก่ :
จำนวนชนพื้นเมืองอเมริกันที่อาศัยอยู่ตามการจองต่ำอย่างสม่ำเสมอ
การเพิ่มจำนวนประชากรในเขตรัฐสภาในชนบทอย่างไม่ถูกต้องอย่างต่อเนื่อง
หลายจังหวัดที่มีสถิติเหลือเชื่อเหมือนไม่มีบ้านว่างเลย
หลายจังหวัดที่มีครัวเรือนมากกว่าคนซึ่งเป็นไปไม่ได้
ฉันทามติทั่วไปของผู้เชี่ยวชาญหลายคนในปัจจุบันคือข้อมูลการทดสอบซึ่งได้รับการคุ้มครองโดยความเป็นส่วนตัวที่แตกต่างกันนั้นไม่เหมาะสำหรับการใช้งานหลายอย่าง รวมถึงข้อมูลบางอย่างที่กำหนดโดยกฎหมายของรัฐและรัฐบาลกลาง
เวลากำลังจะหมดลง
สำนักสำรวจสำมะโนประชากรกำลังตอบสนองต่อคำวิพากษ์วิจารณ์ของผู้เชี่ยวชาญ และรายงานการสำรวจสำมะโนเมื่อไม่นานนี้ยอมรับว่าผลการทดสอบแสดงตัวเลขที่ไม่ถูกต้องอย่างไม่อาจยอมรับได้สำหรับเมืองเล็กๆ และจำนวนชนพื้นเมืองอเมริกันที่อาศัยอยู่ในเขตสงวน อย่างไรก็ตาม การกลับไปใช้วิธีการแบบเก่าจะไม่ถูกกล่าวถึงเป็นตัวเลือกอีกต่อไป
ยังไม่ชัดเจนว่าสำนักสำรวจสำมะโนประชากรอาจแก้ความยุ่งเหยิงนี้ในลักษณะที่ให้ทั้งสถิติที่เชื่อถือได้และการปกป้องความเป็นส่วนตัวที่เหมาะสม กำหนดเส้นตายแรกในการเผยแพร่สถิติพื้นที่ขนาดเล็กคือวันที่ 31 มีนาคม 2021เมื่อมีการเผยแพร่ข้อมูลการกำหนดเขตใหม่ของรัฐสภา
สิ่งที่เกิดขึ้นระหว่างนี้และในขณะนั้นจะเป็นตัวกำหนดว่าสำนักสำรวจสำมะโนสามารถแก้ปัญหาได้หรือไม่ และโน้มน้าวเจ้าหน้าที่ นักวิจัย และนักวิเคราะห์ว่าแนวทางแก้ไขนี้ แท้จริงแล้ว มีประโยชน์สำหรับข้อมูลสำมะโนเพื่อวัตถุประสงค์อื่นๆ ทั้งหมดที่ให้บริการไฮโลออนไลน์