ลายนิ้วมือวรรณกรรม

ลายนิ้วมือวรรณกรรม

เมื่อมองแวบแรก อาจดูเหมือนว่าวิธีการระบุสไตล์ของนักเขียนคือการศึกษาลักษณะที่หายากและโดดเด่นที่สุดของงานเขียนของเขาหรือเธอ ท้ายที่สุดแล้ว คำที่คาดไม่ถึงและการใช้โวหารที่ไม่ธรรมดานั้นดูเหมือนจะทำให้งานชิ้นหนึ่งมีเอกลักษณ์เฉพาะของเชกสเปียร์หรือดิกเกนเซียนวิธีการที่น่านับถือและใช้กันทั่วไปของนักสไตโลเมทริสต์กลับตรงกันข้าม: ตรวจสอบว่านักเขียนใช้คำที่เหมือนขนมปังและเนยเช่น “ถึง” และ “กับ” อย่างไร แม้ว่าวิธีนี้จะดูขัดกับสัญชาตญาณ แต่ก็ขึ้นอยู่กับตรรกะของเสียง

David Holmes นักสไตโลเมทริสต์จาก College of New Jersey 

ใน Ewing กล่าวว่า “การใช้คำในชีวิตประจำวันโดยไม่รู้ตัวของผู้คนนั้นมาพร้อมกับตราประทับบางอย่าง” แม่นยำ เนื่องจากนักเขียนใช้คำฟังก์ชันเหล่านี้โดยไม่ได้คิดถึงคำเหล่านั้น พวกเขาอาจให้ลายนิ้วมือที่น่าเชื่อถือของสไตล์ของนักเขียนมากกว่าคำที่ผิดปกติ

“คำหายากคือคำที่เห็นได้ชัดเจน ซึ่งคนอื่นอาจหยิบมาใช้หรือสะท้อนออกมาโดยไม่รู้ตัว” เบอร์โรวส์กล่าว “มันยากกว่ามากสำหรับใครบางคนที่จะเลียนแบบรูปแบบความถี่ ‘แต่’ และ ‘ใน’ ของฉัน”

ในช่วงต้นทศวรรษ 1960 นักสถิติ Frederick Mosteller และ David Wallace ได้เปิดตัวการใช้คำฟังก์ชันเพื่อระบุผู้ประพันธ์ พวกเขาวิเคราะห์Federalist Papersบทความ 85 เรื่องที่ตีพิมพ์โดยไม่ระบุตัวตนในปี พ.ศ. 2330 และ พ.ศ. 2331 เพื่อโน้มน้าวให้ชาวนิวยอร์กยอมรับรัฐธรรมนูญฉบับใหม่ของสหรัฐอเมริกา นักวิชาการรู้มานานแล้วว่า Alexander Hamilton, James Madison และ John Jay เขียนเรียงความ แต่ทั้ง Hamilton และ Madison อ้างว่าเป็นผู้ประพันธ์บทความ 12 ฉบับ

เพื่อตัดสินว่าใครเป็นผู้เขียนเอกสารที่มีการโต้แย้ง Mosteller และ Wallace ได้เปรียบเทียบการใช้คำในงานเขียนอื่นๆ ของ Hamilton และของ Madison ตัวอย่างเช่น พวกเขาพบว่าแฮมิลตันใช้คำว่า “เมื่อ” บ่อยกว่าเมดิสันประมาณ 10 เท่า ด้วยคำศัพท์ที่โดดเด่นกว่า 30 คำ Mosteller และ Wallace จึงพิจารณาเอกสารที่เป็นข้อโต้แย้งแต่ละฉบับ

โมสเทลเลอร์และวอลเลซเริ่มต้นโดยสมมติว่าสำหรับกระดาษแต่ละแผ่น 

ความน่าจะเป็นเท่ากับว่าเมดิสันหรือแฮมิลตันเป็นผู้เขียน จากนั้นพวกเขาใช้ความถี่ของคำ 30 คำ ทีละคำ เพื่อปรับปรุงค่าประมาณความน่าจะเป็นนี้ ในที่สุดพวกเขาก็มอบหมายเอกสารพิพาททั้ง 12 ฉบับให้กับเมดิสัน 

ซึ่งเป็นข้อสรุปที่สอดคล้องกับมุมมองของนักประวัติศาสตร์

การศึกษาหลักที่สำคัญของ Mosteller และ Wallace เป็นการสาธิตครั้งแรกที่น่าเชื่อถือว่า stylometry สามารถแยกแยะการประพันธ์ของข้อความได้ Holmes กล่าว ตั้งแต่นั้นเป็นต้นมาFederalist Papersก็เป็นพื้นที่ทดสอบยอดนิยมสำหรับนักวิจัยที่ลองใช้วิธีการทางสไตโลเมตริกใหม่ๆ

หลายมิติ

แม้ว่าการศึกษาของ Mosteller และ Wallace จะสร้างความแตกต่างอย่างมาก แต่เทคนิคของพวกเขายังไม่ได้รับการหยิบยกมาใช้อย่างแพร่หลาย สาเหตุหลักมาจากการขาดแคลนพลังในการคำนวณและข้อความที่เครื่องอ่านได้ในขณะนั้น ในช่วงปลายทศวรรษ 1980 สิ่งนั้นกำลังเปลี่ยนไป ในช่วงเวลานี้ เบอร์โรวส์พบวิธีนำเทคนิคทางสถิติมาใช้ ซึ่งกลายเป็น “ทางเลือกแรก” สำหรับสไตโลเมทริสต์

เช่นเดียวกับ Mosteller และ Wallace Burrows ตรวจสอบความถี่ของคำฟังก์ชัน อย่างไรก็ตาม ในขณะที่ Mosteller และ Wallace รวมข้อมูลทีละคำเข้าด้วยกัน Burrows’ วิเคราะห์ข้อมูลจากคำทั้งหมดในคราวเดียว ขณะนี้นักวิจัยได้นำเทคนิคของ Burrows ไปใช้อย่างกว้างขวาง โดยทำการปรับเปลี่ยนหลายอย่างไปพร้อมกัน

งานของ Binongo ในThe Royal Book of Ozเป็นตัวอย่างที่ดี เขาเริ่มต้นด้วยการรวบรวมตัวอย่างอื่นๆ ของงานเขียนของ Baum และ Thompson และแบ่งตัวอย่างออกเป็น 5,000 คำ จากนั้นเขาพบคำศัพท์ที่ใช้บ่อยที่สุด 50 คำในเนื้อหาของข้อความและนับความถี่ที่แต่ละคำปรากฏในแต่ละกลุ่ม กระบวนการนี้กลั่นแต่ละก้อนให้ได้ 50 หมายเลข

เช่นเดียวกับตัวเลขสองตัวระบุจุดในพื้นที่สองมิติ และตัวเลขสามตัวระบุจุดในพื้นที่สามมิติ ตัวเลข 50 ที่เกี่ยวข้องกับข้อความแต่ละกลุ่มจะระบุจุดในพื้นที่ 50 มิติ ความแตกต่างใด ๆ ในการกระจายประเด็นของ Baum และ Thompson อาจเป็นเบาะแสถึงสไตล์ที่แตกต่างกันของนักเขียน

ปัญหาคือ ผู้คนไม่เก่งเรื่องการมองเห็นพื้นที่ที่มีมากกว่าสามมิติ ดังนั้น Binongo จึงใช้เครื่องมือที่เรียกว่าการวิเคราะห์องค์ประกอบหลัก (PCA) เพื่อบีบขนาดต่างๆ ทั้งหมดลงบนระนาบแบน PCA ค้นหาระนาบที่จับภาพการเปลี่ยนแปลงดั้งเดิมในจุดที่กระจัดกระจายได้มากที่สุด

ไม่มีการรับประกันว่ารูปแบบจะปรากฏในระนาบนี้ ในกรณีของหนังสือ Oz นั้น มีรูปแบบที่กระโดดออกมา ข้อความของ Baum กระจุกตัวอยู่ที่ครึ่งหนึ่งของระนาบ ในขณะที่ข้อความของ Thompson อยู่อีกครึ่งหนึ่ง แสดงให้เห็นสิ่งที่ Binongo เรียกว่า “อ่าวโวหาร” ที่ชัดเจน

เมื่อชิ้นส่วนต่างๆ ของThe Royal Book of Ozถูกพล็อตในระนาบเดียวกัน พวกมันทั้งหมดจะลงจอดตรงกึ่งกลางของทอมป์สัน

“ด้วยความสม่ำเสมอที่ไม่มีข้อผิดพลาดนี้ เราจึงมีความมั่นใจในการระบุตัวตนของทอมป์สันในฐานะผู้แต่งหนังสือเล่มที่ 15” Binongo กล่าวในนิตยสารChance ฉบับฤดูใบไม้ ผลิ

credit : clarenceboddicker.com
offspringvideos.com
newsenseries.com
signalhillhikerphotography.com
jardinerianaranjo.com
3geekyguys.com
newamsterdammedia.com
platterivergolf.com
centennialsoccerclub.com
bellinghamboardsports.com