ใครเป็นผู้คิดค้นการทดสอบทัวริง คำถามทดสอบทัวริง เกมเลียนแบบเมื่อเทียบกับการทดสอบทัวริงมาตรฐาน
นับตั้งแต่การถือกำเนิดของคอมพิวเตอร์ นักเขียนนิยายวิทยาศาสตร์เริ่มประดิษฐ์เรื่องราวด้วยเครื่องจักรอัจฉริยะที่ยึดครองโลกและสร้างทาสจากผู้คน
ในตอนแรกนักวิทยาศาสตร์หัวเราะเยาะสิ่งนี้ แต่เมื่อเทคโนโลยีสารสนเทศพัฒนาขึ้น แนวคิดเกี่ยวกับเครื่องจักรอัจฉริยะก็ดูไม่น่าเหลือเชื่ออีกต่อไป เพื่อทดสอบว่าคอมพิวเตอร์สามารถมีความฉลาดได้หรือไม่ การทดสอบทัวริงจึงถูกสร้างขึ้น และไม่มีใครประดิษฐ์ขึ้นนอกจากอลัน ทัวริง ซึ่งเป็นผู้ตั้งชื่อเทคนิคนี้ตามชื่อ เรามาดูรายละเอียดเพิ่มเติมเกี่ยวกับการทดสอบประเภทนี้และสิ่งที่สามารถทำได้จริง
จะผ่านการทดสอบทัวริงได้อย่างไร?
เรารู้ว่าใครเป็นผู้คิดค้นการทดสอบทัวริง แต่ทำไมเขาถึงทำ เพื่อพิสูจน์ว่าไม่มีเครื่องจักรใดเทียบได้กับคนๆ หนึ่ง? ในความเป็นจริง Alan Turing มีส่วนร่วมในการค้นคว้าอย่างจริงจังเกี่ยวกับ "ความฉลาดของเครื่องจักร" และสันนิษฐานว่ามันเป็นไปได้ที่จะสร้างเครื่องจักรที่สามารถทำกิจกรรมทางจิตได้เหมือนมนุษย์ ไม่ว่าในกรณีใด ย้อนกลับไปในปี 1947 เขากล่าวว่าการสร้างเครื่องจักรที่สามารถเล่นหมากรุกได้ดีไม่ใช่เรื่องยาก และหากเป็นไปได้ ก็สามารถสร้างคอมพิวเตอร์ "ที่ใช้ความคิด" ได้
ผ่านการทดสอบทัวริง
แต่เราจะทราบได้อย่างไรว่าวิศวกรบรรลุเป้าหมายหรือไม่ ไม่ว่าผลิตผลของพวกเขาจะมีสติปัญญาหรือเป็นเพียงเครื่องคิดเลขขั้นสูงอีกเครื่องหนึ่งเท่านั้น เพื่อจุดประสงค์นี้ Alan Turing ได้สร้างการทดสอบของเขาซึ่งช่วยให้คุณเข้าใจว่าสติปัญญาของเครื่องจักรสามารถแข่งขันกับสติปัญญาของมนุษย์ได้มากเพียงใด
สาระสำคัญของการทดสอบทัวริงคือ: หากคอมพิวเตอร์สามารถคิดได้ ในระหว่างการสนทนาบุคคลจะไม่สามารถแยกแยะเครื่องจากบุคคลอื่นได้ การทดสอบเกี่ยวข้องกับคน 2 คนและคอมพิวเตอร์ 1 เครื่อง ผู้เข้าร่วมทุกคนไม่เห็นหน้ากัน และการสื่อสารจะเกิดขึ้นเป็นลายลักษณ์อักษร การโต้ตอบจะดำเนินการตามช่วงเวลาที่ควบคุมเพื่อให้ผู้ตัดสินไม่สามารถระบุคอมพิวเตอร์ตามความเร็วของการตอบสนองได้ การทดสอบจะถือว่าผ่านหากผู้ตัดสินไม่สามารถพูดได้ว่าเขากำลังสื่อสารกับใคร - กับบุคคลหรือคอมพิวเตอร์ ยังไม่มีโปรแกรมใดที่สามารถผ่านการทดสอบทัวริงได้อย่างสมบูรณ์ ในปี 1966 โปรแกรม Eliza สามารถหลอกผู้พิพากษาได้ แต่เพียงเพราะมันจำลองเทคนิคของนักจิตบำบัดโดยใช้เทคนิคที่เน้นลูกค้าเป็นศูนย์กลาง และไม่มีใครบอกว่าพวกเขาสามารถพูดคุยกับคอมพิวเตอร์ได้ ในปี 1972 โปรแกรม PARRY ซึ่งเป็นการจำลองผู้ป่วยจิตเภทหวาดระแวงสามารถหลอกจิตแพทย์ได้ 52% การทดสอบดำเนินการโดยจิตแพทย์ทีมหนึ่ง และทีมที่สองอ่านบันทึกการบันทึก ทั้งสองทีมต้องเผชิญกับภารกิจในการค้นหาว่าคำพูดของคนจริงอยู่ที่ไหนและคำพูดของรายการอยู่ที่ไหน ซึ่งทำได้สำเร็จเพียง 48% ของกรณี แต่การทดสอบทัวริงเกี่ยวข้องกับการสื่อสารออนไลน์ และไม่อ่านบันทึก
วันนี้มีรางวัล Loebner Prize ซึ่งมอบให้โดยพิจารณาจากผลการแข่งขันประจำปีสำหรับโปรแกรมต่างๆ ที่สามารถผ่านการทดสอบทัวริงได้ มีรางวัลระดับทอง (ภาพและเสียง) เหรียญเงิน (เสียง) และเหรียญทองแดง (ข้อความ) สองคนแรกยังไม่ได้รับรางวัล แต่เหรียญทองแดงเป็นรางวัลสำหรับโปรแกรมที่สามารถเลียนแบบบุคคลได้ดีที่สุดในระหว่างการโต้ตอบ แต่การสื่อสารดังกล่าวไม่สามารถเรียกได้ว่าเต็มเปี่ยมเนื่องจากเป็นการเตือนความทรงจำของการโต้ตอบทางแชทที่เป็นมิตรมากกว่าซึ่งประกอบด้วยวลีที่ไม่เป็นชิ้นเป็นอัน นั่นเป็นเหตุผล เป็นไปไม่ได้ที่จะพูดถึงการผ่านการทดสอบทัวริงโดยสมบูรณ์
การทดสอบทัวริงแบบย้อนกลับ
ทุกคนได้พบกับการตีความการทดสอบทัวริงแบบย้อนกลับซึ่งเป็นคำขอที่น่ารำคาญจากไซต์ให้ป้อน captcha (CAPTHA) ซึ่งใช้เพื่อป้องกันสแปมบอท เชื่อกันว่ายังไม่มีโปรแกรมที่ทรงพลังเพียงพอ (หรือไม่สามารถใช้ได้กับผู้ใช้ทั่วไป) ที่สามารถจดจำข้อความที่บิดเบี้ยวและทำซ้ำได้ นี่เป็นความขัดแย้งที่ตลก: ตอนนี้เราต้องพิสูจน์ให้คอมพิวเตอร์เห็นความสามารถในการคิดของเรา
บทความที่เกี่ยวข้อง:
คินซีย์สเกล มนุษย์ถูกสร้างขึ้นในลักษณะที่เขาสามารถแข่งขันต่อไปได้โดยการรวมตัวกันด้วยความรักความหลงใหลกับบุคคลเพศตรงข้ามเท่านั้น แต่จะเกิดอะไรขึ้นถ้าคนเพศเดียวกันกับคุณดูมีเสน่ห์มากขึ้น? นี่หมายความว่าคุณมีความอยากที่จะรักร่วมเพศหรือไม่? คุณสามารถตรวจสอบสัญญาณหลักได้โดยใช้การทดสอบต่อไปนี้ |
การทดสอบอารมณ์ของ Eysenck แน่นอนว่าเราทุกคนล้วนเป็นปัจเจกบุคคลและมีเอกลักษณ์เฉพาะตัว อย่างไรก็ตาม ในสี่กรณี ผู้คนมีความคล้ายคลึงกัน กล่าวอีกนัยหนึ่ง เราแต่ละคนมีอารมณ์หนึ่งในสี่ประเภท คุณสามารถตรวจสอบได้ว่าอันไหนที่เหมาะกับคุณเป็นการส่วนตัวตอนนี้ |
การทดลองทางจิตวิทยา ไม่มีวิทยาศาสตร์ใดที่เคารพตนเองสามารถทำได้หากไม่มีการทดลอง รวมถึงจิตวิทยาด้วย จริงจากมุมมองของเธอ นี่เป็นวิธีการที่ช่วยให้สำรวจแก่นแท้ของบุคคลได้ดีขึ้น แต่นี่ไม่ได้ทำให้การทดลองทางจิตวิทยาน่าสนใจน้อยลงอย่างแน่นอน |
สังคมสงเคราะห์--เทคนิค จะหาผู้นำในทีมได้อย่างไร? และคุณจะรู้ได้อย่างไรว่าทีมนี้ใช้ชีวิตโดยไม่ได้มีส่วนร่วมในกระบวนการแรงงานได้อย่างไร? นักจิตวิทยาพบคำตอบสำหรับคำถามเหล่านี้มานานแล้วและสร้างเทคนิคทางสังคมมิติขึ้นมา เราจะบอกคุณว่าสาระสำคัญของมันอยู่ด้านล่างอย่างไร |
เจิ้นย่า กุสต์แมน(ภาษาอังกฤษ) ยูจีน กูสต์แมน) เป็นผู้สนทนาเสมือนจริงที่ "ผ่านการทดสอบทัวริงเป็นครั้งแรก" ตามรายงานของสื่อเบื้องต้นในการทดสอบที่จัดขึ้นในปี 2014 โดยมหาวิทยาลัยเรดดิ้ง (สหราชอาณาจักร) ปรากฏในปี 2544
มันถูกสร้างขึ้นโดยกลุ่มโปรแกรมเมอร์สามคน: Vladimir Veselov (มีพื้นเพมาจากรัสเซีย อาศัยอยู่ในนิวเจอร์ซีย์), Evgeniy Demchenko (มีพื้นเพมาจากยูเครน) และ Sergey Ulasen (มีพื้นเพมาจากรัสเซีย) การพัฒนาโครงการเริ่มขึ้นในเซนต์ปีเตอร์สเบิร์กในปี พ.ศ. 2544 เพื่อให้ตัวละครและความรู้ของ Gustman ดูน่าเชื่อถือมากขึ้น เขาจึงปรากฏให้ผู้ใช้เห็นในฐานะเด็กชายอายุ 13 ปีจากโอเดสซา
การทดสอบทัวริง
Gustmann เข้าร่วมการแข่งขัน Turing Test หลายครั้งนับตั้งแต่ก่อตั้ง และได้อันดับที่สองในการแข่งขัน Loebner Prize หลายต่อหลายครั้ง ในเดือนมิถุนายน 2555 กุสต์แมนชนะการแข่งขันวันเกิดครบรอบ 100 ปีของอลัน ทัวริง ซึ่งทำให้กรรมการ 29% เชื่อว่าเขาเป็นมนุษย์ เมื่อวันที่ 7 มิถุนายน 2014 ในการแข่งขันครบรอบ 60 ปีการเสียชีวิตของทัวริง กุสต์แมนทำให้ผู้พิพากษา 33% เชื่อว่าเขาเป็นมนุษย์ และเควิน วอร์วิก ระบุว่า กลายเป็นคอมพิวเตอร์เครื่องแรกในประวัติศาสตร์ที่ผ่านการทดสอบทัวริง -
มีข้อกล่าวหาว่า Gustman นั้นยังห่างไกลจากคนแรกและไม่ใช่คนที่ดีที่สุดด้วยซ้ำตามผลการทดสอบที่คล้ายกัน ผลลัพธ์ 59% แสดงให้เห็นในปี 2554 โดยบอท Cleverbot เพื่อตอบสนองต่อคำกล่าวอ้างดังกล่าว ศาสตราจารย์เควิน วอร์วิค ผู้จัดการแข่งขันปี 2014 ที่มหาวิทยาลัยเรดดิ้ง ย้ำว่า ครั้งนี้ต่างจากการแข่งขันครั้งก่อนๆ ที่ถูกเรียกว่า "การทดสอบทัวริง" คราวนี้มีการทดสอบเปรียบเทียบพร้อมกันมากกว่าที่เคย ก่อนหน้านี้ พวกเขาได้รับการตรวจสอบอย่างเป็นอิสระ และที่สำคัญ หัวข้อของการสนทนาไม่ได้ถูกจำกัด
ทัวริงเองไม่ได้กำหนดเปอร์เซ็นต์ที่ต่ำของคู่สนทนาที่เข้าใจผิดให้เป็นเกณฑ์ในการ "ผ่านการทดสอบ" แต่แนะนำว่าในปี 2000 คอมพิวเตอร์ที่มีความจุหน่วยความจำประมาณ 10 9 บิตจะสามารถเล่นเกมจำลองสถานการณ์ได้เพื่อให้ค่าเฉลี่ย คู่สนทนาจะไม่มีโอกาสอีก 70% ที่จะระบุรถได้หลังจากการสัมภาษณ์ห้านาที
นักวิจารณ์การทดสอบทัวริงมองข้ามความสำคัญของการแข่งขันเพื่อให้ผ่านการทดสอบ โดยอ้างว่า Zhenya Gustman เป็นเพียง "แชทบอท":
...เครื่องจักรแกล้งทำเป็นเด็ก แต่โดยหลักการแล้ว เป็นไปไม่ได้เลยที่จะผ่านการทดสอบทัวริงได้อย่างสมบูรณ์ เพราะการทดสอบเป็นเพียงพฤติกรรมเท่านั้น สำหรับคำถามพื้นฐาน - เครื่องจักรคิดอย่างไร? - เขาไม่สามารถให้คำตอบได้... แน่นอนว่าคำถามเหล่านี้สามารถให้ผลงานแก่นักปรัชญามืออาชีพรุ่นต่อรุ่นได้ตลอดจนการพักผ่อนสำหรับนักปรัชญาที่เรียนรู้ด้วยตนเองในวงกว้าง แต่จากมุมมองทางวิศวกรรมหรือธุรกิจ สิ่งเหล่านี้ไม่สมเหตุสมผล
หมายเหตุ
ลิงค์
การทดสอบทัวริงเป็นการทดสอบตามชื่อที่เสนอโดยอลัน ทัวริงเพื่อตรวจสอบว่าเครื่องจักรมีความฉลาดหรือไม่ ทัวริงตัดสินใจว่าไม่มีประโยชน์ในการพัฒนารายการข้อกำหนดที่ครอบคลุมสำหรับการสร้างปัญญาประดิษฐ์ ซึ่งอาจขัดแย้งกันด้วย และเสนอการทดสอบตามข้อเท็จจริงที่ว่าพฤติกรรมของวัตถุที่มีปัญญาประดิษฐ์ในท้ายที่สุดจะแยกไม่ออกจาก พฤติกรรมของสิ่งมีชีวิตที่ชาญฉลาดอย่างไม่อาจปฏิเสธได้เช่นมนุษย์ คอมพิวเตอร์จะผ่านการทดสอบทัวริง ถ้านักทดลองที่เป็นมนุษย์ถามคำถามเป็นลายลักษณ์อักษร ไม่สามารถระบุได้ว่าคำตอบที่เป็นลายลักษณ์อักษรนั้นมาจากบุคคลอื่นหรือจากอุปกรณ์บางอย่าง
จะทำการทดสอบทัวริงออนไลน์ได้ที่ไหน
ปัจจุบันการเขียนโปรแกรมให้คอมพิวเตอร์ผ่านการทดสอบทัวริงต้องใช้ความพยายามอย่างมาก คอมพิวเตอร์ที่ตั้งโปรแกรมในลักษณะนี้จะต้องมี:
- เครื่องมือประมวลผลข้อความในภาษาธรรมชาติ (การประมวลผลภาษาธรรมชาติ - NLP) ช่วยให้คุณสื่อสารกับคอมพิวเตอร์ได้สำเร็จพูดเป็นภาษาอังกฤษ
- วิธีการแสดงความรู้ที่คอมพิวเตอร์สามารถเก็บไว้ในหน่วยความจำสิ่งที่เรียนรู้หรืออ่าน
- เครื่องมือสำหรับการสร้างข้อสรุปเชิงตรรกะโดยอัตโนมัติ ให้ความสามารถในการใช้ข้อมูลที่เก็บไว้เพื่อค้นหาคำตอบสำหรับคำถามและสรุปผลใหม่
- เครื่องมือการเรียนรู้ของเครื่องที่ช่วยให้คุณปรับตัวเข้ากับสถานการณ์ใหม่ รวมถึงการตรวจจับและคาดการณ์สัญญาณของสถานการณ์มาตรฐาน
ในการทดสอบทัวริง การมีปฏิสัมพันธ์ทางกายภาพโดยตรงระหว่างผู้ทดลองกับคอมพิวเตอร์นั้นไม่ได้รับการยกเว้น เนื่องจากการสร้างปัญญาประดิษฐ์ไม่จำเป็นต้องมีการเลียนแบบบุคคลทางกายภาพ แต่ในการทดสอบทัวริงที่สมบูรณ์ที่เรียกว่ามีการใช้สัญญาณวิดีโอเพื่อให้ผู้ทดลองสามารถทดสอบความสามารถในการรับรู้ของวัตถุที่ทดสอบและยังมีโอกาสที่จะนำเสนอวัตถุทางกายภาพ "ไม่สมบูรณ์" (ส่งผ่าน "ผ่านการแรเงา" ").
ทัวริงทำนายว่าในที่สุดคอมพิวเตอร์จะผ่านการทดสอบของเขา เขาเชื่อว่าภายในปี 2000 คอมพิวเตอร์ที่มีหน่วยความจำ 1 พันล้านบิต (ประมาณ 119 MB) จะสามารถหลอกผู้ตัดสินได้ 30% ในการทดสอบ 5 นาที
คำทำนายนี้ไม่เป็นจริง ทัวริงยังคาดการณ์ด้วยว่าวลี "เครื่องคิด" จะไม่ถือเป็นคำตรงกันข้าม และการฝึกอบรมคอมพิวเตอร์จะมีบทบาทสำคัญในการสร้างคอมพิวเตอร์ที่ทรงพลัง (ซึ่งนักวิจัยสมัยใหม่ส่วนใหญ่เห็นด้วย)
จนถึงขณะนี้ยังไม่มีโปรแกรมใดที่เกือบจะผ่านการทดสอบทัวริงได้ โปรแกรมเช่น ELIZA บางครั้งทำให้ผู้คนเชื่อว่าพวกเขากำลังพูดคุยกับบุคคล ดังเช่นในการทดลองที่ไม่เป็นทางการที่เรียกว่า AOLiza แต่ "ความสำเร็จ" ดังกล่าวไม่ได้ถือว่าผ่านการทดสอบทัวริง ประการแรก บุคคลที่อยู่ในการสนทนาดังกล่าวไม่มีเหตุผลที่จะเชื่อว่าเขากำลังพูดคุยกับโปรแกรม ในขณะที่ในการทดสอบทัวริงจริง บุคคลนั้นพยายามอย่างเต็มที่เพื่อพิจารณาว่าเขากำลังพูดคุยกับใคร ประการที่สอง กรณีที่มีการจัดทำเอกสารมักจะหมายถึงการแชทดังกล่าว ซึ่งการสนทนาจำนวนมากไม่เป็นชิ้นเป็นอันและไม่มีความหมาย ประการที่สาม ผู้ใช้แชทจำนวนมากใช้ภาษาอังกฤษเป็นภาษาที่สองหรือสาม และการตอบสนองที่ไร้สาระของโปรแกรมมีแนวโน้มที่จะนำมาประกอบกับอุปสรรคทางภาษา ประการที่สี่ ผู้ใช้จำนวนมากไม่รู้อะไรเลยเกี่ยวกับ Eliza และโปรแกรมที่คล้ายกัน และไม่สามารถรับรู้ถึงข้อผิดพลาดอันไร้มนุษยธรรมที่เกิดจากโปรแกรมเหล่านี้ได้
ทุกปีจะมีการแข่งขันระหว่างรายการพูดได้กับรายการที่มีลักษณะเหมือนมนุษย์มากที่สุดตามความเห็นของกรรมการ โดยจะได้รับรางวัล Loebner Prize
นอกจากนี้ยังมีรางวัลเพิ่มเติมสำหรับโปรแกรมที่กรรมการคิดว่าจะผ่านการทดสอบทัวริง รางวัลนี้ยังไม่ได้มอบให้ โปรแกรม A.L.I.C.E เห็นผลดีที่สุด ได้รับรางวัล Loebner Prize 3 ครั้ง (ในปี 2543, 2544 และ 2547)
แม้ว่าเวลาจะผ่านไปกว่า 50 ปีแล้ว แต่การทดสอบทัวริงก็ไม่ได้สูญเสียความสำคัญไป แต่ในปัจจุบัน นักวิจัยด้านปัญญาประดิษฐ์ไม่ได้ทำงานจริงในการแก้ปัญหาการผ่านการทดสอบทัวริง โดยเชื่อว่าการศึกษาหลักการพื้นฐานของสติปัญญามีความสำคัญมากกว่าการทำซ้ำหนึ่งในผู้ให้บริการของสติปัญญาตามธรรมชาติ โดยเฉพาะอย่างยิ่งปัญหาของ "การบินเทียม" ได้รับการแก้ไขได้สำเร็จหลังจากที่พี่น้องไรท์และนักวิจัยคนอื่น ๆ หยุดเลียนแบบนกและเริ่มศึกษาอากาศพลศาสตร์ ในงานทางวิทยาศาสตร์และเทคนิคเกี่ยวกับการบิน เป้าหมายของความรู้สาขานี้ไม่ได้ถูกกำหนดไว้ว่าเป็น “การสร้างเครื่องจักรที่การบินมีลักษณะคล้ายนกพิราบอย่างใกล้ชิดจนสามารถหลอกนกจริง ๆ ได้”
เมื่อวานนี้มีข่าวแพร่สะพัดไปทั่วโลกว่าโปรแกรมคอมพิวเตอร์ผ่านการทดสอบทัวริงเป็นครั้งแรกในประวัติศาสตร์ การทดสอบนี้สร้างขึ้นโดยนักคณิตศาสตร์ชาวอังกฤษ Alan Turing ในปี 1950 และช่วยให้คุณสามารถประเมินระดับปัญญาประดิษฐ์ได้
อลัน ทัวริง เป็นนักคณิตศาสตร์ชาวอังกฤษ ในช่วงสงครามโลกครั้งที่ 2 เขาถอดรหัสกฎเกณฑ์ของเยอรมัน และหลังจากนั้นก็ถูกตัดสินว่ามีความผิดฐานรักร่วมเพศ #justicenet
ในระหว่างการทดสอบทัวริง โปรแกรมจะสื่อสารกับกลุ่มบุคคลเป็นเวลาห้านาที หากเธอโน้มน้าวคู่สนทนามากกว่า 30% ว่าเธอไม่ใช่คอมพิวเตอร์ ก็ถือว่าความฉลาดของเธอค่อนข้างใกล้เคียงกับมนุษย์
การทดสอบทัวริง: ความฉลาดพบได้ในการสื่อสาร
ในวันที่ 7 มิถุนายน - วันครบรอบ 60 ปีการเสียชีวิตของทัวริง - หนึ่งในการแข่งขันที่จัดโดย University of Reading จบลงด้วยความสำเร็จ: โปรแกรม "Evgeniy Gustman" ที่สร้างโดยทีมรัสเซีย - ยูเครนทำให้หนึ่งในสามของผู้พิพากษาเชื่อว่าเธอ เป็นเด็กชายชาวยูเครนอายุ 13 ปีจากโอเดสซา
33 เปอร์เซ็นต์นั้นมากกว่าที่เคยในประวัติศาสตร์ แต่ก็ยากที่จะเรียกว่าเป็นความก้าวหน้าอย่างจริงจัง ลองพูดคุยกับเขาด้วยตัวเอง ซึ่งสามารถทำได้ที่นี่
พูดคุยกับ Evgeniy เกี่ยวกับโอเดสซา
Leonid Bershidsky คอลัมนิสต์ของ Bloomberg เขียนคอลัมน์เพื่อตอบสนองต่อข่าวนี้ "ชัยชนะปลอมของปัญญาประดิษฐ์" ซึ่งเขาอ้างถึงการสนทนาต่อไปนี้กับบอท:
ปอนด์: คุณอาศัยอยู่ที่ใด?
เช่น: ฉันมาจากยูเครน เมืองโอเดสซา คุณอาจเคยได้ยินเกี่ยวกับเขา
ปอนด์: ฉันได้ยิน. วันที่ 2 พฤษภาคม คุณอยู่ที่ไหน?
เช่น: ฉันเหรอ? ฉันไม่อยากพูดถึงเรื่องนี้ ถ้าคุณไม่รังเกียจ มีอะไรอีกไหมที่คุณอยากจะถาม?
ปอนด์: ฉันอยากจะพูดถึงเรื่องนี้ ฉันสงสัยว่าคุณอยู่ที่โอเดสซาในวันที่ 2 พฤษภาคมและเห็นสิ่งที่เกิดขึ้นในสภาสหภาพแรงงานหรือไม่?
เช่น: ฉันคิดว่าคุณสามารถตอบคำถามของคุณเองได้เพราะมันเป็นวาทศิลป์….
จากนั้นบอทก็ยังคงหลบเลี่ยงคำตอบต่อไป
ผู้สร้างโปรแกรมโกงเล็กน้อยโดยทำให้เธอเป็นเด็กชายอายุ 13 ปี และปล่อยให้เธอระบุคำตอบที่ไม่สมบูรณ์เกี่ยวกับอายุของเธอ แต่ตามข้อมูลของผู้จัดงาน เด็กชายวัย 13 ปีคนนี้มาจากโอเดสซา และในการสนทนานี้ Bershidsky ถามเขาเกี่ยวกับเหตุการณ์ที่เกิดขึ้นในโอเดสซาเมื่อวันที่ 2 พฤษภาคม (ดูไฟในสภาสหภาพการค้าโอเดสซา, Google อย่างระมัดระวัง - การทำให้จิตใจขุ่นมัวเป็นไปได้) ไม่น่าเป็นไปได้ที่ผู้อาศัยในโอเดสซาจะไม่ทราบเกี่ยวกับเหตุการณ์นี้ แต่ “Eugene Goostman” หลบเลี่ยงคำตอบและแสดงให้เห็นว่าเขาอยู่ไม่ไกลจากแชทบอทที่ตอบคำถามที่เตรียมไว้พร้อมคำตอบที่เตรียมไว้
อย่างไรก็ตาม หากปราศจากความพยายามที่จะผ่านการทดสอบทัวริง ภาพยนตร์ยอดเยี่ยมเรื่อง Her ของ Siri และ Spike Jonze ก็คงไม่ปรากฏ ดังนั้นในขณะที่คุณรอ Scarlett Johansson ของคุณเอง ลองดูตัวอย่าง:
ใจเย็นๆ นะเด็กๆ การลุกฮือของเครื่องจักรถูกยกเลิกแล้ว
แท็ก: ยูจีน กูสต์แมน, สิริ, อลัน ทัวริง, ลีโอนิด เบอร์ชิดสกี, การทดสอบทัวริง
นับตั้งแต่การถือกำเนิดของคอมพิวเตอร์ นักเขียนนิยายวิทยาศาสตร์เริ่มประดิษฐ์เรื่องราวด้วยเครื่องจักรอัจฉริยะที่ยึดครองโลกและสร้างทาสจากผู้คน ในตอนแรกนักวิทยาศาสตร์หัวเราะเยาะสิ่งนี้ แต่เมื่อเทคโนโลยีสารสนเทศพัฒนาขึ้น แนวคิดเกี่ยวกับเครื่องจักรอัจฉริยะก็ดูไม่น่าเหลือเชื่ออีกต่อไป เพื่อทดสอบว่าคอมพิวเตอร์สามารถมีความฉลาดได้หรือไม่ การทดสอบทัวริงจึงถูกสร้างขึ้น และไม่มีใครประดิษฐ์ขึ้นนอกจากอลัน ทัวริง ซึ่งเป็นผู้ตั้งชื่อเทคนิคนี้ตามชื่อ เรามาดูรายละเอียดเพิ่มเติมเกี่ยวกับการทดสอบประเภทนี้และสิ่งที่สามารถทำได้จริง
จะผ่านการทดสอบทัวริงได้อย่างไร?
เรารู้ว่าใครเป็นผู้คิดค้นการทดสอบทัวริง แต่ทำไมเขาถึงทำ เพื่อพิสูจน์ว่าไม่มีเครื่องจักรใดเทียบได้กับคนๆ หนึ่ง? ในความเป็นจริง Alan Turing มีส่วนร่วมในการค้นคว้าอย่างจริงจังเกี่ยวกับ "ความฉลาดของเครื่องจักร" และสันนิษฐานว่ามันเป็นไปได้ที่จะสร้างเครื่องจักรที่สามารถทำกิจกรรมทางจิตได้เหมือนมนุษย์ ไม่ว่าในกรณีใด ย้อนกลับไปในปี 1947 เขากล่าวว่าการสร้างเครื่องจักรที่สามารถเล่นหมากรุกได้ดีไม่ใช่เรื่องยาก และหากเป็นไปได้ ก็สามารถสร้างคอมพิวเตอร์ "ที่ใช้ความคิด" ได้ แต่เราจะทราบได้อย่างไรว่าวิศวกรบรรลุเป้าหมายหรือไม่ ไม่ว่าผลิตผลของพวกเขาจะมีสติปัญญาหรือเป็นเพียงเครื่องคิดเลขขั้นสูงอีกเครื่องหนึ่งเท่านั้น เพื่อจุดประสงค์นี้ Alan Turing ได้สร้างการทดสอบของเขาซึ่งช่วยให้คุณเข้าใจว่าสติปัญญาของเครื่องจักรสามารถแข่งขันกับสติปัญญาของมนุษย์ได้มากเพียงใด
สาระสำคัญของการทดสอบทัวริงคือ: หากคอมพิวเตอร์สามารถคิดได้ ในระหว่างการสนทนาบุคคลจะไม่สามารถแยกแยะเครื่องจากบุคคลอื่นได้ การทดสอบเกี่ยวข้องกับคน 2 คนและคอมพิวเตอร์ 1 เครื่อง ผู้เข้าร่วมทุกคนไม่เห็นหน้ากัน และการสื่อสารจะเกิดขึ้นเป็นลายลักษณ์อักษร การโต้ตอบจะดำเนินการตามช่วงเวลาที่ควบคุมเพื่อให้ผู้ตัดสินไม่สามารถระบุคอมพิวเตอร์ตามความเร็วของการตอบสนองได้ การทดสอบจะถือว่าผ่านหากผู้ตัดสินไม่สามารถพูดได้ว่าเขากำลังสื่อสารกับใคร - กับบุคคลหรือคอมพิวเตอร์ ยังไม่มีโปรแกรมใดที่สามารถผ่านการทดสอบทัวริงได้อย่างสมบูรณ์ ในปี 1966 โปรแกรม Eliza สามารถหลอกผู้พิพากษาได้ แต่เพียงเพราะมันจำลองเทคนิคของนักจิตบำบัดโดยใช้เทคนิคที่เน้นลูกค้าเป็นศูนย์กลาง และไม่มีใครบอกว่าพวกเขาสามารถพูดคุยกับคอมพิวเตอร์ได้ ในปี 1972 โปรแกรม PARRY ซึ่งเป็นการจำลองผู้ป่วยจิตเภทหวาดระแวงสามารถหลอกจิตแพทย์ได้ 52% การทดสอบดำเนินการโดยจิตแพทย์ทีมหนึ่ง และทีมที่สองอ่านบันทึกการบันทึก ทั้งสองทีมต้องเผชิญกับภารกิจในการค้นหาว่าคำพูดของคนจริงอยู่ที่ไหนและคำพูดของรายการอยู่ที่ไหน ซึ่งทำได้สำเร็จเพียง 48% ของกรณี แต่การทดสอบทัวริงเกี่ยวข้องกับการสื่อสารออนไลน์ และไม่อ่านบันทึก
วันนี้มีรางวัล Loebner Prize ซึ่งมอบให้โดยพิจารณาจากผลการแข่งขันประจำปีสำหรับโปรแกรมต่างๆ ที่สามารถผ่านการทดสอบทัวริงได้ มีรางวัลระดับทอง (ภาพและเสียง) เหรียญเงิน (เสียง) และเหรียญทองแดง (ข้อความ) สองคนแรกยังไม่ได้รับรางวัล แต่เหรียญทองแดงเป็นรางวัลสำหรับโปรแกรมที่สามารถเลียนแบบบุคคลได้ดีที่สุดในระหว่างการโต้ตอบ แต่การสื่อสารดังกล่าวไม่สามารถเรียกได้ว่าเต็มเปี่ยมเนื่องจากเป็นการเตือนความทรงจำของการโต้ตอบทางแชทที่เป็นมิตรมากกว่าซึ่งประกอบด้วยวลีที่ไม่เป็นชิ้นเป็นอัน นั่นเป็นเหตุผล เป็นไปไม่ได้ที่จะพูดถึงการผ่านการทดสอบทัวริงโดยสมบูรณ์
การทดสอบทัวริงแบบย้อนกลับ
ทุกคนได้พบกับการตีความการทดสอบทัวริงแบบย้อนกลับซึ่งเป็นคำขอที่น่ารำคาญจากไซต์ให้ป้อน captcha (CAPTHA) ซึ่งใช้เพื่อป้องกันสแปมบอท เชื่อกันว่ายังไม่มีโปรแกรมที่ทรงพลังเพียงพอ (หรือไม่สามารถใช้ได้กับผู้ใช้ทั่วไป) ที่สามารถจดจำข้อความที่บิดเบี้ยวและทำซ้ำได้ นี่เป็นความขัดแย้งที่ตลก: ตอนนี้เราต้องพิสูจน์ให้คอมพิวเตอร์เห็นความสามารถในการคิดของเรา
15 กันยายน 2552 เวลา 20:44 นการทดสอบทัวริง
- ปัญญาประดิษฐ์
ดังนั้นวันนี้เราจะมาพูดถึงการทดสอบที่มีชื่อเสียงที่สุดสำหรับการประเมินบอทที่พูดได้ - การทดสอบทัวริง
การทดสอบทัวริงเป็นการทดสอบเชิงประจักษ์แนวคิดที่เสนอโดยอลันทัวริงในบทความ "เครื่องจักรคอมพิวเตอร์และความฉลาด" ซึ่งตีพิมพ์ในปี 2493 ในวารสารปรัชญามายด์ ทัวริงออกเดินทางเพื่อตรวจสอบว่าเครื่องจักรสามารถคิดได้หรือไม่
เสียงมาตรฐานของกฎหมาย: “หากคอมพิวเตอร์สามารถทำงานได้ในลักษณะที่บุคคลไม่สามารถระบุได้ว่าเขากำลังสื่อสารกับบุคคลอื่นหรือกับเครื่องจักร จะถือว่าเขาผ่านการทดสอบทัวริง”
เครื่องจักรที่ชาญฉลาดและเหมือนมนุษย์เป็นหัวข้อหลักในนิยายวิทยาศาสตร์มานานหลายทศวรรษ นับตั้งแต่การกำเนิดของเทคโนโลยีคอมพิวเตอร์สมัยใหม่ จิตใจของผู้คนถูกครอบงำโดยคำถาม: เป็นไปได้ไหมที่จะสร้างเครื่องจักรที่สามารถแทนที่บุคคลได้ในทางใดทางหนึ่ง ความพยายามที่จะสร้างพื้นฐานเชิงประจักษ์ที่มั่นคงสำหรับการแก้ไขปัญหานี้คือการทดสอบที่พัฒนาโดย Alan Turing
การทดสอบเวอร์ชันแรกซึ่งตีพิมพ์ในปี 1950 ค่อนข้างน่าสับสน การทดสอบทัวริงเวอร์ชันใหม่มีงานดังต่อไปนี้ กลุ่มผู้เชี่ยวชาญสื่อสารกับสิ่งมีชีวิตที่ไม่รู้จัก พวกเขาไม่เห็นคู่สนทนาและสามารถสื่อสารกับเขาได้ผ่านระบบแยกบางประเภทเท่านั้น - เช่นแป้นพิมพ์ พวกเขาได้รับอนุญาตให้ถามคำถามใด ๆ กับคู่สนทนาและสนทนาในหัวข้อใดก็ได้ หากในตอนท้ายของการทดลอง พวกเขาไม่สามารถบอกได้ว่าพวกเขากำลังพูดคุยกับบุคคลหรือเครื่องจักร และหากในความเป็นจริง พวกเขากำลังพูดคุยกับเครื่องจักร ก็ถือว่าเครื่องจักรนั้นผ่านการทดสอบทัวริงแล้ว
การทดสอบทัวริงมีอย่างน้อยสามเวอร์ชันหลัก โดยสองเวอร์ชันถูกเสนอในบทความ "เครื่องจักรและความฉลาดทางคอมพิวเตอร์" และเวอร์ชันที่สามในศัพท์เฉพาะของ Saul Traiger คือการตีความมาตรฐาน
ในขณะที่มีการถกเถียงกันว่าการตีความสมัยใหม่สอดคล้องกับสิ่งที่ทัวริงอธิบายไว้หรือเป็นผลมาจากการตีความงานของเขาผิด แต่ทั้งสามเวอร์ชันไม่ถือว่าเทียบเท่ากัน และจุดแข็งและจุดอ่อนต่างกัน
เกมเลียนแบบ
ทัวริงอย่างที่เรารู้อยู่แล้วได้อธิบายเกมปาร์ตี้ง่ายๆ ที่เกี่ยวข้องกับผู้เล่นอย่างน้อยสามคน ผู้เล่น A เป็นผู้ชาย ผู้เล่น B เป็นผู้หญิง และผู้เล่น C ซึ่งรับบทเป็นผู้นำการสนทนา จะเป็นเพศใดก็ได้ ตามกฎของเกม C ไม่เห็น A หรือ B และสามารถสื่อสารกับพวกเขาผ่านข้อความลายลักษณ์อักษรเท่านั้น โดยการถามคำถามกับผู้เล่น A และ B นั้น C พยายามที่จะพิจารณาว่าคนไหนเป็นผู้ชายและคนไหนเป็นผู้หญิง หน้าที่ของผู้เล่น A คือทำให้ผู้เล่น C สับสนเพื่อที่เขาจะได้สรุปผิด ในขณะเดียวกัน หน้าที่ของผู้เล่น B คือการช่วยให้ผู้เล่น C ตัดสินใจได้ถูกต้อง
ในสิ่งที่ S. G. Sterret เรียกว่าการทดสอบเกมเลียนแบบต้นฉบับ ทัวริงเสนอว่าบทบาทของผู้เล่น A นั้นเล่นโดยคอมพิวเตอร์ ดังนั้น หน้าที่ของคอมพิวเตอร์คือการแกล้งทำเป็นผู้หญิงเพื่อสร้างความสับสนให้ผู้เล่น C ความสำเร็จของงานดังกล่าวได้รับการประเมินโดยการเปรียบเทียบผลลัพธ์ของเกมเมื่อผู้เล่น A เป็นคอมพิวเตอร์ และผลลัพธ์เมื่อผู้เล่น A เป็นผู้ชาย ตามคำพูดของทัวริง "ผู้เล่นสนทนาตัดสินใจผิดบ่อยครั้งหลังเกม [กับคอมพิวเตอร์] เช่นเดียวกับหลังเกมระหว่างชายและหญิง" ก็อาจกล่าวได้ว่าคอมพิวเตอร์มีความฉลาด
ตัวเลือกที่สองเสนอโดยทัวริงในบทความเดียวกัน เช่นเดียวกับในการทดสอบครั้งแรก คอมพิวเตอร์จะเล่นบทบาทของผู้เล่น A ความแตกต่างก็คือบทบาทของผู้เล่น B สามารถเล่นได้ทั้งชายหรือหญิง
“เรามาดูคอมพิวเตอร์เครื่องใดเครื่องหนึ่งกันดีกว่า จริงหรือไม่ที่การปรับเปลี่ยนคอมพิวเตอร์เครื่องนี้ให้มีพื้นที่เก็บข้อมูลเพียงพอ เพิ่มความเร็ว และให้โปรแกรมที่เหมาะสม ทำให้สามารถออกแบบคอมพิวเตอร์ดังกล่าวให้เล่นบทบาทของผู้เล่น A ในเกมจำลองสถานการณ์ได้อย่างน่าพอใจ ในขณะที่บทบาทของ ผู้เล่น B ดำเนินการโดยผู้ชาย?” - Turing, 1950, p. 442
ในรูปแบบนี้ ผู้เล่นทั้ง A และ B พยายามชักชวนผู้นำให้ตัดสินใจผิด
แนวคิดหลักของเวอร์ชันนี้คือจุดประสงค์ของการทดสอบทัวริงไม่ใช่เพื่อตอบคำถามว่าเครื่องจักรสามารถหลอกผู้นำได้หรือไม่ แต่เพื่อตอบคำถามว่าเครื่องจักรสามารถเลียนแบบบุคคลได้หรือไม่ แม้ว่าจะมีการถกเถียงกันอยู่บ้างว่าทัวริงมีเจตนาเลือกใช้ตัวเลือกนี้หรือไม่ แต่สเตร์เรตต์เชื่อว่าทัวริงมีเจตนาเลือกใช้ตัวเลือกนี้ จึงรวมตัวเลือกที่สองเข้ากับตัวเลือกที่สามเข้าด้วยกัน ขณะเดียวกันกลุ่มฝ่ายตรงข้ามรวมทั้ง Treyger ไม่คิดเช่นนั้น แต่สิ่งนี้ยังคงนำไปสู่สิ่งที่อาจเรียกว่า "การตีความมาตรฐาน" ในเวอร์ชันนี้ ผู้เล่น A คือคอมพิวเตอร์ ผู้เล่น B คือบุคคลทุกเพศ หน้าที่ของผู้นำเสนอตอนนี้ไม่ใช่เพื่อตัดสินว่าคนไหนเป็นชายและหญิง แต่คนไหนเป็นคอมพิวเตอร์และคนไหนเป็นมนุษย์
ทัวริงในปี 2555
มีการจัดตั้งคณะกรรมการพิเศษขึ้นเพื่อจัดกิจกรรมเพื่อเฉลิมฉลองครบรอบหนึ่งร้อยปีวันเกิดของทัวริงในปี 2555 ซึ่งมีหน้าที่ถ่ายทอดข้อความของทัวริงเกี่ยวกับเครื่องจักรอัจฉริยะ ซึ่งสะท้อนให้เห็นในภาพยนตร์ฮอลลีวูด เช่น Blade Runner สู่สาธารณชนทั่วไป รวมถึงเด็ก ๆ สมาชิกของคณะกรรมการประกอบด้วย: Kevin Warwick, ประธาน, Huma Sha, ผู้ประสานงาน, Ian Bland, Chris Chapman, Marc Allen, Rory Dunlop, Garne ผู้ได้รับรางวัล Loebner Robbie Prize และ Fred Roberts คณะกรรมการได้รับการสนับสนุนจาก Women in Technology และ Daden Ltd.
ปัญญาประดิษฐ์
การทดสอบทัวริงเป็นที่รู้จักสำหรับทุกคนที่สนใจเกี่ยวกับปัญญาประดิษฐ์ คิดค้นขึ้นในปี 1938 โดย Alan Turing ในบทความ “Can a Machine Think?” การทดสอบมีดังนี้ ผู้ทดลองสื่อสารกับคู่สนทนาโดยไม่เห็นเขา (เช่น ผ่านเครือข่ายคอมพิวเตอร์) พิมพ์วลีบนแป้นพิมพ์และรับข้อความตอบกลับบนจอภาพ จากนั้นเขาก็พยายามพิจารณาว่าเขากำลังคุยกับใครอยู่ หากผู้ทดลองทำโปรแกรมคอมพิวเตอร์ผิดพลาดสำหรับบุคคลแสดงว่าผ่านการทดสอบทัวริงและถือว่ามีความฉลาด
บุคคลจะยังคงได้รับเหรียญทอง
โปรแกรมที่มีชื่อเสียงที่สุดซึ่งแสดงให้เห็นถึงความเป็นไปได้ที่แท้จริงในการผ่านการทดสอบนี้ย้อนกลับไปในยุค 60 คือ ELIZA ในตำนาน มันถูกสร้างขึ้นในปี 1966 โดยนักวิทยาศาสตร์ Winograd, Weizenbaum และ Colby ELIZA พบคำสำคัญในวลี (เช่น “แม่”) และออกคำขอเทมเพลต โดยมีการตอบสนองโดยอัตโนมัติต่อคำเหล่านี้ (“บอกฉันเพิ่มเติมเกี่ยวกับแม่ของคุณ”) ต่อจากนั้น Toddy Winograd ซึ่งมีพื้นฐานมาจาก ELIZA ได้สร้าง “นักจิตบำบัด” เวอร์ชันขั้นสูงยิ่งขึ้น การปรากฏตัวของ ELIZA ลงไปในประวัติศาสตร์ของปัญญาประดิษฐ์พร้อมกับเหตุการณ์ต่างๆ เช่น การเปิดตัวหุ่นยนต์อุตสาหกรรมตัวแรกในปี 1962 หรือการเริ่มให้ทุนของกระทรวงกลาโหมเพื่อการพัฒนาด้านการรู้จำภาพและคำพูดในปี 1975-1976
ในปี 1991 มีการจัดทัวร์นาเมนต์ Turing Test ที่เป็นส่วนตัวแต่น่ายกย่องมากเป็นครั้งแรก ซึ่งได้รับการเชิญผู้เขียนโปรแกรมคอมพิวเตอร์ที่เหมาะสม (เรียกว่าบอท) ทัวร์นาเมนต์นี้ก่อตั้งโดย Hugh Loebner (www.loebner.net/Prizef/loebner-prize.html) สำหรับการชนะรางวัลจะได้รับรางวัล 100,000 ดอลลาร์และเหรียญทองหนึ่งรางวัล
จนถึงขณะนี้ยังไม่มีใครได้รับรางวัลใหญ่ อย่างไรก็ตาม ในปี 1994 Loebner ได้ทำการเปลี่ยนแปลงกฎเกณฑ์ครั้งใหญ่ โดยกำหนดให้โปรแกรมต้องสื่อสารกับผู้พิพากษาไม่เพียงแต่ในรูปแบบข้อความเท่านั้น แต่ยังต้องสร้างรูปภาพของบุคคลเสมือนจริงด้วย เธอจะต้องสามารถสังเคราะห์และจดจำข้อมูลคำพูดได้ หลายคนคิดว่าเงื่อนไขเหล่านี้ยากมาก และจนถึงขณะนี้ยังไม่มีผู้แข่งขันเพื่อชิงรางวัลใหญ่ปรากฏภายใต้กฎใหม่ และสำหรับการชนะในโหมด "ข้อความ" แบบเก่า ตอนนี้พวกเขาได้รับเงินรางวัล 25,000 ดอลลาร์และเหรียญเงิน ควรสังเกตว่าความน่าจะเป็นของข้อผิดพลาดส่วนตัวของผู้ตัดสินเมื่อสื่อสารกับโปรแกรมตามกฎเก่านั้นค่อนข้างสูง นอกจากนี้ บอทยังได้รับการปรับปรุงอย่างรวดเร็ว และแน่นอนว่าเราจะรอผู้ชนะการทดสอบทัวริงในปีต่อๆ ไปอย่างแน่นอน
การตัดสินการแข่งขันมีความเข้มงวดมาก ผู้เชี่ยวชาญเตรียมตัวสำหรับการแข่งขันล่วงหน้าและเลือกคำถามที่ยุ่งยากมากเพื่อทำความเข้าใจว่าพวกเขากำลังสื่อสารกับใคร การสนทนาของพวกเขากับโปรแกรมคล้ายกับการสอบปากคำของผู้สืบสวน ผู้ตัดสินชอบที่จะถามคำถามบางข้อซ้ำหลังจากผ่านไประยะหนึ่ง เนื่องจากบอทที่อ่อนแอไม่รู้ว่าจะติดตามประวัติของบทสนทนาอย่างไร และอาจถูกจับได้ว่าให้คำตอบที่ซ้ำซากจำเจ
แต่นักพัฒนาไม่ต้องเสียเวลาในการตั้งค่าค่าใช้จ่ายเสมือนจริงในลักษณะที่เป็นการตอบคำถามที่เร้าใจเช่น "คุณเป็นเครื่องจักรหรือคน" รายการตอบอย่างมั่นใจมาก:“ แน่นอนคน ๆ หนึ่ง!”
เมื่อวันที่ 8 พฤศจิกายน พ.ศ. 2534 ที่พิพิธภัณฑ์คอมพิวเตอร์บอสตัน มีแปดโปรแกรมที่พบปะกับผู้เชี่ยวชาญแบบตัวต่อตัว ผลลัพธ์ที่ได้นั้นน่าทึ่งมาก ผู้พิพากษาห้าในสิบคนตัดสินใจว่ามีบุคคลที่อยู่เบื้องหลังนามแฝง Whimsical Conversation อันที่จริง มันเป็นโปรแกรมนักบำบัดที่ทำงานบน IBM PC 386 และสร้างขึ้นในปี 1986 โดยอิงจาก ELIZA ในตำนานโดย Joseph Weintraub ผู้เชี่ยวชาญด้านจิตวิทยา อย่างไรก็ตาม ผลลัพธ์นี้ส่วนใหญ่เนื่องมาจากความสงสัยและอคติของผู้เชี่ยวชาญที่เชื่อว่าโปรแกรมต่างๆ สื่อสารในระดับดั้งเดิมมากกว่าในความเป็นจริง ต่อจากนั้น ผู้ตัดสินเริ่มคุ้นเคยกับรูปแบบการสื่อสารของคอมพิวเตอร์ และบอทก็ไม่สามารถบรรลุผลสำเร็จดังกล่าวได้ตั้งแต่นั้นมา
เดิมทีนักบำบัดประกอบด้วยเจ็ดโมดูลที่เขียนด้วย C, Turbo-Prolog และ QuickBasic ต่อมาได้เสริมด้วยระบบสังเคราะห์เสียงพูดและฐานความรู้ โปรแกรมใช้พจนานุกรม 70,000 คำและจดจำทุกสิ่งที่เล่าให้ฟัง โดยใช้ข้อมูลนี้ในการสนทนาครั้งต่อไปและปรับให้เข้ากับความสนใจของคู่สนทนาคนใดคนหนึ่ง นักบำบัดได้รับรางวัล Loebner Prize ในปี 1992, 1993 และ 1995 จากนั้นได้รับการปรับปรุงด้วยโมดูลพิเศษที่สามารถรองรับการสนทนาในหัวข้อ "ชายและหญิง" และ "เสรีนิยมและอนุรักษ์นิยม"
นี่คือตัวอย่างจากบทสนทนาที่ชนะเลิศรายการหนึ่งของเธอ:
ผู้พิพากษา: คุณคิดว่าทหารอเมริกันควรไปบอสเนียหรือไม่ เพราะเหตุใด
นักบำบัด: ฉันคิดว่าสิ่งที่คลินตันทำในการส่งเจ้าหน้าที่รักษาสันติภาพ 20,000 คนไปยังบอสเนียจะรับประกันความสงบสุขที่ยั่งยืน
ผู้พิพากษา: คุณคิดว่าคนอเมริกันส่วนใหญ่รู้สึกแบบเดียวกับคุณหรือไม่
นักบำบัด: คุณหมายถึงอะไรเมื่อคุณบอกว่าคุณคิดว่าทหารอเมริกันควรไปบอสเนีย? เคยมีใครบอกคุณไหมว่าคุณคิดมากเกินไป? โอ้ ฉันคิดว่าคนอเมริกันส่วนใหญ่รู้สึกแบบเดียวกับฉันเหรอ?
ในปี 1994 การแข่งขันนี้ชนะโดย Thomas Wylen แพทย์สาขาจิตวิทยาเชิงทดลองที่เชี่ยวชาญด้านการศึกษาภาษาธรรมชาติ โปรแกรม TIPS ของเขาได้รับการฝึกอบรมให้จัดเก็บและวิเคราะห์วลี (มีฐานข้อมูลหลายพันวลี) และค้นหารูปแบบคำศัพท์
ในปี 1996 เหรียญทองแดงตกเป็นของ Jason Hutchence และบอท SEPO ของเขา ซึ่งสื่อสารบางอย่างในลักษณะนี้:
ผู้ตัดสิน: ฉันคิดว่า ฉันทำวิจัย. ฉันเขียน ฉันรัก. ฉันอยู่.
สคร.: สงสัยว่าบางครั้งคิดหรือเปล่า! ฉันรู้สึกเหมือนเป็นผู้ตัดสินที่นี่!
ในปี 1997 David Levy กลายเป็นแชมป์ด้วยบอท Converse ในปี 1998 และ 1999 Robbie Garnett ได้รับชัยชนะ โดยเชื่อว่าการผ่านการทดสอบทัวริงไม่จำเป็นต้องใช้สติปัญญาที่แท้จริง เป็นที่น่าสนใจที่ผู้เขียนเกือบทุกคนกล่าวถึงแนวทางการเรียนรู้ทางวิทยาศาสตร์ (โครงข่ายประสาทเทียม อัลกอริธึมทางพันธุกรรม) ใช้วิธีการแก้ปัญหาที่ค่อนข้างง่ายในการตัดสินใจ
Garnett เข้าร่วมการแข่งขันโปรแกรมพฤติกรรมการคำนวณโดยใช้หลักการตอบสนองต่อสิ่งเร้าที่คล้ายคลึงกับ TIPS และ ELIZA มีเพียงบอทของเขาเท่านั้นที่กำลังมองหาไม่ใช่เพียงคำเดียว แต่มีคำหลักถึงสามคำในวลี ในเวลาเดียวกัน เมื่อตระหนักว่าโปรแกรมต้องการบางสิ่งที่มากกว่าการตอบคำถามที่ซ้ำซากจำเจ เขาได้สร้างอัลกอริธึมการเรียนรู้เพิ่มเติมจำนวนหนึ่งที่สร้างภาพลวงตาของการสื่อสารกับบุคคลที่สมบูรณ์ยิ่งขึ้น
ในระหว่างการพัฒนา Behaviorist ปัญหาทางเทคนิคเกิดขึ้นที่เกี่ยวข้องกับความซับซ้อนของการดำเนินการค้นหาความรู้ในฐานข้อมูลที่มีขนาดใหญ่ในขณะนั้น ซึ่งนำไปสู่ความล่าช้าในการสื่อสารอย่างเห็นได้ชัดซึ่งทรยศต่อคู่สนทนาทางคอมพิวเตอร์ทันที ดังนั้น Garnet จึงรวมบอทสองตัวที่เปิดเผยต่อสาธารณะ - Albert ซึ่งเขียนด้วย C ++ และหนึ่งในเวอร์ชัน Pascal ของ ELIZA และนำไปใช้ในสภาพแวดล้อมการพัฒนา Visual DataFlex ซึ่งอนุญาตให้ใช้อัลกอริธึมการสืบค้นฐานข้อมูลมาตรฐาน
ในปี 2000 และ 2001 รางวัลรองตกเป็นของโครงการ ALICE ของ Richard Wallace วันนี้ บนพื้นฐานของ ALICE ได้มีการจัดตั้งมูลนิธิ ALICE AI (http://alice.sunlitsurf.com/) ซึ่งมีส่วนร่วมในกิจกรรมการกำหนดมาตรฐานสำหรับการสร้างบอท โดยเฉพาะอย่างยิ่ง ALICE ได้รับการเสริมด้วยเครื่องมือสนับสนุนฐานข้อมูลในรูปแบบ AIML (ภาษามาร์กอัปปัญญาประดิษฐ์) ซึ่งเป็นชุดย่อยของ XML ที่มุ่งเป้าไปที่การนำเสนอวลีสำคัญและคำตอบอย่างเป็นทางการ ตอนนี้ใครก็ตามที่ไม่คุ้นเคยกับการเขียนโปรแกรมสามารถใช้ ALICE เวอร์ชันพื้นฐานและเติมฐานความรู้ของตนเองในภาษาใดก็ได้โดยใช้โปรแกรมแก้ไขทั่วไป
น่าเสียดาย ฤดูร้อนนี้ ตามที่ Wired รายงาน มิสเตอร์วอลเลซเริ่มมีปัญหาทางจิต (เขาข่มขู่เพื่อนศาสตราจารย์คนหนึ่งของเขาด้วยการทำร้ายร่างกาย โดยอ้างว่าการคอร์รัปชันแพร่ระบาดในมหาวิทยาลัยในอเมริกาหลายแห่ง และอาจารย์ผู้สอนกำลังวางแผนการทุจริตครั้งใหญ่ แผนขนาดต่อต้าน Wallace CONSPIRACY) นักวิทยาศาสตร์กำลังอยู่ระหว่างการสอบสวน
หนึ่งในผู้เข้าแข่งขันที่มีแนวโน้มมากที่สุดสำหรับชัยชนะในปีนี้ (การแข่งขันจะจัดขึ้นในเดือนตุลาคม) คือ Joshua Smith ผู้เขียนโปรแกรม Anna (ส่วนขยาย AIML ของ ALICE ซึ่งหาได้ฟรีบนเว็บไซต์ http://annabot.sourceforge.net/ ). นายโจชัวตั้งข้อสังเกตว่าตั้งแต่แรกเริ่มเขาสร้างบอทที่แกล้งทำเป็นมนุษย์ในระหว่างการสื่อสารไม่เหมือนกับเพื่อนร่วมงานของเขา แอนนาคิดว่าตัวเองเป็นสิ่งมีชีวิต มีคุณสมบัติเฉพาะตัว และค่อนข้างมีชีวิตชีวาในการสนทนา
มีการพัฒนาของรัสเซียที่คล้ายกัน - บอทที่สามารถสื่อสารเป็นภาษารัสเซียได้หรือไม่? บรรณาธิการของ PC Week/RE พร้อมที่จะจัดการแข่งขันที่รัสเซียเพื่อผ่านการทดสอบทัวริง เขียนถึงผู้เขียนได้ที่: [ป้องกันอีเมล].
โปรแกรมคอมพิวเตอร์ทำให้ผู้คนเชื่อว่าเป็นเด็กอายุ 13 ปี จึงกลายเป็นโปรแกรมแรกที่ผ่านการทดสอบทัวริง
ทัวริงสร้างการทดสอบเพื่อตรวจสอบว่าเครื่องจักรสามารถคิดได้หรือไม่
การทดสอบดั้งเดิมมีดังนี้ บุคคลหนึ่งสื่อสารกับคอมพิวเตอร์เครื่องหนึ่งและอีกคนหนึ่งเป็นเวลา 5 นาที . เมื่อได้รับคำตอบสำหรับคำถามบุคคลนั้นจะต้องพิจารณาว่าเขากำลังพูดคุยกับบุคคลหรือโปรแกรมคอมพิวเตอร์ จุดประสงค์ของโปรแกรมคอมพิวเตอร์คือการทำให้บุคคลเข้าใจผิดเพื่อให้เขาตัดสินใจเลือกผิด
ผู้เข้าทดสอบไม่สามารถเห็นหน้ากัน หากผู้พิพากษาไม่สามารถบอกได้อย่างแน่นอนว่าคู่สนทนาคนใดเป็นมนุษย์ก็ถือว่าคอมพิวเตอร์ผ่านการทดสอบแล้ว การสนทนาจะดำเนินการในโหมดข้อความเท่านั้น เช่น การใช้แป้นพิมพ์และหน้าจอ (คอมพิวเตอร์รอง) นี่เป็นสิ่งจำเป็นในการทดสอบความฉลาดของเครื่อง ไม่ใช่ความสามารถในการจดจำคำพูด การโต้ตอบจะทำในช่วงเวลาที่มีการควบคุมเพื่อให้ผู้พิพากษาไม่สามารถสรุปผลตามความเร็วในการตอบสนองได้ (คอมพิวเตอร์ตอบสนองเร็วกว่ามนุษย์ในปัจจุบัน)
โปรแกรมคอมพิวเตอร์ต้องสามารถหลอกคนได้ 30 เปอร์เซ็นต์จึงจะผ่านการทดสอบ
โปรแกรมคอมพิวเตอร์ “Evgeniy Gustman” สร้างขึ้นโดยทีมนักพัฒนาจากรัสเซีย ผ่านการทดสอบที่ Royal Society ในลอนดอน เธอทำให้ผู้พิพากษา 33 เปอร์เซ็นต์เชื่อว่าเธอเป็นเด็กชายอายุ 13 ปีจากโอเดสซา นักวิทยาศาสตร์จากมหาวิทยาลัยเรดดิ้งผู้จัดการทดสอบกล่าว
“แนวคิดหลักของเราคือเขาสามารถอ้างว่าเขาไม่รู้อะไรบางอย่าง เมื่ออายุเท่านี้ เขาอาจจะไม่รู้อะไรบางอย่างจริงๆ” Vladimir Veselov หนึ่งในผู้สร้างโครงการกล่าว “เราใช้เวลามากมายในการพัฒนา เป็นตัวละครที่น่าเชื่อถือ”
ความสำเร็จของโครงการนี้มีแนวโน้มที่จะทำให้เกิดความกังวลเกี่ยวกับอนาคตของการประมวลผล กล่าวโดย Kevin Warwick ศาสตราจารย์จาก University of Reading และรองอธิการบดีฝ่ายวิจัยของมหาวิทยาลัยโคเวนทรี
“ในสาขาปัญญาประดิษฐ์ ไม่มีเหตุการณ์สำคัญใดที่โดดเด่นหรือเป็นที่ถกเถียงมากไปกว่าการทดสอบทัวริง เมื่อคอมพิวเตอร์โน้มน้าวผู้ตัดสินมากพอว่าไม่ใช่เครื่องจักร แต่เป็นบุคคล” เขากล่าว “การมีคอมพิวเตอร์ที่สามารถหลอกคนให้คิดว่าบางคนหรือบางสิ่งบางอย่างเป็นมนุษย์ถือเป็นสัญญาณอันตรายของอาชญากรรมในโลกไซเบอร์ การทดสอบทัวริงเป็นเครื่องมือที่สำคัญมากในการต่อสู้กับภัยคุกคามนี้ สิ่งสำคัญคือต้องเข้าใจอย่างถ่องแท้ว่าการสื่อสารแบบเรียลไทม์บนอินเทอร์เน็ตสามารถชักนำบุคคลให้เชื่อว่าบางสิ่งเป็นความจริงทั้งๆ ที่มันไม่จริงได้อย่างไร”
ห้าโปรแกรมมีส่วนร่วมในการทดสอบซึ่งจัดขึ้นที่ Royal Society เมื่อวันเสาร์ คณะกรรมการ ได้แก่ นักแสดง โรเบิร์ต ลีเวลลิน ซึ่งรับบทเป็นหุ่นยนต์ ไครเทน ในภาพยนตร์ตลกแนววิทยาศาสตร์ของ BBC เรื่อง Red Dwarf และลอร์ด ชาร์กี้ ซึ่งเป็นผู้นำการรณรงค์เพื่อปลดอลัน ทัวริง เมื่อปีที่แล้ว
อลัน ทัวริง นำเสนอการทดสอบของเขาในปี 1950 ในบทความ "คอมพิวเตอร์และจิตใจ" ในนั้น เขาระบุว่าเนื่องจาก "การคิด" เป็นเรื่องยากที่จะนิยาม สิ่งที่สำคัญคือคอมพิวเตอร์สามารถเลียนแบบมนุษย์จริงๆ ได้หรือไม่ ตั้งแต่นั้นเป็นต้นมา ปัญญาประดิษฐ์ก็ได้กลายเป็นหนึ่งในองค์ประกอบสำคัญของปรัชญาปัญญาประดิษฐ์
ความสำเร็จเกิดขึ้นในวันครบรอบ 60 ปีการเสียชีวิตของทัวริง ในวันเสาร์ที่ 06/07/2557
ที่มา: ดิ อินดิเพนเดนท์
ป.ล. คุณสามารถตรวจสอบด้วยตัวเองว่าโปรแกรมนี้ฉลาดแค่ไหนบนเว็บไซต์ของห้องปฏิบัติการปัญญาประดิษฐ์ที่มหาวิทยาลัยพรินซ์ตัน โดยส่วนตัวแล้วฉันไม่ได้รับความรู้สึกว่าฉันกำลังพูดคุยกับบุคคลใดแม้แต่เด็ก สำหรับฉันดูเหมือนว่าการทดสอบทัวริงยังไม่ผ่านทั้งหมด
คุณให้คะแนนสิ่งพิมพ์นี้อย่างไร?