ผู้ได้รับรางวัล Fields Medal Michael Freedman เผยแก่นแท้ของคณิตศาสตร์: การบีบอัดคือทุกสิ่ง มุมมองใหม่ของความร่วมมือระหว่าง AI กับคณิตศาสตร์

4 hours ago • วิศวกรรมโมเดลขนาดใหญ่ • 15 views

เมื่อพูดถึงคณิตศาสตร์ เรามักคิดโดยสัญชาตญาณว่ามันเป็นระบบตรรกะที่เข้มงวด แม่นยำ และสมบูรณ์แบบไร้ข้อกังขา แต่ในมุมมองของ ไมเคิล ฟรีดแมน (Michael Freedman) ผู้ได้รับรางวัลฟิลด์ส เมทัล คณิตศาสตร์ที่มนุษย์สร้างขึ้นและให้ความสำคัญจริงๆ นั้น โดยพื้นฐานแล้วเป็นสิ่งที่ “อ่อนนุ่มและปรับเปลี่ยนได้”

ไมเคิล ฟรีดแมน เป็นหนึ่งในนักคณิตศาสตร์ที่มีอิทธิพลมากที่สุดในยุคปัจจุบัน เขาได้รับรางวัลฟิลด์สเมทัลจากการแก้ปัญหาการคาดการณ์ปวงกาเรในสี่มิติ ซึ่งถือเป็นความสำเร็จสำคัญในสาขาทอพอโลยี หลังจากนั้นงานวิจัยของเขาไม่ได้หยุดอยู่แค่คณิตศาสตร์บริสุทธิ์ แต่ได้ขยายไปสู่แอปพลิเคชันแนวหน้า โดยก่อตั้ง Microsoft StationQ และเป็นผู้ผลักดันสำคัญด้านการคำนวณควอนตัมทอพอโลยี ในช่วงไม่กี่ปีมานี้ เขายังขยายความสนใจวิจัยไปสู่ปัญญาประดิษฐ์ โดยพยายามทำความเข้าใจโครงสร้างและกลไกการสร้างความรู้ของมนุษย์ผ่านมุมมองทางคณิตศาสตร์

ผู้ได้รับรางวัล Fields Medal Michael Freedman เผยแก่นแท้ของคณิตศาสตร์: การบีบอัดคือทุกสิ่ง มุมมองใหม่ของความร่วมมือระหว่าง AI กับคณิตศาสตร์

ลองจินตนาการถึงข้อความหนึ่งที่เขียนด้วยโทเค็นเพียง 600 ตัว แต่เมื่อขยายออกมาแล้วมีความยาวถึง 10 ยกกำลัง 104 — นี่คือตัวเลขมหาศาลที่ยิ่งใหญ่กว่ากูกอล (googol) มาก นี่ไม่ใช่นิยายวิทยาศาสตร์ แต่เป็นปรากฏการณ์จริงที่ฟรีดแมนและทีมของเขาค้นพบจากการวิเคราะห์คลังคณิตศาสตร์ที่เป็นทางการสมัยใหม่อย่าง Mathlib

ความสามารถในการย่อห่วงโซ่การให้เหตุผลอันมหาศาลให้เป็นแนวคิดที่กระชับนี้ เผยให้เห็นความลับที่นักคณิตศาสตร์ใช้มาเป็นเวลาสามพันปี แต่แทบไม่เคยพูดถึงออกมาชัดเจน นั่นคือ แก่นแท้ของคณิตศาสตร์อาจไม่ใช่การพิสูจน์ แต่คือ การบีบอัด

เมื่อไม่นานมานี้ ฟรีดแมนได้เสนอคำประกาศนี้โดยตรงในบทความวิจัยของเขา: “การบีบอัด คือทั้งหมดที่คุณต้องการ” (Compression is all you need)

ในการสัมภาษณ์ครั้งล่าสุด ฟรีดแมนได้อธิบายมุมมองนี้และพูดถึงช่องว่างระหว่างสัญชาตญาณทางคณิตศาสตร์ของมนุษย์กับตรรกะของเครื่อง เขาคิดว่าการวิวัฒนาการของคณิตศาสตร์มนุษย์เป็นเวลาหลายพันปีนั้น โดยพื้นฐานแล้วคือประวัติศาสตร์ของการสร้าง “มาโคร” และการสร้างชั้นเชิงนามธรรมอย่างต่อเนื่อง นับตั้งแต่ระบบเลขฐานค่าเมื่อสามพันปีก่อน ไปจนถึงสมการเชิงอนุพันธ์ที่ซับซ้อนในยุคปัจจุบัน อารยธรรมมนุษย์ได้ทำการทดลอง “การบีบอัดข้อมูล” มาโดยตลอด

มนุษย์ไม่ได้ทำคณิตศาสตร์โดยการแจกแจงเส้นทางการให้เหตุผลทั้งหมด แต่เป็นการค้นหาโครงสร้างที่สามารถบีบอัดได้อย่างต่อเนื่องในพื้นที่ความเป็นไปได้ที่เกือบจะไร้ขีดจำกัด ในทางตรงกันข้าม ปัญญาประดิษฐ์ในปัจจุบันมีแนวโน้มที่จะ “แจกแจง” มากกว่า ดังนั้น ในช่วงสำคัญของการพัฒนา AI การทำความเข้าใจกลไก “การบีบอัด” นี้ อาจเป็นจุดเริ่มต้นของการทำงานร่วมกันอย่างแท้จริงระหว่างมนุษย์กับ AI ในสาขาคณิตศาสตร์

ต่อไปนี้คือเนื้อหาหลักของการสัมภาษณ์ที่ได้รับการปรับปรุงแล้ว:

ผู้สัมภาษณ์: โดยทั่วไปเราคิดว่าคณิตศาสตร์เป็นระบบตรรกะที่เข้มงวดและสมบูรณ์แบบ แต่การวิจัยของคุณดูเหมือนจะชี้ให้เห็นว่าคณิตศาสตร์ที่มนุษย์ใช้จริงๆ นั้นไม่เป็นเช่นนั้น คุณสามารถอธิบายเริ่มจากแนวคิดเรื่อง “การบีบอัด” ได้ไหม?

ไมเคิล ฟรีดแมน: แน่นอน ในบทความของเรามีมุกตลกเล็กๆ ว่า การบีบอัดถูกคิดค้นขึ้นมาแล้วเมื่อสามพันปีก่อน นี่อาจเป็นทฤษฎีบทที่ยิ่งใหญ่ข้อแรกของคณิตศาสตร์ — นั่นคือ ระบบเลขฐานค่า

ตัวอย่างเช่น “10” สามารถแสดงด้วย “1” ที่วางในตำแหน่งเฉพาะ “100” ก็เช่นเดียวกัน โดยการวาง “1” ในตำแหน่งที่ต่างกัน เราสามารถแสดงตัวเลขที่ใหญ่มากด้วยสัญลักษณ์เพียงเล็กน้อย วิธีการแสดงนี้ทำให้การแสดงจำนวนเต็มเติบโตในอัตราแบบลอการิทึม แต่สามารถครอบคลุมจำนวนตัวเลขในอัตราแบบเอกซ์โพเนนเชียลด้วยสัญลักษณ์ที่มีจำกัด นี่เป็นการบีบอัดที่มีประสิทธิภาพอย่างยิ่ง มันเชื่อมโยงกับแนวคิดบางอย่างในฟิสิกส์สมัยใหม่ (เช่น สถานะของโซ่สปิน) แต่การบีบอัดไม่ได้จำกัดอยู่แค่การแสดงตัวเลข มันแทรกซึมอยู่ในระบบคณิตศาสตร์ทั้งหมด

ผู้สัมภาษณ์: สามารถยกตัวอย่างที่เจาะจงมากขึ้นได้ไหม?

ไมเคิล ฟรีดแมน: ตอนที่ผมเรียนวิชาสมการเชิงอนุพันธ์ครั้งแรกในมหาวิทยาลัย อาจารย์เขียนสัญลักษณ์ Ω ขนาดใหญ่บนกระดานดำและบอกว่ามันคือ “มัดของยอดของภาคตัดของมัดเวกเตอร์” (sheaf of germs of sections of a vector bundle) ตอนนั้นผมไม่รู้ด้วยซ้ำว่ามัดเวกเตอร์คืออะไร ต่อมาผมจึงตระหนักว่า เพื่อจะเข้าใจประโยคนี้ คุณต้องเข้าใจแนวคิดหลายชั้นที่ซ้อนกันอยู่เบื้องหลัง: มัดเวกเตอร์ ภาคตัด มัด ยอด และความสัมพันธ์การส่งระหว่างสิ่งเหล่านี้ หากขุดลึกลงไปอีก ยังเกี่ยวข้องกับโครงสร้างพื้นฐานเช่น จำนวนธรรมชาติ จำนวนเต็ม จำนวนตรรกยะ จำนวนจริง ปริภูมิเวกเตอร์ แมนิโฟลด์

นั่นคือ เมื่อนักคณิตศาสตร์คิด พวกเขากำลังยืนอยู่บนชั้นเชิงนามธรรมกว่า 10 ชั้น นี่คือเหตุผลที่สมการเชิงอนุพันธ์ “ดูเหมือนไม่ยาก” เพราะข้อมูลมหาศาลถูกบีบอัดไว้ในแนวคิดระดับสูงเหล่านี้ นี่คือพลังของ “การบีบอัด”: ข้อมูลจำนวนมากถูกซ่อนอยู่ในแนวคิดระดับสูง

และถ้าคุณพยายามแสดงสิ่งนี้ด้วยภาษาที่เป็นทางการเช่น Lean คุณต้องขยายการบีบอัดทั้งหมดนี้ออกมา ดังนั้นจึงอาจกล่าวได้ว่า: การบีบอัดคือหัวใจของคณิตศาสตร์ และมันมีมานานสามพันปีแล้ว

ในบทความวิจัย เราได้พยายามวัดสัญชาตญาณนี้เชิงปริมาณ เราใช้คลังคณิตศาสตร์ของ Lean (Mathlib ซึ่งมีประมาณ 500,000 บรรทัด) เป็นแบบจำลองประมาณของ “คณิตศาสตร์มนุษย์” และทำการวิเคราะห์ทางสถิติเกี่ยวกับโครงสร้างของมัน: สังเกตว่าทฤษฎีบทเรียกใช้บทตั้งอื่นอย่างไร นิยามประกอบและซ้อนกันอย่างไร เราเห็นโครงสร้างการแบ่งชั้นและการบีบอัดที่ชัดเจน ซึ่งทำให้สามารถเขียนข้อความใน Mathlib ในระดับสูง (“สถานะห่อหุ้ม”) ได้ จากนั้นจึงสามารถขยายออกมาเป็นศัพท์พื้นฐานของ Lean (“สถานะคลี่ออก”)

เราได้ศึกษาความสัมพันธ์ระหว่างทั้งสอง และพบว่าโครงสร้างลำดับชั้นนี้สามารถเปลี่ยนข้อความทางคณิตศาสตร์ที่ค่อนข้างง่าย ให้กลายเป็นโครงสร้างต้นไม้ที่ใหญ่มากซึ่งมีต้นกำเนิดจากศัพท์พื้นฐานของ Lean

ผู้สัมภาษณ์: ผมจำได้ว่ามันสามารถไปถึงตัวเลขที่ใหญ่มาก: 10 ยกกำลัง 104 ใช่ไหม? นี่หมายความว่าคุณต้องการเน้นว่านี่คือแก่นแท้ของคณิตศาสตร์หรือไม่?

ไมเคิล ฟรีดแมน: ใช่ เราเห็นว่าสิ่งที่อยู่ในคลังนี้เป็นตัวอย่างที่ดีของพฤติกรรมทางคณิตศาสตร์ของมนุษย์ — แม้ว่าการกระจายตัวในสาขาคณิตศาสตร์ต่างๆ จะไม่สมบูรณ์แบบ (เช่น มีเนื้อหาเกี่ยวกับทฤษฎีจำนวนและเรขาคณิตเชิงพีชคณิตมากกว่าการวิเคราะห์หรือทอพอโลยี) มันไม่ใช่สำเนาที่สมบูรณ์แบบของความคิดทางคณิตศาสตร์ของมนุษย์ แต่มันแตกต่างอย่างสิ้นเชิงจาก “การให้เหตุผลเชิงตรรกะทุกวิธีที่เป็นไปได้จากชุดสัจพจน์หนึ่ง” ซึ่งจะนำไปสู่ “คณิตศาสตร์ที่ยุ่งเหยิง”

ไม่ว่าจะทำให้เป็นทางการอย่างไร การค้นพบโครงสร้างจะเติบโตในอัตราแบบเอกซ์โพเนนเชียลสองชั้น ผลลัพธ์สุดท้ายก็เป็นอย่างที่คุณพูด ข้อความ “คลี่ออก” ที่ยาวที่สุดที่เราพบในคลัง Lean มีขนาดประมาณ 10 ยกกำลัง 104 ซึ่งใหญ่กว่ากูกอล (10 ยกกำลัง 100) มาก และข้อความ “ห่อหุ้ม” ที่สอดคล้องกันมีเพียง 600 โทเค็น นี่แสดงให้เห็นการขยายตัวที่น่าทึ่ง แต่ในทางกลับกันก็เผยให้เห็น อัตราส่วนการบีบอัดที่ยิ่งใหญ่ ที่ได้จากการใช้แนวคิดเชิงนามธรรม

สิ่งที่ผมอยากจะบอกคือ นักคณิตศาสตร์และเอเจนต์อัจฉริยะ (AI) ของพวกเขาอยู่ในเรือลำเดียวกันจริงๆ แต่เมื่อคุณเห็นตัวเลขอย่างกูกอล แม้แต่เครื่องจักรที่เร็วกว่าเราหนึ่งล้านเท่า ตัวคูณนั้นก็ไม่มีนัยสำคัญในระดับของกูกอล

ดังนั้น ปัญหาที่แท้จริงไม่ใช่มนุษย์และเครื่องจักรจะสำรวจอะไร แต่คือ ส่วนใดในพื้นที่การให้เหตุผลที่เป็นรูปธรรมอันกว้างใหญ่ที่สามารถบีบอัดให้อยู่ในรูปแบบที่ทั้งเราและเอเจนต์อัจฉริยะเข้าใจได้ (ผมเรียกสิ่งนี้ว่า “คณิตศาสตร์ที่เป็นทางการ”) ผมเชื่อว่าคณิตศาสตร์ของมนุษย์ (ซึ่งในที่นี้ผมถือว่าเอเจนต์อัจฉริยะของเราเป็นส่วนหนึ่งของ “มนุษย์”) เป็นเช่นนั้น

ผู้สัมภาษณ์: ในโครงสร้างเหล่านี้ที่คุณวิเคราะห์ มีการค้นพบว่ามีสมการหรือกระบวนการบางอย่างที่ไม่มี “ตัวหารร่วม” เหมือนกับสิ่งอื่นหรือไม่? ถ้าเป็นเช่นนั้น จะตัดสินใจได้อย่างไรว่าอะไรคือ “พื้นฐานที่สุด”? หรือจะรู้ได้อย่างไรว่าตนเอง “ถึงก้นบึ้ง” แล้ว?

ไมเคิล ฟรีดแมน: สำหรับ Lean มันง่ายที่จะรู้ว่าเมื่อไร “ถึงก้นบึ้ง” เพราะโครงสร้างคลังของมันถูกออกแบบมาเช่นนั้น

โดยพื้นฐานแล้ว มีบางพจน์ดั้งเดิมที่คุณสามารถใช้สร้างข้อความที่ซับซ้อนมากขึ้นได้ “ความยาวหลังการขยาย” นี้บางครั้งเรียกว่าต้นไม้การแทนที่ คุณดูที่ลูกของแต่ละข้อความ (มันสร้างจากอะไร) จากนั้นดูที่ลูกของลูกเหล่านั้น ก่อตัวเป็นต้นไม้ที่ลึกลงเรื่อยๆ จนกระทั่งมันสิ้นสุดที่พจน์ดั้งเดิมของ Lean หลังจากนั้น เราได้กำหนดน้ำหนักให้กับโหนดทั้งหมด (พจน์ดั้งเดิมมีน้ำหนัก 1 โหนดระดับบนมีน้ำหนักสะสมจากน้ำหนักของโหนดระดับล่างที่มันเรียกใช้) เมื่อรวมน้ำหนักที่ด้านบนสุดของต้นไม้ คุณจะได้ตัวเลขมหาศาลของข้อความที่ขยายแล้ว

และแก่นแท้ของการบีบอัดคือ มนุษย์ออกแบบและใช้ Lean เพื่อแสดงภาษาที่ทำให้สามารถเขียนโครงสร้างขนาดกูกอลนี้ด้วยโทเค็นประมาณ 600 ตัว

วิธีการที่เราใช้ในบทความวิจัยได้รับแรงบันดาลใจจากคณิตศาสตร์ฟิสิกส์ ในฟิสิกส์ เมื่อเราพยายามสร้างแบบจำลองบางส่วนของธรรมชาติเพื่อวิเคราะห์ เราสร้าง “แบบจำลองของเล่น” มันไม่ได้พยายามจับภาพความจริงทั้งหมด แต่จับโครงสร้างหลัก โดยเลือกการฉายภาพหยาบๆ ของความเป็นจริงโดยเจตนา โดยหวังว่าจะสามารถวิเคราะห์มันได้อย่างสมบูรณ์ เพื่อชี้นำสัญชาตญาณสำหรับปัญหาที่ซับซ้อนมากขึ้น ไฟฟ้าแม่เหล็ก กลศาสตร์ควอนตัม ทฤษฎีตัวนำยวดยิ่ง BCS ล้วนเป็นเช่นนั้น

ในบทความวิจัย เราใช้ “โมโนอยด์” เพื่อสร้างแบบจำลองและวิเคราะห์โครงสร้างทางคณิตศาสตร์ในลักษณะเดียวกัน

โมโนอยด์คล้ายกับกรุป แต่ไม่จำเป็นต้องมีอินเวอร์ส จำนวนธรรมชาติและการบวกของมันก่อตัวเป็นโมโนอยด์อย่างง่าย ในโมโนอยด์ เราสามารถแนะนำ “มาโคร” ซึ่งคือ “ความคิดใหม่” ที่เป็นตัวแทนของแนวคิดเชิงนามธรรมใหม่ ซึ่งช่วยให้เราสามารถแสดงข้อมูลได้อย่างมีประสิทธิภาพมากขึ้น

ตัวอย่างเช่น “10 ยกกำลัง” เป็นมาโครหนึ่งที่สามารถบีบอัดและแสดงจำนวนเต็มได้อย่างมีประสิทธิภาพ เมื่อมีมาโครในโมโนอยด์ เราสามารถอนุมานโครงสร้างลำดับชั้นและวัดระดับการบีบอัดได้

การศึกษาชี้ให้เห็นว่ายิ่งมีมาโครมาก การบีบอัดก็ยิ่งมากขึ้น ยิ่งมีมาโครน้อย ความสามารถในการบีบอัดก็ยิ่งอ่อนลง และความสามารถในการแสดงออกก็มีจำกัดมากขึ้น

ในระบบคณิตศาสตร์ที่เป็นทางการ (เช่น คลัง Lean) เรายังไม่รู้ว่า “มาโคร” เหล่านี้คืออะไร มันเหมือนกับการค้นหาเอกสารประกอบคณิตศาสตร์ — ยิ่งเราเข้าใจเรื่องนี้มากเท่าไร มนุษย์และเอเจนต์อัจฉริยะก็จะสำรวจคณิตศาสตร์ได้ราบรื่นมากขึ้นเท่านั้น กุญแจสำคัญคือการเรียนรู้กลไกที่มีอยู่แล้วในคณิตศาสตร์: หลักการคืออะไร? ข้อสรุปถูกจัดระเบียบอย่างไร?

ความท้าทายหลักในปัจจุบันคือการแก้ “ปัญหาผกผัน”: หาว่า “มาโคร” ที่สอดคล้องกันทางด้านคณิตศาสตร์คืออะไร

ผู้สัมภาษณ์: ในการให้เหตุผลทางคณิตศาสตร์ เครื่องจักรมักต้องสำรวจความเป็นไปได้ในอัตราแบบเอกซ์โพเนนเชียล ในขณะที่มนุษย์สามารถพุ่งตรงไปยังประเด็นสำคัญด้วยความเร็วประมาณพหุนาม ความแตกต่างนี้เกิดจาก “รสนิยมทางคณิตศาสตร์” หรือไม่? เราคัดกรองเส้นทางที่มีความหมายจากความเป็นไปได้มหาศาลได้อย่างไร? ความสามารถนี้สามารถสร้างแบบจำลองและจำลองในเครื่องจักรได้หรือไม่?

ไมเคิล ฟรีดแมน: นี่เป็นคำถามวิทยาศาสตร์การทดลอง และนี่คือสิ่งที่เราพยายามสำรวจ เราพยายามวิเคราะห์ประวัติศาสตร์คณิตศาสตร์ในระดับหนึ่งอย่างเป็นวงจร เพื่อทำความเข้าใจว่าอะไรนำเราไปสู่พื้นที่การให้เหตุผลที่เป็นรูปธรรมที่บีบอัดได้สูงเหล่านี้ บางทีการชี้แจงแนวคิดและยกตัวอย่างว่าอะไรบีบอัดได้และอะไรบีบอัดไม่ได้ อาจช่วยให้เข้าใจสิ่งนี้ได้ดีขึ้น

ผู้สัมภาษณ์: สามารถยกตัวอย่างที่เข้าใจง่ายขึ้นได้ไหม?

ไมเคิล ฟรีดแมน: ยกตัวอย่างทฤษฎีบทผลบวกกำลังสองสี่จำนวนของลากรองจ์: จำนวนเต็มใดๆ สามารถแสดงเป็นผลบวกของจำนวนกำลังสองสี่จำนวน ถ้าเราใช้ “จำนวนกำลังสอง” เป็นมาโคร การใช้มาโครที่เติบโตเร็วมากนี้ แต่ละจำนวนเต็มสามารถแสดงได้ในสี่ขั้นตอน

นี่อาจฟังดูน่าประหลาดใจ แต่คำอธิบายคือ: การแสดงจำนวนกำลังสองเหล่านี้เองต้องใช้บิตจำนวนมาก ดังนั้นจึงไม่ขัดกับทฤษฎีข้อมูล มันเพียงแต่แสดงให้เห็นว่าหากคุณมีเซตของมาโครที่หนาแน่นมากขึ้น คุณสามารถแสดงเนื้อหาได้มากขึ้นด้วยขั้นตอนที่น้อยลง — นั่นคือ “ความหนาแน่น” ของมาโครกำหนดประสิทธิภาพการแสดงออก และ “10 ยกกำลัง” อยู่ที่จุดสมดุล ซึ่งได้ข้อตกลงที่ดีที่สุดระหว่างความเรียบง่ายของมาโคร (ไม่ใหญ่

⚠️ หมายเหตุ: เนื้อหาได้รับการแปลโดย AI และตรวจสอบโดยมนุษย์ หากมีข้อผิดพลาดโปรดแจ้ง