闻乐 发自 凹非寺
量子位 | 公众号 QbitAI
ในทางคณิตศาสตร์มีปัญหาคลาสสิกที่ยากมากชื่อว่า ปัญหาจำนวนการสัมผัส (Kissing Number Problem) มันทำให้มนุษยชาติติดขัดมานานกว่า 300 ปี และล่าสุด งานวิจัยจาก AI ของจีน ได้นำความก้าวหน้าที่ยิ่งใหญ่มาสู่สาขานี้
ปัญหานี้ศึกษาว่า: ในปริภูมิ n มิติ รอบทรงกลมหน่วยหนึ่ง สามารถมีทรงกลมขนาดเท่ากันจำนวนมากที่สุดกี่ลูกที่สัมผัสกันพอดี (คือ “จูบ”) และไม่ทับซ้อนกัน

ปัญหาจำนวนการสัมผัสยังเป็นที่รู้จักในชื่อ ปัญหาจำนวนนิวตัน เป็นรูปแบบเฉพาะที่ของปัญหาที่ 18 ของฮิลแบร์ต (การจัดเรียงทรงกลม) ตรรกะพื้นฐานของมันเชื่อมโยงกับปัญหา “ความแออัดของบิต” ในเทคโนโลยีการสื่อสาร
ประวัติศาสตร์ของมันย้อนกลับไปถึงการโต้เถียงอันโด่งดังในปี 1694 ระหว่างนิวตันและเกรกอรี: ในปริภูมิสามมิติ รอบทรงกลมหนึ่งลูก สามารถวางทรงกลมขนาดเท่ากันได้ 12 หรือ 13 ลูก? นิวตันยืนยันว่า 12 ลูก ส่วนเกรกอรีเชื่อว่าอาจจะเป็น 13 ลูก การโต้เถียงนี้ดำเนินต่อมาเป็นเวลา 258 ปี จนกระทั่งปี 1953 นักคณิตศาสตร์จึงพิสูจน์ได้อย่างเข้มงวดในที่สุดว่านิวตันเป็นฝ่ายถูก
แม้แต่มารีนา ไวยาซอฟสกา นักคณิตศาสตร์ผู้ได้รับรางวัล เหรียญฟิลด์ส ในปี 2022 จากผลงานการแก้ปัญหาการจัดเรียงทรงกลมที่หนาแน่นที่สุดในปริภูมิ 8 และ 24 มิติ ผลงานของเธอก็ยังเชื่อมโยงอย่างใกล้ชิดกับปัญหาจำนวนการสัมผัส

อย่างไรก็ตาม เมื่อมิติเพิ่มสูงขึ้น สัญชาตญาณทางเรขาคณิตของมนุษย์ก็ใช้การไม่ได้ ในช่วงเกือบ 50 ปีที่ผ่านมา มีเพียง 7 ครั้งเท่านั้นที่มีความก้าวหน้าอย่างเป็นสาระสำคัญในการสร้างโครงสร้างสำหรับจำนวนการสัมผัส และแต่ละครั้งก็ใช้วิธีที่แตกต่างกันมาก ยากที่จะนำไปปรับใช้กับมิติที่ติดกันได้
ปัจจุบัน ทางตันนี้ได้ถูกทำลายลงแล้ว
ทีมวิจัยร่วมจาก สถาบันวิทยาศาสตร์ปัญญาประดิษฐ์เซี่ยงไฮ้ (SAIS), มหาวิทยาลัยปักกิ่ง และ มหาวิทยาลัยฟู่ตั้น ได้พัฒนาระบบการเรียนรู้เสริมแรงชื่อ PackingStar ซึ่งทำลายสถิติโลกของจำนวนการสัมผัสในมิติที่ 25 ถึง 31 ต่อเนื่องกันถึง 7 มิติ ในครั้งเดียว
พร้อมกันนั้น ระบบนี้ยังสร้างสถิติใหม่ในมิติอื่นๆ อีกหลายมิติ รวมถึงในปัญหาจำนวนการสัมผัสแบบทั่วไป และค้นพบโครงสร้างใหม่ที่ไม่เคยมีมาก่อนจำนวนมาก (สถิติเหล่านี้เคยมีความเสถียรมายาวนาน ไม่ถูกท้าทายมาเป็นเวลายี่สิบสามสิบปี)

ความก้าวหน้าอย่างเป็นระบบเช่นนี้หาได้ยากมากในประวัติศาสตร์กว่า 300 ปีของปัญหา หลังจากเผยแพร่ผลงาน ศาสตราจารย์ Henry Cohn ผู้ทรงอิทธิพลในสาขาเรขาคณิตเชิงการจัดจาก MIT (เคยร่วมงานกับไวยาซอฟสกาในปัญหามิติที่ 24) ได้ให้คำชื่นชมอย่างสูง และได้บันทึกสถิติใหม่เหล่านี้ลงในรายการอ้างอิงที่มีชื่อเสียงซึ่งเขาเป็นผู้ดูแล

PackingStar ได้เปลี่ยนปัญหาทางเรขาคณิตมิติสูงให้เป็นการแข่งขันแบบมัลติเอเจนต์ที่ AI ถนัด การผสานกันอย่างลึกซึ้งระหว่าง AI กับคณิตศาสตร์ครั้งนี้ ก็เปรียบเสมือนการ “จูบ” แบบมิติสูงในอีกความหมายหนึ่งไม่ใช่หรือ?
การ “จูบ” อย่างลึกซึ้งระหว่าง AI กับคณิตศาสตร์ครั้งนี้
ก่อนอื่นมาดูผลงานโดดเด่นของ PackingStar ในปัญหาศตวรรษนี้:
- ทำลายสถิติจำนวนการสัมผัสในมิติที่ 25 ถึง 31 ต่อเนื่องกัน 7 มิติในครั้งเดียว
- ค้นพบโครงสร้างที่มีเหตุผลที่ดีกว่าทุกโครงสร้างที่รู้จักตั้งแต่ปี 1971 ในมิติที่ 13 และพบโครงสร้างใหม่กว่า 6,000 โครงสร้างในมิติที่ 14 และมิติอื่นๆ อีกหลายมิติ
- ทำลายสถิติจำนวนการสัมผัสแบบทั่วไปที่ไม่ได้เปลี่ยนแปลงมานาน: เพิ่มสถิติ “จำนวนการสัมผัสสองทรงกลม” ในมิติที่ 14 และ 17 เป็น 252 และ 578 ตามลำดับ; เพิ่มสถิติ “จำนวนการสัมผัสสามทรงกลม” ในมิติที่ 12, 20 และ 21 เป็น 81, 405 และ 567 ตามลำดับ (“จำนวนการสัมผัสสองทรงกลม” หมายถึง จำนวนทรงกลมหน่วยสูงสุดที่สัมผัสภายนอกกับทรงกลมหน่วยสองลูกที่สัมผัสกันทั้งคู่ ส่วน “จำนวนการสัมผัสสามทรงกลม” ก็คิดในทำนองเดียวกัน)

Ma Chengdong ผู้ริเริ่มโครงการ รู้จักปัญหานี้ครั้งแรกจากวิชาทฤษฎีสารสนเทศ เขาเองก็เชี่ยวชาญในสาขาการเรียนรู้เสริมแรง การปรากฏตัวของ AlphaTensor ในปี 2022 ทำให้เขาเชื่อมั่นว่า AI สามารถนำความก้าวหน้ามาสู่ปัญหาคณิตศาสตร์ที่ยากได้ ปัญหาจำนวนการสัมผัสมีรูปแบบเรียบง่าย เป้าหมายชัดเจน เกณฑ์การประเมินชัดเจน ความสอดคล้องสูงกับ AI นี้กระตุ้นให้เขาตัดสินใจสำรวจอย่างลึกซึ้ง

△ เยาวชนนักวิจัยในทีม PackingStar
จากซ้ายไปขวา: Liu Minghao, Li Pengyu, Ma Chengdong, Tao Zhaowei, Chen Haojun, Mao Zihao
ปัญหาที่ทำให้มนุษยชาติติดขัดมา 300 ปีนี้ จุดอ่อนของมันเห็นได้ชัด: เมื่อมิติสูงขึ้น วิธีการจัดเรียงทรงกลมที่เป็นไปได้จะเพิ่มขึ้นแบบเอกซ์โพเนนเชียล สัญชาตญาณทางเรขาคณิตอันจำกัดของมนุษย์ใช้การไม่ได้ในปริภูมิมิติสูง
ดังนั้น ทีมจึงตัดสินใจเปลี่ยนแนวทาง ให้ AI สำรวจโครงสร้างที่เป็นไปได้ของการสัมผัสทรงกลมในปริภูมิมิติสูง ด้วยตนเอง พวกเขาทำการเปลี่ยนโฉมปัญหาที่สำคัญ: ไม่ได้จัดการตำแหน่งของทรงกลมในปริภูมิพิกัดโดยตรงอีกต่อไป แต่ย้ายการดำเนินการทั้งหมดไปยัง เมทริกซ์โคไซน์ แต่ละองค์ประกอบในเมทริกซ์นี้สอดคล้องกับค่าโคไซน์ของมุมระหว่างเส้นเชื่อมศูนย์กลางของทรงกลมสองลูกกับเส้นเชื่อมจากจุดกำเนิด วิธีการแสดงนี้เหมาะโดยธรรมชาติกับการคำนวณแบบขนานขนาดใหญ่บน GPU

อย่างไรก็ตาม ความท้าทายใหม่ตามมา ในกระบวนการเติมเมทริกซ์ จะมี “ทรงกลมเสีย” บางลูกที่ทำลายโครงสร้างโดยรวม ดังนั้น ทีมจึงเปลี่ยนแนวคิดครั้งที่สองที่สำคัญ นั่นคือการแนะนำเอเจนต์ที่รับผิดชอบ “การลบทรงกลม”

ในที่สุด ปัญหาการจัดเรียงทรงกลมมิติสูงถูกเปลี่ยนให้เป็นการแข่งขันระหว่างสองเอเจนต์บนเมทริกซ์โคไซน์:
* เอเจนต์เติม: ค้นหาการจัดเรียงทรงกลมที่เป็นไปได้ เหมือนกับการวางหมากของ AlphaGo
* เอเจนต์ตัดแต่ง: วิเคราะห์ทางเรขาคณิต ตัดการจัดเรียงที่ไม่ได้ดีที่สุดออก
ทีมได้สกัดลักษณะทางเรขาคณิตที่กลั่นกรองจากโครงสร้างซับซ้อนมิติสูง เพื่อทำการแยกโครงสร้างออกเป็นส่วนๆ เอเจนต์ทั้งสองทำงานร่วมกันผ่านกลไก 「เติม—ตัดแต่ง—แยก “เศษส่วน”—เติมอีกครั้ง」 ซึ่งลดความยากของการสำรวจมิติสูงลงอย่างมาก

จากนั้นก็มาถึงช่วงเวลาที่มีผลงานใหม่ๆ ปรากฏขึ้น PackingStar ทำลายสถิติในหลายมิติติดต่อกัน สิ่งที่น่าประหลาดใจเป็นพิเศษคือ เป็นเวลานานที่นักคณิตศาสตร์มีความเข้าใจและกรอบการสร้างสำหรับปัญหานี้อยู่ที่โครงสร้างแบบสมมาตร แต่โครงสร้างที่ทำลายสถิติจำนวนมากที่ PackingStar ค้นพบ ล้วนเป็นโครงสร้าง “ไม่สมมาตร” ที่ขัดกับสัญชาตญาณอย่างชัดเจน ทำลายความเข้าใจที่มีมานานนี้
Ma Chengdong รู้สึกประทับใจว่า:
ในปริภูมิมิติสูงที่ซับซ้อนเช่นนี้ “สัญชาตญาณ” หลายอย่างของมนุษย์ไม่น่าเชื่อถือ การค้นพบที่มีประสิทธิภาพบางอย่างของ AI นั้นขัดกับสัญชาตญาณของมนุษย์โดยสิ้นเชิง นี่คือจุดที่ AI แข็งแกร่งกว่ามนุษย์มาก
ตัวอย่างเช่น โครงสร้างสถิติใหม่ 81 ลูกที่พบใน “จำนวนการสัมผัสสามทรงกลม” มิติที่ 12 แม้โดยรวมจะไม่มีสมมาตรชัดเจน แต่จำนวนทรงกลมข้างเคียงของแต่ละทรงกลมกลับเท่ากันทุกประการ ซึ่งบ่งชี้ว่าอาจมีโครงสร้างที่มีสมมาตรสูงกว่าซ่อนอยู่ ท้ายที่สุด ทีมสามารถค้นพบโครงสร้าง 81 ลูกที่มีกลุ่มสมมาตรที่มีอันดับสูงถึง 311040 ได้สำเร็จ
ที่น่าอัศจรรย์ยิ่งกว่านั้นคือ สถิติใหม่ 405 ลูกในมิติที่ 20 และ 567 ลูกในมิติที่ 21 ล้วนสามารถได้มาจากการผสมผสานโครงสร้างมิติที่ 12 นี้

ผลงานเหล่านี้ทำให้ศาสตราจารย์ Henry Cohn รู้สึก “ไม่อาจจินตนาการได้” ในตอนแรกเขาตื่นตะลึกกับระเบียบวิธีของทีม หลังจากวิเคราะห์อย่างลึกซึ้งยิ่งขึ้น เขาก็พบด้วยความประหลาดใจว่า โครงสร้างเหล่านี้ที่ค้นพบโดย AI สามารถเชื่อมโยงสาขาคณิตศาสตร์ที่ดูเหมือนแยกจากกันหลายสาขา เช่น รหัสทรงกลม ทฤษฎีจำนวน ทฤษฎีกรุ๊ป เข้าด้วยกันได้ ซึ่งมีคุณค่าทางคณิตศาสตร์สูงมาก
เบื้องหลังการ “จูบ” อย่างลึกซึ้งระหว่าง AI กับคณิตศาสตร์ครั้งนี้ ไม่อาจขาดระบบสนับสนุนแบบไตรภาค 「AI—วิทยาศาสตร์—วิศวกรรม」 ของ SAIS ได้
พลังวิศวกรรม: ขยายการสำรวจคณิตศาสตร์เป็นการค้นพบในระดับใหญ่
หากกล่าวว่าอัลกอริทึมคือจิตวิญญาณ พลังวิศวกรรม ก็คือตัวเร่งความเร็ว
ปัจจุบัน อุตสาหกรรม AI ทั่วโลกกำลังอยู่ในช่วงเปลี่ยนผ่านที่ละเอียดอ่อน จุดแข่งขันได้เปลี่ยนจากการแข่งขันแค่พารามิเตอร์โมเดล ไปสู่การสร้างความสามารถด้านโครงสร้างพื้นฐาน (AI Infra) ในต่างประเทศ DeepMind ในโครงการวิทยาศาสตร์เช่น AlphaFold, AlphaTensor ต้องพึ่งพาการคอมไพล์ XLA และการปรับแต่งระดับโอเปอเรเตอร์ที่พัฒนาขึ้นเอง เพื่อสนับสนุนการฝึก AI ระยะยาวอย่างมาก ในประเทศจีน Alibaba Cloud, ศูนย์ซูเปอร์คอมพิวเตอร์แห่งชาติ ฯลฯ ก็ให้ความสำคัญกับงานปรับแต่งโอเปอเรเตอร์ การจัดสรรงาน และความเสถียรในการทำงานระยะยาวในสถานการณ์ AI for Science มากขึ้น โดยมีเป้าหมายเพื่อจัดหาฐานการคำนวณที่ทำงานต่อเนื่องไม่หยุดพักสำหรับการวิจัยพื้นฐานแนวหน้า
การสำรวจคณิตศาสตร์มิติสูงเองต้องพึ่งพากระบวนการคำนวณที่ ใช้เวลานาน อัตราความสำเร็จต่ำ และใช้ทรัพยากรสูง เป็นอย่างมาก ซึ่งเรียกร้องความเสถียรและประสิทธิภาพของระบบในระดับสูงสุด ด้วยเหตุนี้ AI Infra จึงค่อยๆ กลายเป็นหนึ่งในปัจจัยชี้ขาดในการแก้ปัญหาซับซ้อนเช่นนี้
ในโครงการ PackingStar แพลตฟอร์มเปิดวิทยาศาสตร์ปัญญาประดิษฐ์ Xinghe Qizhi ที่สร้างขึ้นโดย SAIS ร่วมกับมหาวิทยาลัยฟู่ตั้นและ Infinite Light Year ได้รับบทบาทเป็น “เสาหลักแห่งความมั่นคง” เมื่อเผชิญกับจุดอิ่มตัวของประสิทธิภาพโอเปอเรเตอร์การหาค่าเหมาะที่สุดทางคณิตศาสตร์แบบดั้งเดิมในสถานการณ์การแข่งขันระดับล้านล้านครั้ง ทีมวิศวกรรมของ Xinghe Qizhi จึงเริ่ม พัฒนาซียูด้าโอเปอเรเตอร์ระดับล่างด้วยตนเอง

โอเปอเรเตอร์ใหม่คำนวณบน GPU โดยตรง และจัดเก็บผลลัพธ์ในตำแหน่งเดิม จึงช่วยประหยัดเวลาในการอ่าน-เขียนและเคลื่อนย้ายข้อมูลซ้ำๆ จำนวนมาก ทำให้ประสิทธิภาพการประมวลผลแบบเอนด์ทูเอนด์ของโซ่การคำนวณหลักเพิ่มขึ้นหลายเท่า
นอกจากความเร็วแล้ว ทีมยังพัฒนาระบบ Checkpointing อัตโนมัติ ซึ่งเป็นกลไกการทนต่อความผิดพลาดอัตโนมัติที่มีความแข็งแกร่งสูง ออกแบบมาเพื่อรับมือกับงานระยะยาวระดับพันการ์ด GPU โดยเฉพาะ มันรองรับการบันทึกข้อมูลแบบหมุนเวียนตามเวลา การกู้คืนอัตโนมัติเมื่อเกิดข้อผิดพลาด ซึ่งรับประกันว่าข้อมูลจะไม่สูญหาย และงานที่หยุดชะงักสามารถดำเนินต่อได้
ด้วยวิธีนี้ ปัญหาสองประการหลักในการทำงานขนาดใหญ่ นั่นคือประสิทธิภาพและความเสถียร จึงได้รับการแก้ไข
การใช้ความแน่นอนทางวิศวกรรมมาชดเชยความไม่แน่นอนของการค้นพบทางวิทยาศาสตร์ ทำให้ปัญหาคณิตศาสตร์ที่เคยสูงส่งจนเอื้อมไม่ถึง กลายเป็นการสำรวจที่เป็นระบบและสามารถขยายขนาดได้ แนวปฏิบัติทางวิศวกรรมของ SAIS นี้ นำหน้าสาขาโครงสร้างพื้นฐานวิทยาศาสตร์ปัญญาประดิษฐ์และการคำนวณคณิตศาสตร์แนวหน้าของโลก เมื่อมีโครงสร้างพื้นฐานเปิดที่เน้นความต้องการของนักวิทยาศาสตร์เป็นศูนย์กลาง เยาวชนนักวิทยาศาสตร์ก็ไม่ต้องกังวลกับความเสถียรของพลังคำนวณอีกต่อไป และสามารถมุ่งความสนใจไปที่การจุดประกายความคิดและสำรวจได้มากขึ้น
AI for Science เข้าสู่ยุค 2.0: เสริมพลังให้เยาวชนนักวิทยาศาสตร์
แน่นอน หากคิดเพียงว่า ความหมายของ PackingStar อยู่ที่การทำลายสถิติในบางมิติ ก็คงประเมินค่าของมันต่ำเกินไป
มันพิสูจ
⚠️ หมายเหตุ: เนื้อหาได้รับการแปลโดย AI และตรวจสอบโดยมนุษย์ หากมีข้อผิดพลาดโปรดแจ้ง
本文来自网络搜集,不代表คลื่นสร้างอนาคต立场,如有侵权,联系删除。转载请注明出处:https://www.itsolotime.com/th/archives/22931
