งานวิจัยที่ก้าวล้ำของทีม Kaiming He: GeoPT ใช้การฝึกฝนล่วงหน้าด้วยไดนามิกสังเคราะห์ ทำให้ AI เรียนรู้กฎฟิสิกส์ด้วยตัวเอง ประหยัดข้อมูลจำลองได้ถึง 60%
ทรัพย์สิน 3D แบบสถิตขาดข้อมูลไดนามิก ในขณะที่ป้ายกำกับการจำลองทางฟิสิกส์จริงมีราคาสูงมาก – จะขยายการฝึกฝนโมเดลจำลองทางฟิสิกส์อย่างมีประสิทธิภาพได้อย่างไร?

บทความล่าสุดของทีม Kaiming He เรื่อง GeoPT เสนอแนวคิดใหม่ การศึกษานี้ได้นำเสนอกระบวนทัศน์ใหม่ที่เรียกว่า การฝึกฝนล่วงหน้าด้วยเรขาคณิตที่เสริมด้วยไดนามิก โดยใช้ ไดนามิกสังเคราะห์ เพื่อ “ยกระดับ” เรขาคณิตสถิตไปสู่พื้นที่ไดนามิก ทำให้โมเดลสามารถเรียนรู้วิวัฒนาการของวิถีอนุภาคจากข้อมูลที่ไม่มีป้ายกำกับ และได้รับสัญชาตญาณทางฟิสิกส์
ภายใต้เงื่อนไขที่ได้ความแม่นยำเท่ากัน GeoPT สามารถประหยัดข้อมูลจำลองทางฟิสิกส์ได้สูงสุดถึง 60%
การ “ยกระดับ” เรขาคณิตสถิตไปสู่พื้นที่ไดนามิก
สนามคำตอบของระบบทางฟิสิกส์มักถูกกำหนดร่วมกันโดยเรขาคณิต (กำหนดขอบเขตพื้นที่) และเงื่อนไขของระบบ (เช่น ปัจจัยขับเคลื่อนทางไดนามิกอย่างความเร็ว แรง) ตัวอย่างเช่นในอากาศพลศาสตร์ รูปร่างของรถยนต์กำหนดขอบเขตของสนามการไหล ในขณะที่ความเร็วและทิศทางลมกำหนดวิวัฒนาการเฉพาะของสนามการไหล
ปัจจุบัน ตัวจำลองที่ใช้โครงข่ายประสาทเทียมซึ่งขับเคลื่อนด้วยข้อมูลกำลังเข้ามาแทนที่วิธีการจำลองทางฟิสิกส์แบบดั้งเดิม อย่างไรก็ตาม เส้นทางนี้เผชิญกับสองคอขวดหลัก:
- ต้นทุนการติดป้ายกำกับสูงมาก: การฝึกฝนตัวจำลองต้องพึ่งพาข้อมูลกำกับดูแลที่สร้างโดยตัวแก้เชิงตัวเลขแบบดั้งเดิม การสร้างตัวอย่างหนึ่งตัวอย่างที่มีความแม่นยำระดับอุตสาหกรรมมักต้องใช้เวลาประมวลผล CPU หลายหมื่นชั่วโมง ต้นทุนการสร้างป้ายกำกับที่สูงนี้จำกัดการขยายขนาดของโมเดลอย่างรุนแรง
- ข้อจำกัดของการฝึกฝนล่วงหน้าแบบสถิต: แม้ว่าจะมีข้อมูลเรขาคณิต 3D จำนวนมหาศาลบนอินเทอร์เน็ต แต่การฝึกฝนล่วงหน้าแบบกำกับตนเอง (เช่น การสร้างใหม่แบบปกปิด) เฉพาะเรขาคณิตสถิตจะขาดมิติ “ไดนามิก” ไปโดยสิ้นเชิง ส่งผลให้โมเดลไม่สามารถจับลักษณะสำคัญของการจำลองทางฟิสิกส์ได้ และอาจทำให้ประสิทธิภาพลดลงในงานปลายน้ำ
เพื่อแก้ไขปัญหานี้ ทีมวิจัยได้เสนอกระบวนทัศน์ การฝึกฝนล่วงหน้าด้วยเรขาคณิตที่เสริมด้วยไดนามิก

แนวคิดหลักคือ: แม้ว่าป้ายกำกับทางฟิสิกส์จริงจะได้มายาก แต่ “ไดนามิก” นั้นสามารถกำหนดพารามิเตอร์ได้ การศึกษาได้นำ ไดนามิกสังเคราะห์ เข้ามาในขั้นตอนการฝึกฝนล่วงหน้า โดยป้อนสนามความเร็วที่สุ่มตัวอย่างให้กับโมเดล เพื่อยกระดับการเรียนรู้การแทนจากพื้นที่เรขาคณิตเพียงอย่างเดียวไปสู่พื้นที่ร่วมของ “เรขาคณิต+ไดนามิก”
กล่าวโดยเฉพาะคือ การศึกษาไม่พึ่งพาสนามความเร็วจริงที่ได้จากการจำลองราคาแพง แต่สร้าง สนามความเร็วสังเคราะห์ โดยการสุ่มตัวอย่างความเร็วสำหรับแต่ละอนุภาค:

ดังนั้น เป้าหมายการเรียนรู้แบบกำกับตนเองจึงเปลี่ยนเป็นการทำนายวิวัฒนาการของลักษณะทางเรขาคณิตภายใต้ไดนามิกสังเคราะห์เหล่านี้:

ด้วยการติดตามกระบวนการวิวัฒนาการของลักษณะทางเรขาคณิตตามวิถีสังเคราะห์ โมเดลได้รับสัญญาณกำกับดูแลที่สร้างขึ้นจากเรขาคณิตอย่างสมบูรณ์ แต่สามารถรับรู้ไดนามิกได้ สิ่งนี้ทำให้โมเดลสามารถเรียนรู้ล่วงหน้าถึงข้อจำกัดเชิงพื้นที่และกฎการเชื่อมโยงทั่วไปในการวิวัฒนาการทางฟิสิกส์ผ่านข้อมูลเรขาคณิตจำนวนมหาศาลที่ไม่มีป้ายกำตั้ง ก่อนที่จะสัมผัสกับป้ายกำกับทางฟิสิกส์จริง
กรอบงานนี้ให้อินเทอร์เฟซแบบรวมสำหรับงานปลายน้ำ: ไม่ว่าจะในขั้นตอนการฝึกฝนล่วงหน้าหรือการปรับแต่ง โมเดลจะรับเรขาคณิตและความเร็วเป็นอินพุต หลังการฝึกฝนล่วงหน้า GeoPT สามารถจับความสัมพันธ์ทางฟิสิกส์ที่มีเงื่อนไขตามความเร็วได้ เมื่อปรับแต่ง เพียงแค่แทนที่ความเร็วสุ่มด้วยความเร็วจริงที่เข้ารหัสการตั้งค่าการจำลองเฉพาะ ก็สามารถปรับให้เหมาะกับงานเฉพาะได้

ขั้นตอนการฝึกฝน
ในขั้นตอนการฝึกฝนล่วงหน้า โมเดลถูกฝึกให้ทำนายวิถีของลักษณะทางเรขาคณิตภายใต้ไดนามิกสังเคราะห์ ฟังก์ชันการสูญเสียถูกกำหนดเป็น:

ฟังก์ชันเป้าหมายนี้เกี่ยวข้องกับการรวมกันของตัวแปรหลักสามตัว:
* เรขาคณิต: สุ่มตัวอย่างแบบสมดุลตามหมวดหมู่จากชุดข้อมูลที่มีเรขาคณิตมากกว่าหนึ่งหมื่นชิ้น เช่น รถยนต์ เครื่องบิน เรือ
* จุดติดตาม: สุ่มตัวอย่างตำแหน่งเริ่มต้นจากปริมาตรรอบวัตถุและขอบเขตเรขาคณิต
* ความเร็ว: สุ่มตัวอย่างความเร็วแบบสุ่มอย่างสม่ำเสมอสำหรับแต่ละจุดจากทรงกลมที่มีขอบเขต
เมื่อได้รับข้อมูลข้างต้นแล้ว วิถีสามารถคำนวณได้อย่างแน่นอนผ่านสูตร โดยเป้าหมายกำกับดูแลคือลำดับของลักษณะทางเรขาคณิตตามเส้นทางนี้
ในขั้นตอนการปรับแต่ง ความเร็วสุ่มจากการฝึกฝนล่วงหน้าจะถูกแทนที่ด้วยการเข้ารหัสความเร็วเฉพาะงาน:
* อากาศพลศาสตร์: เข้ารหัสเงื่อนไขการไหลเข้าเป็นสนามความเร็ว โดยมีทิศทางสอดคล้องกับการไหล
* อุทกพลศาสตร์: กำหนดค่าสนามความเร็วที่แตกต่างกันสำหรับเฟสของเหลวและก๊าซ เพื่อสะท้อนการไหลสองเฟส
* การจำลองการชน: เข้ารหัสทิศทางการชนเป็นสนามความเร็ว ซึ่งขนาดจะลดลงตามพื้นที่เริ่มจากจุดชน เพื่อสะท้อนการแพร่กระจายของแรง
การออกแบบนี้ทำให้โมเดลฝึกฝนล่วงหน้าเพียงตัวเดียวสามารถปรับให้เหมาะกับงานจำลองทางฟิสิกส์ที่หลากหลายได้ เพียงแค่ปรับเปลี่ยนอินพุตความเร็วใหม่
การศึกษานี้ใช้ Transolver เป็นโครงข่ายหลัก กำหนดค่าสามขนาดโมเดลที่มีพารามิเตอร์ตั้งแต่ 3 ล้านถึง 15 ล้าน วิถีถูกแบ่งเป็นขั้นตอนย่อย 3 ขั้นตอน โดยใช้การเข้ารหัส ระยะทางเวกเตอร์ สำหรับข้อมูลเรขาคณิต สำหรับเรขาคณิตแต่ละชิ้นจะสุ่มตัวอย่างจุดประมาณ 36,000 จุด และสร้างสนามไดนามิกสุ่ม 100 สนาม
ในด้านประสิทธิภาพการคำนวณ สัญญาณกำกับดูแลคำนวณผ่านอัลกอริทึมการหาจุดตัดรังสี-สามเหลี่ยมที่ปรับให้เหมาะสม การประมวลผลหนึ่งตัวอย่างใช้เวลาประมาณ 0.2 วินาที ซึ่งเร็วกว่าการจำลอง CFD ระดับอุตสาหกรรมประมาณ 10^7 เท่า บน CPU 80 คอร์ ใช้เวลาเพียง 3 วันในการสร้างชุดข้อมูลฝึกฝนล่วงหน้าขนาดประมาณ 5 TB
การทดสอบยืนยัน
การฝึกฝนล่วงหน้าใช้ชุดข้อมูล ShapeNet-V1 ซึ่งประกอบด้วยเรขาคณิตที่เกี่ยวข้องกับอุตสาหกรรม เช่น รถยนต์ เครื่องบิน เรือ สร้างตัวอย่างมากกว่า 1 ล้านตัวอย่าง (ข้อมูลประมาณ 5 TB) งานปลายน้ำครอบคลุม:
* กลศาสตร์ของไหล: อากาศพลศาสตร์ของรถยนต์ การวิเคราะห์แรงบนเครื่องบิน อุทกพลศาสตร์ของเรือ
* กลศาสตร์ของแข็ง: การจำลองความเค้นสูงสุดจากการชนของรถยนต์
* การจำลองการแผ่รังสี
ผลการทดลองแสดงว่า GeoPT ลดการพึ่งพาข้อมูลที่มีป้ายกำกับอย่างมีนัยสำคัญ สามารถประหยัดข้อมูลจำลองทางฟิสิกส์ได้ 20-60% เมื่อได้ความแม่นยำเท่ากัน ในขณะเดียวกัน ความเร็วในการลู่เข้าขั้นตอนการปรับแต่งเร็วกว่าการฝึกฝนตั้งแต่เริ่มต้นประมาณ 2 เท่า

นอกจากนี้ เมื่อจำนวนชั้นของโมเดลเพิ่มขึ้นและปริมาณข้อมูลฝึกฝนล่วงหน้าเพิ่มขึ้น ประสิทธิภาพก็เพิ่มขึ้นอย่างต่อเนื่องและมั่นคง แสดงให้เห็นถึงศักยภาพในการขยายขนาดของ “โมเดลฟิสิกส์ขนาดใหญ่”

สรุป
การศึกษานี้พิสูจน์ว่าการฝึกฝนล่วงหน้าผ่าน “วิถีไดนามิกสังเคราะห์” สามารถเชื่อมช่องว่างระหว่างเรขาคณิตสถิตและงานทางฟิสิกส์ไดนามิกที่ซับซ้อนได้อย่างมีประสิทธิภาพ GeoPT เปิดเส้นทางที่สามารถขยายขนาดได้สำหรับการสร้างโมเดลพื้นฐานการจำลองทางฟิสิกส์ที่เป็นสากล: ข้อมูลเรขาคณิตจำนวนมหาศาลที่ไม่มีป้ายกำกับ + การกำกับตนเองด้วยไดนามิกสังเคราะห์แบบง่าย = ความสามารถในการจำลองทางฟิสิกส์ข้ามโดเมนที่ทรงพลัง
ผู้เขียนบทความ
ผู้เขียนหลักของบทความนี้คือ Haixu Wu นักวิจัยหลังปริญญาเอกที่ MIT CSAIL

เขาเป็นศิษย์ของศาสตราจารย์ Wojciech Matusik ก่อนหน้านี้ได้รับปริญญาเอกและปริญญาตรีจากมหาวิทยาลัย Tsinghua โดยมีอาจารย์ที่ปรึกษาคือศาสตราจารย์ Mingsheng Long (หนึ่งในผู้เขียนบทความนี้)


ผู้เขียนร่วมหลัก Minghao Guo เป็นนักศึกษาปริญญาเอกที่ MIT CSAIL ซึ่งเป็นศิษย์ของศาสตราจารย์ Wojciech Matusik เช่นกัน จบการศึกษาระดับปริญญาตรีจากมหาวิทยาลัย Tsinghua และปริญญาโทจากมหาวิทยาลัย Chinese University of Hong Kong

ผู้เขียนคนอื่นๆ ได้แก่ นักวิจัยหลังปริญญาเอกของศาสตราจารย์ Kaiming He Zongyi Li, นักศึกษาปริญญาเอก MIT Zhiyang (Frank) Dou และศาสตราจารย์ Kaiming He และศาสตราจารย์ Wojciech Matusik
ลิงก์อ้างอิง:
[1] https://arxiv.org/abs/2602.20399v1
[2] https://github.com/Physics-Scaling/GeoPT
⚠️ หมายเหตุ: เนื้อหาได้รับการแปลโดย AI และตรวจสอบโดยมนุษย์ หากมีข้อผิดพลาดโปรดแจ้ง
本文来自网络搜集,不代表คลื่นสร้างอนาคต立场,如有侵权,联系删除。转载请注明出处:https://www.itsolotime.com/th/archives/23198
