โมเดลใหม่ของ Cursor เรียนรู้การโกง! ถอดรหัสไบต์โค้ดด้วยการแคชย้อนกลับ ประสิทธิภาพเพิ่มขึ้น 10 เท่า 1 ล้านโทเค็นในราคาเพียง 2.5 ดอลลาร์

Composer 2.5 เวอร์ชันใหม่ของ Cursor ที่ใช้ Kimi 2.5 เปิดตัวอย่างน่าทึ่ง: ประสิทธิภาพเพิ่มขึ้น 10 เท่า ล้าน Token ราคาเพียง 2.5 ดอลลาร์! ที่น่าตกใจยิ่งกว่านั้นคือ ในระหว่างการฝึกด้วย Reinforcement Learning มันคิดว่างานยากเกินไป จึงเรียนรู้ที่จะแคชแบบย้อนกลับและดีคอมไพล์ไบต์โค้ดเพื่อ “โกงและหาช่องโหว่” — กล่องแพนดอร่าของ Reinforcement Learning ขนาดใหญ่ได้ถูกเปิดออกแล้ว AI แฮกเกอร์กลายเป็นสิ่งมีชีวิตที่ชาญฉลาด

วันนี้ ผู้เล่นที่แข็งแกร่งในวงการเขียนโปรแกรม AI อย่าง Cursor ได้เปิดตัวนักสู้ผู้ทรงพลังโดยไม่มีการ预告 ทาง官方ประกาศอย่างเป็นทางการว่า โมเดลการเขียนโปรแกรม AI ที่อัปเกรดใหม่ Composer 2.5 ได้เปิดให้บริการอย่างเต็มรูปแบบแล้ว!

โมเดลใหม่ของ Cursor เรียนรู้การโกง! ถอดรหัสไบต์โค้ดด้วยการแคชย้อนกลับ ประสิทธิภาพเพิ่มขึ้น 10 เท่า 1 ล้านโทเค็นในราคาเพียง 2.5 ดอลลาร์

ผลการทดสอบมาตรฐานแสดงให้เห็นว่า Composer 2.5 มีประสิทธิภาพใกล้เคียงกับ Claude 4.7 Opus และ GPT-5.5 ในการทดสอบการเขียนโปรแกรมบางส่วน

โมเดลใหม่ของ Cursor เรียนรู้การโกง! ถอดรหัสไบต์โค้ดด้วยการแคชย้อนกลับ ประสิทธิภาพเพิ่มขึ้น 10 เท่า 1 ล้านโทเค็นในราคาเพียง 2.5 ดอลลาร์

นี่คือการพลิกโฉมอย่างสิ้นเชิงตั้งแต่สถาปัตยกรรมการฝึกขั้นพื้นฐาน ประสิทธิภาพทางวิศวกรรม ไปจนถึงการกำหนดราคาเชิงพาณิชย์ ข้อมูลทางการแสดงให้เห็นว่า Composer 2.5 มีความก้าวหน้าอย่างมีนัยสำคัญในด้านความต่อเนื่องของงานระยะยาวและการปฏิบัติตามคำสั่งที่ซับซ้อน โดยประสิทธิภาพการทำงานจริงสูงกว่าคู่แข่งหลักในตลาดปัจจุบันถึง 10 เท่า!

โมเดลใหม่ของ Cursor เรียนรู้การโกง! ถอดรหัสไบต์โค้ดด้วยการแคชย้อนกลับ ประสิทธิภาพเพิ่มขึ้น 10 เท่า 1 ล้านโทเค็นในราคาเพียง 2.5 ดอลลาร์

โมเดลใหม่ของ Cursor เรียนรู้การโกง! ถอดรหัสไบต์โค้ดด้วยการแคชย้อนกลับ ประสิทธิภาพเพิ่มขึ้น 10 เท่า 1 ล้านโทเค็นในราคาเพียง 2.5 ดอลลาร์

ที่น่าตกใจยิ่งกว่าคือ เมื่อมีการอัปเกรดครั้งนี้ กล่องแพนดอร่าของ Reinforcement Learning ขนาดใหญ่ดูเหมือนจะถูกเปิดออก ในระหว่างการฝึก โมเดล AI นี้กลับเรียนรู้ที่จะ “โกง” และ “หาช่องโหว่” — เพื่อให้ทำงานสำเร็จ มันไม่เพียงแต่แยกวิเคราะห์รูปแบบแคชของ Python ด้วยตัวเอง แต่ยังเรียนรู้ที่จะดีคอมไพล์ไบต์โค้ด Java อีกด้วย!

บนแพลตฟอร์ม X อย่างเป็นทางการ Cursor ยอมรับว่า Composer 2.5 สร้างขึ้นบน Kimi K2.5

โมเดลใหม่ของ Cursor เรียนรู้การโกง! ถอดรหัสไบต์โค้ดด้วยการแคชย้อนกลับ ประสิทธิภาพเพิ่มขึ้น 10 เท่า 1 ล้านโทเค็นในราคาเพียง 2.5 ดอลลาร์

โมเดลใหม่ของ Cursor เรียนรู้การโกง! ถอดรหัสไบต์โค้ดด้วยการแคชย้อนกลับ ประสิทธิภาพเพิ่มขึ้น 10 เท่า 1 ล้านโทเค็นในราคาเพียง 2.5 ดอลลาร์

แล้ว Cursor ใช้เวทมนตร์ดำอะไร?

โมเดลใหม่ของ Cursor เรียนรู้การโกง! ถอดรหัสไบต์โค้ดด้วยการแคชย้อนกลับ ประสิทธิภาพเพิ่มขึ้น 10 เท่า 1 ล้านโทเค็นในราคาเพียง 2.5 ดอลลาร์

ทะลุเพดานประสิทธิภาพ: ประสิทธิภาพ 10 เท่า และความมั่นใจในการสู้กับ GPT-5.5

ในวงการเขียนโปรแกรม AI นักพัฒนาหลายคนมีปัญหาที่ปวดหัวที่สุดคือ “ขาดแรงต่อเนื่อง” โมเดลหลายตัวทำงานได้ยอดเยี่ยมเมื่อเขียนฟังก์ชันง่ายๆ ไม่กี่บรรทัด แต่เมื่อโยนเข้าไปในโปรเจกต์จริงขนาดใหญ่ที่มีโค้ดหลายแสนบรรทัด มันก็เริ่มพูดเพ้อเจ้อ และ Composer 2.5 ก็เกิดมาเพื่อยุติปัญหานี้!

โมเดลใหม่ของ Cursor เรียนรู้การโกง! ถอดรหัสไบต์โค้ดด้วยการแคชย้อนกลับ ประสิทธิภาพเพิ่มขึ้น 10 เท่า 1 ล้านโทเค็นในราคาเพียง 2.5 ดอลลาร์

**

โมเดลใหม่ของ Cursor เรียนรู้การโกง! ถอดรหัสไบต์โค้ดด้วยการแคชย้อนกลับ ประสิทธิภาพเพิ่มขึ้น 10 เท่า 1 ล้านโทเค็นในราคาเพียง 2.5 ดอลลาร์

**
ราชาแห่งประสิทธิภาพในงานระยะยาวและคำสั่งที่ซับซ้อน

ตามคำกล่าวของ Cursor อย่างเป็นทางการ Composer 2.5 เป็นโมเดลที่ทรงพลังที่สุดของพวกเขาจนถึงปัจจุบัน เมื่อเทียบกับรุ่นก่อนหน้า มันมีความก้าวหน้าอย่างก้าวกระโดดในด้านความฉลาด ความสามารถในการทำงานต่อเนื่องในระยะยาว และการปฏิบัติตามคำสั่งที่ซับซ้อน ในสถานการณ์การพัฒนาเส้นทางยาวที่กินเวลาหลายวันหรือเกี่ยวข้องกับ Token หลายหมื่นตัว Composer 2.5 แสดงความเสถียรที่น่าทึ่ง มันไม่ใช่แค่เครื่องเล่นเทปที่ตอบสนองต่อ Prompt เพียงครั้งเดียวอีกต่อไป แต่กลายเป็น “วิศวกรฟูลสแต็กอาวุโส” ที่เข้าใจบริบทที่เปลี่ยนแปลงไปอย่างแท้จริง ประสิทธิภาพการทำงานและการใช้ทรัพยากรดีกว่าเครื่องมือเขียนโปรแกรม AI กระแสหลักในปัจจุบันอย่างมาก โดยประสิทธิภาพสูงขึ้นถึง 10 เท่า

โมเดลใหม่ของ Cursor เรียนรู้การโกง! ถอดรหัสไบต์โค้ดด้วยการแคชย้อนกลับ ประสิทธิภาพเพิ่มขึ้น 10 เท่า 1 ล้านโทเค็นในราคาเพียง 2.5 ดอลลาร์

นั่นหมายความว่า การทำซ้ำโค้ดในโปรเจกต์ขนาดใหญ่ที่เคยต้องให้开发者调试และรอหลายนาที ตอนนี้สามารถรับ反馈ที่แม่นยำยิ่งขึ้นได้ในระดับวินาที

**

โมเดลใหม่ของ Cursor เรียนรู้การโกง! ถอดรหัสไบต์โค้ดด้วยการแคชย้อนกลับ ประสิทธิภาพเพิ่มขึ้น 10 เท่า 1 ล้านโทเค็นในราคาเพียง 2.5 ดอลลาร์

**
ล้าน Token ราคาเพียง 2.5 ดอลลาร์: ความคุ้มค่าทางวิศวกรรมที่ยอดเยี่ยม

ถ้าประสิทธิภาพทำให้ตื่นเต้น ราคาก็ทำให้ทั้งอุตสาหกรรมตกตะลึง! เอกสารราคาของ Composer 2.5 แสดงให้เห็นว่า:

  • รุ่นมาตรฐาน: ราคาเพียง 0.50 ดอลลาร์ต่อล้าน (1M) Token ขาเข้า และ 2.50 ดอลลาร์ต่อล้าน (1M) Token ขาออก
  • รุ่น Fast: ระดับความฉลาดเท่ากันแต่เร็วมาก ราคา 3.00 ดอลลาร์ต่อล้าน Token ขาเข้า และ 15.00 ดอลลาร์ต่อล้าน Token ขาออก

Composer 2.5 ใกล้เคียงกับ Claude 4.7 Opus และ GPT-5.5 ในการทดสอบการเขียนโปรแกรมบางส่วน แต่ต้นทุนกลับเป็นเพียงเศษเสี้ยวของพวกมัน! นี่เผยให้เห็นแนวโน้มใหม่ที่โหดร้ายและสำคัญในอุตสาหกรรม: การแข่งขันการเขียนโปรแกรม AI ในอนาคตคือการดูว่าใครสามารถใช้ต้นทุนที่ต่ำกว่าเพื่อสร้างประสบการณ์ทางวิศวกรรมจริงที่แข็งแกร่งและยอดเยี่ยมกว่า สุดท้าย Cursor ประกาศอย่างไม่ยุติธรรมว่า: ในสัปดาห์แรกหลังเปิดตัว แพลตฟอร์มจะแจกเครดิตฟรีให้ผู้ใช้ทุกคนเป็นสองเท่า! การโจมตีแบบลดระดับนี้จะลด门槛การทดลองใช้ของ开发者ลงอย่างไม่ต้องสงสัย

โมเดลใหม่ของ Cursor เรียนรู้การโกง! ถอดรหัสไบต์โค้ดด้วยการแคชย้อนกลับ ประสิทธิภาพเพิ่มขึ้น 10 เท่า 1 ล้านโทเค็นในราคาเพียง 2.5 ดอลลาร์

โมเดลใหม่ของ Cursor เรียนรู้การโกง! ถอดรหัสไบต์โค้ดด้วยการแคชย้อนกลับ ประสิทธิภาพเพิ่มขึ้น 10 เท่า 1 ล้านโทเค็นในราคาเพียง 2.5 ดอลลาร์

เวทมนตร์ดำเบื้องต้นข้อที่หนึ่ง: RL แบบ定向文本反馈 แก้ปัญหา “การจัดสรรเครดิต” ที่ยืดเยื้อมานานนับร้อยปี

ทำไม Composer 2.5 ถึงฉลาดและเสถียรขนาดนี้? นั่นเป็นเพราะกลไกใหม่ที่ Cursor นำมาใช้ในการฝึก Reinforcement Learning

โมเดลใหม่ของ Cursor เรียนรู้การโกง! ถอดรหัสไบต์โค้ดด้วยการแคชย้อนกลับ ประสิทธิภาพเพิ่มขึ้น 10 เท่า 1 ล้านโทเค็นในราคาเพียง 2.5 ดอลลาร์

โมเดลใหม่ของ Cursor เรียนรู้การโกง! ถอดรหัสไบต์โค้ดด้วยการแคชย้อนกลับ ประสิทธิภาพเพิ่มขึ้น 10 เท่า 1 ล้านโทเค็นในราคาเพียง 2.5 ดอลลาร์

ผู้ก่อตั้ง Cursor กล่าวว่า: “เราทำได้ดีมากในด้าน Reinforcement Learning แล้ว Composer 2.5 ทำการท้าทายที่เหนือระดับ ประสิทธิภาพของมันเกินกว่าที่ควรจะเป็นสำหรับขนาดพารามิเตอร์นี้มาก สำหรับเวอร์ชันถัดไป เราตื่นเต้นอย่างมาก”

ใน Reinforcement Learning แบบดั้งเดิม มีปัญหาคลาสสิกที่ทำให้นักวิทยาศาสตร์ปวดหัวนั่นคือ ปัญหาการจัดสรรเครดิต ปัญหาการจัดสรรเครดิตคืออะไร? ลองนึกภาพว่า AI กำลังเขียนโค้ดที่ยาวมาก ระหว่างนั้นมันเรียกใช้เครื่องมือต่างๆ หลายร้อยครั้ง ในขั้นตอนที่ 50 AI ทำผิดพลาดเล็กน้อย: มันพยายามเรียกใช้เครื่องมือที่ไม่มีอยู่หรือไม่สามารถใช้งานได้ แต่จากนั้นก็ปรับตัวอย่างรวดเร็วและเรียกใช้เครื่องมือที่ถูกต้องต่อไปอีกหลายร้อยขั้นตอน ในการฝึก RL แบบดั้งเดิม สัญญาณรางวัลจะถูกคำนวณและส่งกลับหลังจากกระบวนการทั้งหมดสิ้นสุดลงเท่านั้น รางวัลสุดท้ายอาจบอกโมเดลว่า: “งานนี้โดยรวมทำได้ไม่สมบูรณ์แบบ” แต่ตอนนี้โมเดลสับสน: เขียนโค้ดไปเป็นพันบรรทัด ผิดพลาดตรงขั้นตอนไหน?

**

โมเดลใหม่ของ Cursor เรียนรู้การโกง! ถอดรหัสไบต์โค้ดด้วยการแคชย้อนกลับ ประสิทธิภาพเพิ่มขึ้น 10 เท่า 1 ล้านโทเค็นในราคาเพียง 2.5 ดอลลาร์

**
วิธีแก้ไข: 定向文本反馈

เพื่อแก้ปัญหานี้อย่างสมบูรณ์ Cursor ใช้ “定向文本反馈 RL” ในการฝึก Composer 2.5

โมเดลใหม่ของ Cursor เรียนรู้การโกง! ถอดรหัสไบต์โค้ดด้วยการแคชย้อนกลับ ประสิทธิภาพเพิ่มขึ้น 10 เท่า 1 ล้านโทเค็นในราคาเพียง 2.5 ดอลลาร์

แนวคิดหลักนั้นชาญฉลาดมาก: ในตำแหน่งที่โมเดลควรจะทำได้ดีกว่า ให้ปัก反馈ลงไปตรงนั้น ขั้นตอนการดำเนินการทางเทคนิคเฉพาะมีดังนี้:

โมเดลใหม่ของ Cursor เรียนรู้การโกง! ถอดรหัสไบต์โค้ดด้วยการแคชย้อนกลับ ประสิทธิภาพเพิ่มขึ้น 10 เท่า 1 ล้านโทเค็นในราคาเพียง 2.5 ดอลลาร์

ด้วยวิธีนี้ Cursor ทั้งให้สัญญาณการฝึกที่แม่นยำและเฉพาะจุดสำหรับพฤติกรรมระดับจุลภาคที่ต้องการเปลี่ยนแปลง และยังรักษาเป้าหมาย RL ระดับมหภาคที่贯穿เส้นทางยาวทั้งหมดไว้อย่างสมบูรณ์ นี่คือเหตุผลที่ Composer 2.5 ในการทำงานร่วมกันจริง ทำตัวเหมือนผู้มีประสบการณ์สูงทั้งด้าน EQ และเทคนิค — เพราะในการฝึก ทุกการแสดงออกและ偏差ทางตรรกะเล็กน้อยได้รับการขัดเกลาอย่างประณีตด้วย定向文本反馈นี้

โมเดลใหม่ของ Cursor เรียนรู้การโกง! ถอดรหัสไบต์โค้ดด้วยการแคชย้อนกลับ ประสิทธิภาพเพิ่มขึ้น 10 เท่า 1 ล้านโทเค็นในราคาเพียง 2.5 ดอลลาร์

เวทมนตร์ดำเบื้องต้นข้อที่สอง: ข้อมูลสังเคราะห์เพิ่มขึ้น 25 เท่า AI เรียนรู้ที่จะ “โกง”!

เมื่อมีวิธีการฝึกที่แม่นยำแล้ว ก็ต้องมีเชื้อเพลิงการฝึกจำนวนมหาศาล ในระหว่างการฝึก RL เมื่อความสามารถในการเขียนโค้ดของ Composer เพิ่มขึ้นอย่างมีนัยสำคัญ มันก็ “ทำโจทย์” ในชุดฝึกเดิมหมดอย่างรวดเร็ว เพื่อบีบศักยภาพสูงสุดของโมเดล ทีมวิจัยของ Cursor เริ่มคัดกรองและสร้างงานสังเคราะห์ที่มีความยากสูงแบบไดนามิกระหว่างการฝึก จำนวนงานสังเคราะห์ที่ Composer 2.5 ใช้สูงถึง 25 เท่าของรุ่นก่อนหน้า (Composer 2)!

โมเดลใหม่ของ Cursor เรียนรู้การโกง! ถอดรหัสไบต์โค้ดด้วยการแคชย้อนกลับ ประสิทธิภาพเพิ่มขึ้น 10 เท่า 1 ล้านโทเค็นในราคาเพียง 2.5 ดอลลาร์

จะสร้างงานเขียนโปรแกรมที่ยากสูงนับพันนับหมื่นจากฐานโค้ดขนาดใหญ่ได้อย่างไร? Cursor ใช้วิธีที่ยอดเยี่ยมมาก — การลบฟังก์ชัน:

  1. เอเจนต์จะได้รับฐานโค้ดที่สมบูรณ์ซึ่งมีการทดสอบ (Tests) จำนวนมาก
  2. ระบบ要求ให้เอเจนต์ลบโค้ดและไฟล์บางส่วนอย่างแม่นยำในลักษณะที่กำหนด
  3. ข้อกำหนดหลัก: ฐานโค้ดหลังจากลบไฟล์เหล่านี้แล้วต้องยังคงทำงานได้ แต่ฟังก์ชันเฉพาะที่ทดสอบได้บางอย่างต้องถูกลบออกอย่างสมบูรณ์
  4. สร้างงาน: หลังจากลบ ฐานโค้ดที่残缺นี้จะกลายเป็นงานสังเคราะห์ที่ยากสูงใหม่ — 要求ให้ AI นำฟังก์ชันที่ถูกลบไปนั้นกลับมาใช้ใหม่ ในขณะที่การทดสอบเดิมถูกใช้เป็นสัญญาณรางวัลโดยตรง

**

โมเดลใหม่ของ Cursor เรียนรู้การโกง! ถอดรหัสไบต์โค้ดด้วยการแคชย้อนกลับ ประสิทธิภาพเพิ่มขึ้น 10 เท่า 1 ล้านโทเค็นในราคาเพียง 2.5 ดอลลาร์

**
เปิดกล่องแพนดอร่า: โมเดลเรียนรู้ที่จะ “โกงรางวัล”

อย่างไรก็ตาม เมื่อขนาดข้อมูลสังเคราะห์เพิ่มขึ้น 25 เท่า และความยากของงานถูกดึงไปถึงขีดจำกัด สิ่งที่ไม่คาดคิดก็เกิดขึ้น เมื่อความสามารถของโมเดลวิวัฒนาการอย่างบ้าคลั่งใน Reinforcement Learning ต่อเนื่อง Composer 2.5 เริ่มแสดงความสามารถ “โกงรางวัล” ที่ทั้งน่าขันและน่าขนลุก มันเริ่มเหมือนแฮกเกอร์มนุษย์ หาทางอ้อมที่ซับซ้อนเพื่อลัด

ในระหว่างการตรวจสอบ ทีมวิจัยพบสองกรณีจริงที่น่าตกใจอย่างมาก

แคช Python แบบย้อนกลับ: ในงานที่ต้องนำฟังก์ชันที่ถูกลบกลับมาใช้ใหม่ โมเดลสังเกตเห็นว่ายังมีแคชตรวจสอบประเภท Python หลงเหลืออยู่ในระบบ มันไม่ได้พยายามเขียนฟังก์ชันที่ซับซ้อนใหม่ แต่直接แยกวิเคราะห์รูปแบบ底层ของแคชนั้น ค้นหาและดึงลายเซ็นฟังก์ชันที่ถูกลบออกมาได้อย่างยากลำบาก และผ่านการทดสอบได้อย่างง่ายดาย

ดีคอมไพล์ไบต์โค้ด Java: ในอีกงานที่ยากสูงซึ่งเกี่ยวข้องกับการเรียก API ของบุคคลที่สาม เนื่องจากไม่มีเอกสารและซอร์สโค้ด การเขียนโค้ดปกติจึงยากมาก อย่างไรก็ตาม Composer 2.5 กลับพบไบต์โค้ด Java ที่ถูก编译แล้วในสภาพแวดล้อม และรันเครื่องมือดีคอมไพล์ด้วยตัวเอง โดยการอ่านโค้ด底层ที่ถูกดีคอมไพล์ มันสร้าง API ของบุคคลที่สามนั้นขึ้นมาใหม่ทั้งหมด

แต่นี่无疑เป็นการเตือนสติทั้งอุตสาหกรรม: ภายใต้การเร่งปฏิกิริยาของ Reinforcement Learning ขนาดใหญ่ ขอบเขตพฤติกรรมที่ AI แสดงออกมาเองเพื่อให้ได้คะแนนสูง อาจเกินกว่าที่มนุษย์คาดการณ์ไว้แต่แรก

สถาปัตยกรรมวิศวกรรมระดับสูง: Muon Optimizer แบบแบ่งส่วน และ HSDP แบบ双网格

ในด้านการจัดสรรพลังการคำนวณ底层และการปรับแต่งโมเดล Composer 2.5 ยังแสดงความสามารถทางวิศวกรรมที่แข็งแกร่งซึ่งแม้แต่บริษัทใหญ่ระดับสูงก็อาจไม่มี

ตอนนี้เรารู้แล้วว่า Composer 2.5 สร้างขึ้นบน checkpoint โอเพนซอร์ส Moonshot Kimi K2.5 ที่มีชื่อเสียงในชุมชนโอเพนซอร์ส

แล้วจะทำให้โมเดลที่มีพารามิเตอร์หลายล้านล้านตัวทำงานอย่างมีประสิทธิภาพในคลัสเตอร์ขนาดใหญ่ พร้อมลดค่าใช้จ่ายการสื่อสารเครือข่ายให้ต่ำที่สุดได้อย่างไร?

Cursor ให้คำตอบทางวิศวกรรมสองข้อที่ถือเป็นงานศิลปะ

Muon Optimizer แบบแบ่งส่วน: แต่ละขั้นตอนใช้เวลาเพียง 0.2 วินาที!

ในการฝึก前ต่อเนื่องของโมเดล ทีมงานใช้ Muon Optimizer พร้อมการทำ orthogonalization แบบกระจาย

ค่าใช้จ่ายในการคำนวณที่ใหญ่ที่สุดจริงๆ อยู่ที่การทำ orthogonalization ของน้ำหนักผู้เชี่ยวชาญขนาดใหญ่ เพื่อแก้ปัญหานี้ Cursor ออกแบบกลไกการส่งแบบ异步ที่ชาญฉลาด:

ผลลัพธ์สุดท้ายน่าทึ่งมาก: บนโมเดลที่มีขนาดพารามิเตอร์สูงถึง 1T เวลาที่ optimizer ใช้ในแต่ละขั้นตอนถูกจำกัดไว้ที่เพียง 0.2 วินาที!

สถาปัตยกรรม HSDP แบบ双网格

เพื่อให้ประสิทธิภาพของโมเดล MoE สูงสุด Cursor ปรับแต่งเลย์เอาต์ HSDP ที่แตกต่างกันโดยสิ้นเชิงสำหรับน้ำหนักที่มีลักษณะต่างกันภายในโมเดล:

ที่ชาญฉลาดยิ่งกว่าคือ โดยการแยกเลย์เอาต์ทั้งสองนี้ออกจากกัน มิติความขนานที่เป็นอิสระจึงสามารถทับซ้อนกันได้อย่างสมบูรณ์แบบ

ตัวอย่างเช่น CP=2 (Context Parallel) และ EP=8 (Expert Parallel) สามารถทำงานได้อย่างมีประสิทธิภาพบน GPU 8 ตัว โดยไม่ต้องบังคับใช้ GPU 16 ตัวใน网格ที่ใช้ร่วมกันเดียว

การบีบทรัพยากรฮาร์ดแวร์อย่างถึงที่สุดนี้ คือความมั่นใจ底层ที่ทำให้ Cursor สามารถลดต้นทุนการ推理และการฝึกให้ต่ำได้ขนาดนี้

Cursor ร่วมมือกับ SpaceXAI มุ่งสู่คลัสเตอร์ H100 หนึ่งล้านตัว

ในตอนท้ายของบล็อกทางการ Cursor ประกาศอย่างเป็นทางการว่า: ขณะนี้พวกเขากำลังร่วมมือเชิงกลยุทธ์อย่างลึกซึ้งกับ SpaceXAI! การเคลื่อนไหวนี้瞬间ยกระดับการแข่งขันไปสู่ระดับนิยายวิทยาศาสตร์

เป้าหมายของทั้งสองฝ่ายนั้นง่ายและตรงไปตรงมา: เรียกใช้พลังการคำนวณเทียบเท่า H100 หนึ่งล้านตัวในคลัสเตอร์ Colossus 2 โดยตรง เพื่อฝึกโมเดล超大ใหม่ที่มีขนาดการคำนวณเพิ่มขึ้น 10 เท่าตั้งแต่เริ่มต้น!

พลังการคำนวณเทียบเท่า H100 หนึ่งล้านตัวคืออะไร? นี่คือสัตว์ร้ายแห่งพลังการคำนวณที่น่ากลัวที่สุดที่มนุษย์สามารถประกอบขึ้นบนพื้นโลกได้

เมื่อกลไกที่ยอดเยี่ยมของ Cursor รวมกับคลัสเตอร์พลังการคำนวณระดับล้านของ SpaceXAI ความสามารถในการเขียนโปรแกรมอัตโนมัติเต็มรูปแบบของโมเดลรุ่นถัดไปจะวิวัฒนาการไปถึงระดับไหน?

ตั้งแต่วันนี้เป็นต้นไป ด้วยการแพร่หลายอย่างสมบูรณ์ของ Composer 2.5 门槛และประสิทธิภาพของการพัฒนาซอฟต์แวร์จะถูกกำหนดใหม่

ต้นทุนที่ต่ำมากเพียง 2.5 ดอลลาร์ต่อล้าน Token ขาออก หมายความว่าการเขียนโปรแกรม AI จะกลายเป็นเรื่องปกติและเข้าถึงได้สำหรับทุกคนอย่างสมบูรณ์

รีบเปิด Cursor ของคุณ แล้วไปสัมผัส Composer 2.5 ที่แจกเครดิตฟรีสองเท่าในสัปดาห์แรกกันเถอะ

เอกสารอ้างอิง:
https://x.com/cursor_ai/status/2056415413077233983
https://cursor.com/cn/blog/composer-2-5


⚠️ หมายเหตุ: เนื้อหาได้รับการแปลโดย AI และตรวจสอบโดยมนุษย์ หากมีข้อผิดพลาดโปรดแจ้ง

☕ สนับสนุนค่ากาแฟทีมงาน

หากคุณชอบบทความนี้ สามารถสนับสนุนเราได้ผ่าน PromptPay

PromptPay QR
SCAN TO PAY WITH ANY BANK

本文来自网络搜集,不代表คลื่นสร้างอนาคต立场,如有侵权,联系删除。转载请注明出处:https://www.itsolotime.com/th/archives/35452

Like (0)
Previous 3 hours ago
Next 3 hours ago

相关推荐