มหาวิทยาลัยเจียวทงเซี่ยงไฮ้
-
JTok: ขยายมิติใหม่ให้โมเดลขนาดใหญ่! มหาวิทยาลัยเจียวทงเซี่ยงไฮ้เสนอพารามิเตอร์ token-indexed เพิ่มประสิทธิภาพโดยไม่ต้องใช้พลังคำนวณเพิ่ม
ความท้าทายในการขยายขนาดโมเดลใหญ่ การพัฒนาของโมเดลใหญ่เป็นเวลานานได้ปฏิบัติตามกฎเหล็ก: ตาม Scaling Law เพิ่มพารามิเตอร์และข้อมูล ประสิทธิภาพของโมเดลจะเพิ่มขึ้นอย่างต่อเนื่องตามกฎกำล…