โมเดลขนาดเล็ก
-
โมเดลขนาดเล็ก 3B กลับมาสู้ยักษ์ใหญ่ระดับล้านล้าน: Nanbeige4.1-3B คว้าชัยด้วยกลยุทธ์ “เล็กแต่ครบ” ในการแข่งขันด้านโมเดล AI ขนาดใหญ่ได้อย่างไร?
ในอดีต GPT-2 ที่มีพารามิเตอร์ประมาณ 1.5 พันล้านตัว ในมุมมองปัจจุบันถือเป็น “โมเดลเล็ก” แล้ว ส่วนขนาดพารามิเตอร์ของ GPT-4 ตามการประมาณการในอุตสาหกรรมนั้นสูงถึงระดับล้านล…
-
Alibaba Qwen3.5 มินิโมเดลเปิดตัวอย่างน่าตื่นเต้น: พารามิเตอร์เพียง 0.8B ก็สามารถประมวลผลวิดีโอได้ ยุค AI ขอบอุปกรณ์เริ่มต้นอย่างเป็นทางการแล้ว!
อาลีถงอี้เฉียนเวิ่นเปิดตัวโมเดลขนาดพารามิเตอร์เล็กซีรีส์ Qwen3.5 ทั้งหมด 4 รุ่น ได้แก่ 0.8B, 2B, 4B และ 9B แกนหลักนวัตกรรมของซีรีส์นี้อยู่ที่การนำกลไกความสนใจแบบผสม Gated DeltaNet …