Google Gemini 3.1 Flash-Lite เปิดตัวอย่างยิ่งใหญ่: ราชาแห่งความคุ้มค่า ราคาเพียง 0.25 ดอลลาร์ต่อล้านโทเคน

2026年3月4日 pm8:39 • ข่าวสารอุตสาหกรรม AI • 200 views

กูเกิลเปิดตัว Gemini 3.1 Flash-Lite: มุ่งเน้นน้ำหนักเบา ความเร็วสูง และราคาประหยัดสุดขีด

กูเกิลได้เปิดตัวโมเดล Gemini 3.1 Flash-Lite อย่างเป็นทางการ เมื่อไม่นานมานี้ จากชื่อเรียกทำให้ทราบว่าโมเดลนี้มุ่งเน้นที่ความเบาและความเร็วสูง บริษัทกำหนดตำแหน่งให้เป็นโมเดลที่มี อัตราส่วนประสิทธิภาพต่อราคาสูงที่สุด ในซีรีส์ Gemini 3 เท่าที่มีมา

Google Gemini 3.1 Flash-Lite เปิดตัวอย่างยิ่งใหญ่: ราชาแห่งความคุ้มค่า ราคาเพียง 0.25 ดอลลาร์ต่อล้านโทเคน

ราคาของมันมีความสามารถในการแข่งขันสูง: อินพุตโทเค็นล้านตัวมีค่าใช้จ่ายเพียง 0.25 ดอลลาร์สหรัฐ ส่วนเอาต์พุตโทเค็นล้านตัวอยู่ที่ 1.5 ดอลลาร์สหรัฐ เพื่อเป็นข้อมูลอ้างอิง ด้วยต้นทุนเพียงประมาณ 1.8 หยวน (ประมาณ 9 บาท) ก็สามารถให้ AI ประมวลผลข้อความที่มีความยาวเทียบเท่ากับนิยายชุด “สามกาย” ทั้งสามเล่มได้

ในด้านประสิทธิภาพ เมื่อเทียบกับโมเดลหลักรุ่นก่อนหน้า Gemini 2.5 Flash เวลาในการตอบสนองโทเค็นแรกของมันเร็วกว่า 2.5 เท่า และความเร็วในการส่งออกเพิ่มขึ้น 45% โมเดลนี้ออกแบบมาเพื่อ แอปพลิเคชันอัจฉริยะขนาดใหญ่ โดยมีเป้าหมายเพื่อให้สามารถใช้งานได้ในปริมาณมากด้วยต้นทุนต่ำและประสิทธิภาพสูง

วิเคราะห์อัตราส่วนประสิทธิภาพต่อราคาสุดขีด

Gemini 3.1 Flash-Lite เป็นโมเดลที่เร็วที่สุดและมีต้นทุนต่ำที่สุดในซีรีส์ Gemini 3 ขณะนี้มีให้บริการผ่าน Gemini API ใน Google AI Studio และแพลตฟอร์ม Vertex AI แล้ว

ในการทดสอบมาตรฐาน Artificial Analysis ความเร็วในการส่งออกของมันดีกว่า Gemini 2.5 Flash อย่างเห็นได้ชัด ในขณะที่ราคาลดลงอย่างมาก

ควรระบุว่า บริษัทไม่ได้เปรียบเทียบโดยตรงกับ Gemini 3 Flash แต่เลือกใช้รุ่น Gemini 2.5 Flash ที่เก่ากว่าแทน ทั้งสองมีตำแหน่งที่แตกต่างกัน: Gemini 3 Flash มุ่งเน้นที่ประสิทธิภาพการให้เหตุผลเชิงตรรกะ ในขณะที่ Gemini 3.1 Flash-Lite ให้ความสำคัญกับอัตราส่วนประสิทธิภาพต่อราคาสุดขีดมากกว่า

เมื่อเทียบกับโมเดลน้ำหนักเบาอื่นๆ ในตลาด (เช่น GPT-5 mini, Claude 4.5 Haiku) Gemini 3.1 Flash-Lite แสดงให้เห็นถึงข้อได้เปรียบที่ชัดเจนทั้งในด้านความเร็วและต้นทุน

ในการประเมิน Arena โมเดลนี้ได้คะแนน 1432 คะแนน ซึ่งอยู่ในระดับเดียวกับ Grok-4.1-fast มีประสิทธิภาพโดดเด่นในงานเขียนเชิงสร้างสรรค์และงานค้นหาข้อมูลยาว นำหน้าอันดับโมเดลในระดับราคาต่ำ ส่วน Gemini-3.1 Pro ยังคงอยู่ในกลุ่มแรกของรุ่นราคาสูงอย่างต่อเนื่อง และ Gemini 3 Flash อยู่ในตำแหน่งกลาง

ใน Code Arena มันอยู่ในอันดับที่ 35 ร่วมกับ Qwen3-coder แสดงให้เห็นถึงความสามารถในการพัฒนาเว็บอัจฉริยะที่ยอดเยี่ยม

นอกจากนี้ ในแบบทดสอบมาตรฐาน GPQA Diamond และ MMMU Pro Gemini 3.1 Flash-Lite ได้คะแนน 86.9% และ 76.8% ตามลำดับ ซึ่งสูงกว่าโมเดล Gemini รุ่นก่อนหน้าที่มีขนาดใหญ่กว่า

นอกจากประสิทธิภาพพื้นฐานแล้ว โมเดลนี้ยังรองรับ ระดับการคิดที่ปรับได้ นักพัฒนาสามารถปรับความลึกของการคิดของโมเดลได้อย่างยืดหยุ่นตามความซับซ้อนของงาน ดังนั้นในสถานการณ์ที่ต้องจัดการคำขอจำนวนมากและความถี่สูง จึงสามารถ สร้างสมดุลระหว่างความเร็วและผลลัพธ์ ได้ดีขึ้น

นี่หมายความว่าโมเดลนี้สามารถจัดการงานปริมาณมากต้นทุนต่ำ (เช่น การแปลข้อความยาว) และยังสามารถทำงานที่ต้องใช้การคิดเชิงลึกได้ (เช่น การสร้างอินเทอร์เฟซผู้ใช้ การดำเนินการคำสั่งตรรกะที่ซับซ้อน) ตัวอย่างจากบริษัทแสดงให้เห็นว่ามันสามารถกรอกข้อมูลผลิตภัณฑ์หลายร้อยประเภทที่แตกต่างกันลงในโครงร่างเว็บไซต์อีคอมเมิร์ซได้อย่างรวดเร็ว

โดยสรุป โมเดลนี้เหมาะสำหรับองค์กรและนักพัฒนาในการประมวลผลงานขนาดใหญ่และการตอบสนองแบบเรียลไทม์ในสภาพแวดล้อมการผลิต อัตราส่วนประสิทธิภาพต่อราคาสูงของมันเป็นข้อได้เปรียบหลักในการแข่งขัน

GPT ตอบสนองอย่างรวดเร็ว

หลังจาก Gemini 3.1 Flash-Lite เปิดตัวเพียงสองชั่วโมง ChatGPT ก็เปิดตัว GPT-5.3 Instant อย่างรวดเร็วเพื่อเป็นการตอบโต้

โมเดลนี้มุ่งเน้นการตอบสนองที่รวดเร็วเช่นกัน แต่จุดเน้นอยู่ที่การปรับปรุงประสบการณ์การโต้ตอบของผู้ใช้ ตามคำแนะนำอย่างเป็นทางการ GPT-5.3 Instant สามารถให้คำตอบที่แม่นยำยิ่งขึ้น และเมื่อค้นหาผ่านอินเทอร์เน็ตจะให้ผลลัพธ์ที่มีข้อมูลสมบูรณ์กว่าและสอดคล้องกับบริบทมากขึ้น เป็นเวอร์ชันที่ปรับให้เหมาะสมสำหรับการสนทนาประจำวัน

มีผู้ใช้ทดสอบเปรียบเทียบโมเดลทั้งสองแบบจริง ใน การทดสอบการเขียนโปรแกรม เอาต์พุตของ Gemini 3.1 Flash-Lite กระชับและตรงไปตรงมา ดำเนินการฟังก์ชันหลักของแบ็กเอนด์ด้วยไฟล์เดียว ทำให้รันได้เร็ว ไม่มีเนื้อหาเกินจำเป็น ในขณะที่โซลูชันโค้ดที่ GPT-5.3 Instant ให้มาสมบูรณ์และเป็นระบบทางวิศวกรรมมากกว่า ใกล้เคียงกับสถานการณ์การใช้งานจริงมากกว่า เช่น ข้อมูลแดชบอร์ดสามารถรีเฟรชอัตโนมัติแบบเรียลไทม์ได้

| Google Gemini 3.1 Flash-Lite เปิดตัวอย่างยิ่งใหญ่: ราชาแห่งความคุ้มค่า ราคาเพียง 0.25 ดอลลาร์ต่อล้านโทเคน
—|—
Gemini 3.1 Flash-Lite | GPT-5.3 Instant

ในงาน การให้เหตุผลเชิงลึก ทั้งสองมีประสิทธิภาพใกล้เคียงกัน สามารถให้ผลลัพธ์ที่ถูกต้องและมีกระบวนการให้เหตุผลที่ชัดเจน Gemini 3.1 Flash-Lite ใช้สูตรฟิสิกส์ที่ซับซ้อนได้อย่างถูกต้อง โครงสร้างการตอบกลับสมบูรณ์ ให้ข้อสรุปสั้นๆ ก่อนแล้วจึงอธิบายด้วยคณิตศาสตร์ GPT-5.3 Instant ก็ทำการให้เหตุ理由เสร็จสมบูรณ์เช่นกัน และยังให้ตารางและคำอธิบายที่เข้าใจง่ายเพิ่มเติม ทำให้ผลลัพธ์เข้าใจได้ง่ายขึ้น