GPT-5.4 mini เปิดตัวทันทีถูกตั้งคำถาม: ประสิทธิภาพอยู่อันดับที่ 13 แต่ราคาแพงขึ้นสามเท่า

GPT-5.4 mini เปิดตัวเจอคำถามทันที: ประสิทธิภาพอยู่อันดับ 13 แต่ราคาพุ่ง 3 เท่า

โมเดล GPT-5.4 mini ล่าสุดจาก OpenAI เผชิญกับคำถามมากมายในวันเปิดตัววันแรก

จากข้อมูลมาตรฐานการประเมินโมเดลภาษาขนาดใหญ่ Vals ที่เปิดเผยต่อสาธารณะ แสดงให้เห็นว่า GPT-5.4 mini ที่เพิ่งเปิดตัวใหม่นี้อยู่ในอันดับที่ 13 เท่านั้น โดยมีประสิทธิภาพดีกว่า GPT-5 ที่ OpenAI เปิดตัวเมื่อครึ่งปีก่อน

GPT-5.4 mini เปิดตัวทันทีถูกตั้งคำถาม: ประสิทธิภาพอยู่อันดับที่ 13 แต่ราคาแพงขึ้นสามเท่า

ที่น่าสนใจคือ อันดับที่ 12 เป็นของโมเดล Kimi 2.5 ที่เปิดตัวเมื่อปลายเดือนมกราคม เทียบกันแล้ว Kimi 2.5 มีราคาถูกกว่า 5.4 mini ใหม่ถึงกว่าเท่าตัว และมี latency ตอบสนองต่ำกว่า

ในการทดสอบพิสูจน์โทโพโลยีที่ดำเนินการพร้อมกัน โมเดล mini และ nano ใหม่ที่เพิ่งเปิดตัวก็มีผลงานได้เพียงระดับกลางๆ ทั่วโลก โดยอยู่ในอันดับที่ 9 และ 10 ตามลำดับ ซึ่งสู้โมเดลที่เปิดตัวก่อนหน้านี้อย่าง Kimi, Qwen, DeepSeek ไม่ได้

GPT-5.4 mini เปิดตัวทันทีถูกตั้งคำถาม: ประสิทธิภาพอยู่อันดับที่ 13 แต่ราคาแพงขึ้นสามเท่า

มีข้อวิจารณ์ชี้ให้เห็นว่า การเปรียบเทียบการทดสอบมาตรฐานของ GPT-5.4 mini ครั้งนี้ เป็นการเปรียบเทียบกับ GPT-5 mini รุ่นเก่าที่มีความเร็วในการทำงานเร็วกว่าสองเท่า (ซึ่งเป็นเวอร์ชันเมื่อกว่า 7-8 เดือนก่อน) ไม่ใช่กับโมเดลล่าสุดของผู้ผลิตรายอื่น

GPT-5.4 mini เปิดตัวทันทีถูกตั้งคำถาม: ประสิทธิภาพอยู่อันดับที่ 13 แต่ราคาแพงขึ้นสามเท่า

ผู้ใช้จำนวนไม่น้อยถึงกับพูดตรงๆ ว่า การเปลี่ยนมาใช้ GPT-5.4 mini ใหม่ “ดูเหมือนจะไม่จำเป็น”

GPT-5.4 mini เปิดตัวทันทีถูกตั้งคำถาม: ประสิทธิภาพอยู่อันดับที่ 13 แต่ราคาแพงขึ้นสามเท่า

แม้บล็อกทางการของ OpenAI จะระบุว่า ในแง่ของ output tokens เวอร์ชัน mini ที่มีประสิทธิภาพใกล้เคียงกันนั้นถูกกว่า GPT-5.4 ถึงสามเท่า ส่วนเวอร์ชัน nano ถูกกว่าเกือบสิบสองเท่า

แต่หากเปรียบเทียบ GPT-5.4 mini กับ GPT-5 mini รุ่นเก่า จะพบว่าโมเดลที่อยู่ในระดับ mini เหมือนกัน แต่ราคากลับเพิ่มขึ้นประมาณสามเท่า

GPT-5.4 mini เปิดตัวทันทีถูกตั้งคำถาม: ประสิทธิภาพอยู่อันดับที่ 13 แต่ราคาแพงขึ้นสามเท่า

กล่าวได้ว่า ในกระแสความนิยมโมเดลขนาดใหญ่ในปัจจุบัน ผู้ผลิตทั่วโลกมีแนวโน้มขึ้นราคาโดยทั่วไป และ Sam Altman ซีอีโอของ OpenAI ก็เห็นได้ชัดว่าไม่อาจเป็นข้อยกเว้น

ถ้าอย่างนั้น นี่หมายความว่า OpenAI เพียงแค่เปิดตัวโมเดลขนาดเล็กที่ได้รับการปรับแต่งให้เหมาะกับงานด้านการเขียนโปรแกรมและเอเจนต์อัจฉริยะเท่านั้นหรือไม่?

โมเดล mini และ nano เวอร์ชันใหม่

วันนี้ OpenAI ได้เปิดตัวโมเดล GPT-5.4 mini และ nano ที่เน้นความเร็วและประหยัด โดยอ้างว่าปรับแต่งให้เหมาะกับงาน การเขียนโปรแกรม, การดำเนินการทางคอมพิวเตอร์, ความเข้าใจหลายรูปแบบ และงาน ซับเอเจนต์ (subagent) เป็นพิเศษ

GPT-5.4 mini เปิดตัวทันทีถูกตั้งคำถาม: ประสิทธิภาพอยู่อันดับที่ 13 แต่ราคาแพงขึ้นสามเท่า

เมื่อเทียบกับ GPT-5 mini รุ่นก่อน mini และ nano เวอร์ชันใหม่มีประสิทธิภาพที่ดีขึ้น พร้อมกับ ความเร็วในการทำงานเพิ่มขึ้นกว่า 2 เท่า

GPT-5.4 mini เปิดตัวทันทีถูกตั้งคำถาม: ประสิทธิภาพอยู่อันดับที่ 13 แต่ราคาแพงขึ้นสามเท่า

ที่น่าสนใจคือ ในการประเมินหลายครั้ง ช่องว่างด้านประสิทธิภาพระหว่างโมเดล mini/nano กับ GPT-5.4 เวอร์ชันเต็มนั้นไม่มากแล้ว โดยพื้นฐานแล้วอยู่ในระดับเดียวกับโมเดลน้ำหนักเบาของ Google และ Anthropic

GPT-5.4 mini เปิดตัวทันทีถูกตั้งคำถาม: ประสิทธิภาพอยู่อันดับที่ 13 แต่ราคาแพงขึ้นสามเท่า

ตามบล็อกทางการของ OpenAI โมเดลใหม่นี้มุ่งเน้นไปที่งานด้านการเขียนโปรแกรมและงานซับเอเจนต์เป็นหลัก

GPT-5.4 mini เปิดตัวทันทีถูกตั้งคำถาม: ประสิทธิภาพอยู่อันดับที่ 13 แต่ราคาแพงขึ้นสามเท่า

โดย GPT-5.4 mini ได้รับการปรับแต่งให้เหมาะกับงานด้านการเขียนโปรแกรม, การให้เหตุผล, ความเข้าใจหลายรูปแบบ และการใช้เครื่องมือ มีความเร็วในการทำงานเพิ่มขึ้นกว่า 2 เท่า และมีผลงานในการประเมินอย่าง SWE-Bench Pro และ OSWorld-Verified ใกล้เคียงกับ GPT-5.4 เวอร์ชันเต็ม

GPT-5.4 mini เปิดตัวทันทีถูกตั้งคำถาม: ประสิทธิภาพอยู่อันดับที่ 13 แต่ราคาแพงขึ้นสามเท่า

GPT-5.4 nano เป็นเวอร์ชันที่เล็กที่สุดและประหยัดที่สุดในตระกูล GPT-5.4 เหมาะสำหรับงานที่อ่อนไหวต่อความเร็วและต้นทุน เช่น การจำแนกประเภท, การดึงข้อมูล, การเรียงลำดับ และการจัดการงานช่วยเหลือการเขียนโปรแกรมที่ค่อนข้างง่าย

โดยรวมแล้ว โมเดลใหม่ทั้งสองนี้เหมาะสำหรับเวิร์กโหลดที่ latency ส่งผลกระทบโดยตรงต่อประสบการณ์การใช้ผลิตภัณฑ์ เช่น ผู้ช่วยด้านโค้ด, ซับเอเจนต์, การวิเคราะห์ภาพหน้าจอ และแอปพลิเคชันหลายรูปแบบ

พูดง่ายๆ คือ สำหรับเอเจนต์อัจฉริยะที่ได้แยกทักษะเฉพาะออกมาแล้ว (เช่น กระบวนการอัตโนมัติบางอย่าง) การนำไปใช้งานบนโมเดลเล็กที่ตอบสนองเร็วและมีความสามารถเพียงพอนั้นคุ้มค่ากว่ามากในแง่ต้นทุน

ในแง่วิธีการใช้งาน GPT-5.4 mini สามารถเรียกใช้ผ่าน API, Codex และ ChatGPT ได้ ส่วนเวอร์ชัน nano ขณะนี้สามารถใช้ได้ผ่าน API เท่านั้น

ด้านราคา เวอร์ชัน mini มีราคา 0.75 ดอลลาร์ต่อ input tokens 1 ล้านตัว และ 4.5 ดอลลาร์ต่อ output tokens 1 ล้านตัว ส่วนเวอร์ชัน nano มีราคาถูกกว่าใน API โดยคิดราคา 0.2 ดอลลาร์และ 1.25 ดอลลาร์ต่อ input/output tokens 1 ล้านตัว ตามลำดับ

อย่างไรก็ตาม เมื่อเปรียบเทียบในแนวนอน มีผู้ใช้เน็ตชี้ว่า โมเดล Gemini Flash 3 lite มีความฉลาดมากกว่า และมีต้นทุนโดยรวมถูกกว่ากว่าหกเท่า

GPT-5.4 mini เปิดตัวทันทีถูกตั้งคำถาม: ประสิทธิภาพอยู่อันดับที่ 13 แต่ราคาแพงขึ้นสามเท่า

ผลการประเมิน

ในการประเมินจริง โมเดล mini และ nano ได้รับการปรับแต่งให้เหมาะกับงานด้านการเขียนโปรแกรมและงานเอเจนต์อัจฉริยะเป็นหลัก

ในงานเขียนโปรแกรม พวกมันสามารถแก้ไขโค้ด, วนลูปดีบัก และนำทางไลบรารีด้วย latency ต่ำ ทำให้สามารถทำซ้ำได้อย่างรวดเร็ว จัดการเวิร์กโฟลว์ที่ต้องคำนึงถึงทั้งความเร็วและต้นทุนได้อย่างมีประสิทธิภาพ อัตราการผ่านงานของเวอร์ชัน mini ใกล้เคียงกับ GPT-5.4 ในขณะที่เร็วกว่า

GPT-5.4 mini เปิดตัวทันทีถูกตั้งคำถาม: ประสิทธิภาพอยู่อันดับที่ 13 แต่ราคาแพงขึ้นสามเท่า

ในสถานการณ์ซับเอเจนต์ นักพัฒนาสามารถให้โมเดลขนาดใหญ่รับผิดชอบการตัดสินใจและการวางแผน ในขณะที่มอบหมายงานย่อยที่เล็กกว่าอย่างขนานให้ซับเอเจนต์ mini ดำเนินการ เช่น การค้นหาฐานข้อมูลโค้ด, การประมวลผลเอกสาร หรือการช่วยเหลือการดำเนินการ เมื่อโมเดลขนาดเล็กมีความเร็วมากขึ้นเรื่อยๆ แบบจำลองนี้ก็ยิ่งมีคุณค่ามากขึ้น

ในการดำเนินการทางคอมพิวเตอร์และงานหลายรูปแบบ mini ก็ทำได้ดีเช่นกัน สามารถวิเคราะห์ภาพหน้าจออินเทอร์เฟซผู้ใช้ที่ซับซ้อนได้อย่างรวดเร็ว ดำเนินการตามคำสั่งได้อย่างมีประสิทธิภาพ ในการทดสอบ OSWorld-Verified ผลงานของมันเกือบจะใกล้เคียงกับ GPT-5.4 เวอร์ชันเต็ม ในขณะที่เหนือกว่า GPT-5 mini อย่างเห็นได้ชัด

GPT-5.4 mini เปิดตัวทันทีถูกตั้งคำถาม: ประสิทธิภาพอยู่อันดับที่ 13 แต่ราคาแพงขึ้นสามเท่า

การทดสอบจริงโดยผู้ใช้เน็ตบางส่วนก็ยืนยันจุดเด่นดังกล่าว

ผู้ใช้ Reddit ชื่อ Rent_South ได้ทดสอบ mini เวอร์ชันใหม่อย่างเป็นระบบในงานจำแนกประเภท, สรุป, แปลภาษา และอื่นๆ และให้คำวิจารณ์ในเชิงบวก:

ผมรันการทดสอบมาตรฐานบางส่วน และพบว่า — ในงานสถานการณ์จริงบางอย่าง พวกมันถูกกว่า, เร็วกว่า และใช้งานได้ดีกว่า
ตั้งแต่ประมาณหนึ่งปีก่อน ตอนที่ผมสร้าง RAG pipeline และ gpt-4.1-mini เอาชนะ GPT-4 เวอร์ชันดั้งเดิมได้ในบางขั้นตอนงานเอเจนต์ ความกระตือรือร้นของผมที่มีต่อเวอร์ชัน mini/nano ก็สูงกว่าเวอร์ชันดั้งเดิมเสียอีก

ในงานจำแนกประเภท nano มีความแม่นยำถึง 70% โดยมีต้นทุนต่ำกว่า GPT-5.4 สิบสองเท่า

GPT-5.4 mini เปิดตัวทันทีถูกตั้งคำถาม: ประสิทธิภาพอยู่อันดับที่ 13 แต่ราคาแพงขึ้นสามเท่า

เมื่อจำนวนการเรียกใช้เกินหนึ่งหมื่นครั้ง การใช้ GPT-5.4 จะมีค่าใช้จ่ายประมาณ 20.30 ดอลลาร์ ในขณะที่การใช้ GPT-5.4-nano ใช้เพียง 1.64 ดอลลาร์ ช่วยประหยัดได้ประมาณ 91.9%

ในงานแปลภาษา nano ได้คะแนนต่ำกว่าเล็กน้อยที่ 55 คะแนน แต่ช่องว่างกับ GPT-5.4 ที่ได้ 63 คะแนนนั้นไม่มากนัก และยังสามารถใช้เป็นทางเลือกทดแทนได้ หลังจากการเรียกใช้เกินหมื่นครั้ง ยังคงประหยัดได้ถึง 91.3%

GPT-5.4 mini เปิดตัวทันทีถูกตั้งคำถาม: ประสิทธิภาพอยู่อันดับที่ 13 แต่ราคาแพงขึ้นสามเท่า

ในงานเขียน เวอร์ชัน mini ได้คะแนนสูงสุด โดยมีต้นทุนต่ำกว่าเวอร์ชันเต็มประมาณ 60% เมื่อการเรียกใช้เกิน 1 หมื่นครั้ง mini ใช้เงิน 29.61 ดอลลาร์ ส่วน nano ใช้เพียง 10.30 ดอลลาร์

GPT-5.4 mini เปิดตัวทันทีถูกตั้งคำถาม: ประสิทธิภาพอยู่อันดับที่ 13 แต่ราคาแพงขึ้นสามเท่า

นอกจากนี้ ยังมีผู้ใช้เน็ตทดสอบความสามารถของโมเดลในการอธิบายภาพ nano สามารถอธิบายภาพถ่ายในพิพิธภัณฑ์ได้อย่างละเอียดและแม่นยำ โดยใช้ token น้อยมาก ต้นทุนทั้งหมดน้อยกว่า 1 เซ็นต์เสียอีก

ตัวอย่างเช่น ผู้ใช้รายนี้ให้โมเดล nano อธิบายภาพถ่ายในพิพิธภัณฑ์ที่ถ่ายแบบสะเปะสะปะ:

GPT-5.4 mini เปิดตัวทันทีถูกตั้งคำถาม: ประสิทธิภาพอยู่อันดับที่ 13 แต่ราคาแพงขึ้นสามเท่า

โมเดล nano ให้คำอธิบายดังนี้:

ภาพแสดงภายในห้องจัดแสดงของพิพิธภัณฑ์ มีผนังจัดแสดงยาว ผนังอิฐสีขาวมีภาพบุคคลกรอบรูปแขวนเรียงรายเป็นระเบียบ ใต้ภาพบุคคลมีตู้โชว์กระจกหลายตู้ กรอบไม้สีเข้ม ด้านบน/ด้านหน้าเป็นกระจก ภายในตู้โชว์มีวัตถุทางประวัติศาสตร์และอุปกรณ์ต่างๆ วางอยู่ พื้นห้องปูด้วยไม้ขัดเงา เพดานมีโคมไฟแขวนและสายไฟ สามารถเห็นท่อจำนวนเล็กน้อยใกล้กับส่วนบนของผนัง ด้านหน้า ตู้กระจกที่เรียงตามความยาวของห้องสะท้อนภาพของสิ่งของจากพื้นที่จัดแสดงอื่นๆ

การสร้างคำอธิบายนี้ใช้ input tokens ทั้งหมด 2751 ตัว และ output tokens 112 ตัว ค่าใช้จ่าย 0.069 เซ็นต์ (น้อยกว่าหนึ่งในสิบของ 1 เซ็นต์)

แม้ในงานสร้างสรรค์ เช่น การสร้างภาพ SVG ของ “นกกระทุงขี่จักรยาน” nano และ mini ยังคงมีช่องว่างกับ GPT-5.4 เวอร์ชันเต็มอยู่บ้าง แต่พวกมันก็สามารถทำงานสร้างสรรค์พื้นฐานได้อย่างแน่นอน อย่างน้อยเมื่อความเข้มข้นของการให้เหตุผลเพิ่มขึ้น ภาพที่สร้างขึ้นก็ยังคงมีความถูกต้องค่อนข้างดี

GPT-5.4 mini เปิดตัวทันทีถูกตั้งคำถาม: ประสิทธิภาพอยู่อันดับที่ 13 แต่ราคาแพงขึ้นสามเท่า

โดยรวมแล้ว เมื่อเทียบกับผลิตภัณฑ์ของ OpenAI เอง โมเดลใหม่ครั้งนี้มีจุดที่น่าสนใจอยู่

แต่นี่คือโมเดลเล็กที่ดีที่สุดและประหยัดที่สุดในตลาดหรือไม่ ยังคงเป็นที่ถกเถียงกันได้

อีกหนึ่งปรากฏการณ์

ที่น่าสนใจคือ ในส่วนความคิดเห็นของทวีตประกาศโมเดลใหม่โดย Greg Brockman ประธาน OpenAI การอภิปรายที่ร้อนแรงที่สุดกลับไม่เกี่ยวกับความสามารถหรือราคาของโมเดลใหม่เลย และแทบจะไม่เกี่ยวข้องกับโมเดลใหม่เองด้วยซ้ำ

GPT-5.4 mini เปิดตัวทันทีถูกตั้งคำถาม: ประสิทธิภาพอยู่อันดับที่ 13 แต่ราคาแพงขึ้นสามเท่า

ส่วนความคิดเห็นเกือบจะถูกท่วมด้วยข้อความแฮชแท็ก #keep4o: “ให้ 4o กลับมา!”

GPT-5.4 mini เปิดตัวทันทีถูกตั้งคำถาม: ประสิทธิภาพอยู่อันดับที่ 13 แต่ราคาแพงขึ้นสามเท่า
GPT-5.4 mini เปิดตัวทันทีถูกตั้งคำถาม: ประสิทธิภาพอยู่อันดับที่ 13 แต่ราคาแพงขึ้นสามเท่า
GPT-5.4 mini เปิดตัวทันทีถูกตั้งคำถาม: ประสิทธิภาพอยู่อันดับที่ 13 แต่ราคาแพงขึ้นสามเท่า

ลิงก์อ้างอิง:
[1] https://x.com/gdb/status/2034003374627049909
[2] https://simonwillison.net/2026/Mar/17/mini-and-nano/
[3] https://www.reddit.com/r/OpenAI/comments/1rwd9hd/breaking_openai_just_dropped_gpt54_mini_and_nano/
[4] https://x.com/scaling01/status/2033958931874099560

ยินดีต้อนรับความคิดเห็นของคุณในส่วนความคิดเห็น!

จบ

GPT-5.4 mini เปิดตัวทันทีถูกตั้งคำถาม: ประสิทธิภาพอยู่อันดับที่ 13 แต่ราคาแพงขึ้นสามเท่า


⚠️ หมายเหตุ: เนื้อหาได้รับการแปลโดย AI และตรวจสอบโดยมนุษย์ หากมีข้อผิดพลาดโปรดแจ้ง

本文来自网络搜集,不代表คลื่นสร้างอนาคต立场,如有侵权,联系删除。转载请注明出处:http://www.itsolotime.com/th/archives/26360

Like (0)
Previous 3 hours ago
Next 3 hours ago

相关推荐