ยามดึก สองยักษ์ใหญ่แห่งวงการเทคโนโลยีอย่าง Google และ OpenAI ได้ทยอยเปิดตัวโมเดลภาษาขนาดใหญ่รุ่นใหม่ที่เบากว่า: Gemini 3.1 Flash-Lite และ GPT‑5.3 Instant เพื่อแข่งขันกันโดยตรงในด้านความคุ้มค่าและประสิทธิภาพหลัก
Gemini 3.1 Flash-Lite ที่ Google เปิดตัวนั้นถูกกำหนดให้เป็นโมเดลที่มีประสิทธิภาพด้านต้นทุนสูงสุดในตระกูล Gemini 3 ออกแบบมาสำหรับงานอัจฉริยะขนาดใหญ่ โดยมีราคาอยู่ที่ 0.25 ดอลลาร์สหรัฐต่อล้านโทเค็นสำหรับอินพุต และ 1.50 ดอลลาร์สหรัฐต่อล้านโทเค็นสำหรับเอาต์พุต Google อ้างว่าโมเดลนี้สามารถให้ประสิทธิภาพที่เพิ่มขึ้นอย่างมีนัยสำคัญในขณะที่ต้นทุนต่ำกว่าโมเดลขนาดใหญ่อย่างมาก
จากการทดสอบมาตรฐานของ Artificial Analysis เมื่อเทียบกับ Gemini 2.5 Flash แล้ว Gemini 3.1 Flash-Lite มีเวลาในการตอบสนองโทเค็นแรก (TTFT) เร็วกว่า 2.5 เท่า และความเร็วในการส่งออกเพิ่มขึ้น 45% ในขณะที่ยังคงรักษาคุณภาพของเอาต์พุตให้เท่าเทียมหรือดีกว่า

ในทางกลับกัน GPT‑5.3 Instant ของ OpenAI ได้รับการปรับปรุงเพื่อประสบการณ์การสนทนาที่ดีขึ้น โดยเน้นการปรับปรุงความธรรมชาติของน้ำเสียง ความเกี่ยวข้อง และความลื่นไหลของการสนทนา พร้อมทั้งลดอัตราการปฏิเสธการตอบของโมเดล ข้อมูลอย่างเป็นทางการแสดงให้เห็นว่า เมื่อเทียบกับรุ่นก่อนหน้า อัตราการเกิดภาพลวงตา (Hallucination) ลดลงสูงถึง 26.8% โมเดลนี้พร้อมให้บริการแล้วใน ChatGPT และ API

ที่น่าสังเกตคือ หลังจากประกาศ GPT-5.3 Instant แล้ว OpenAI ได้บ่งชี้ทันทีว่าวงจรชีวิตของมันอาจจะไม่ยาวนัก โดยระบุบนแพลตฟอร์มโซเชียล X ว่า “GPT-5.4 กำลังจะมาถึงเร็วกว่าที่คุณคิด”

Gemini 3.1 Flash-Lite: สร้างมาสำหรับงานอัจฉริยะขนาดใหญ่
Gemini 3.1 Flash-Lite ที่ Google เปิดตัวในครั้งนี้ เน้นย้ำว่าเป็นสมาชิกที่เร็วที่สุดและมีประสิทธิภาพด้านต้นทุนสูงสุดในตระกูล Gemini 3 ออกแบบมาเพื่อจัดการกับปริมาณงานขนาดใหญ่ของนักพัฒนา
โมเดลนี้เปิดให้นักพัฒนาทดลองใช้งานผ่าน Gemini API ตั้งแต่วันนี้ โดยสามารถใช้ใน Google AI Studio และผู้ใช้ระดับองค์กรก็สามารถเข้าถึงผ่าน Vertex AI ได้เช่นกัน
ประสิทธิภาพด้านต้นทุนและสมรรถนะขั้นสุด
ราคาอย่างเป็นทางการอยู่ที่ 0.25 ดอลลาร์สหรัฐต่อล้านโทเค็นสำหรับอินพุต และ 1.50 ดอลลาร์สหรัฐต่อล้านโทเค็นสำหรับเอาต์พุต Google เน้นย้ำว่าโมเดลนี้สามารถให้ประสิทธิภาพที่เพิ่มขึ้นอย่างมีนัยสำคัญในขณะที่ต้นทุนต่ำกว่าโมเดลขนาดใหญ่อย่างมาก
การทดสอบมาตรฐานของ Artificial Analysis แสดงให้เห็นว่า เมื่อเทียบกับ Gemini 2.5 Flash แล้ว Gemini 3.1 Flash-Lite มีเวลาในการตอบสนองโทเค็นแรกเร็วกว่า 2.5 เท่า และความเร็วในการส่งออกเพิ่มขึ้น 45% ในขณะที่ยังคงรักษาคุณภาพไว้ ลักษณะความหน่วงต่ำนี้ทำให้เหมาะสำหรับสถานการณ์การใช้งานที่ต้องการการตอบสนองแบบเรียลไทม์

การทดสอบแสดงให้เห็นว่า Gemini 3.1 Flash-Lite มีความเร็วและคุณภาพเหนือกว่า Gemini 2.5 Flash รุ่นก่อนหน้า ในกระดานคะแนน Arena.ai ได้คะแนน Elo ถึง 1432 ในแบบทดสอบมาตรฐานด้านการให้เหตุผลและการทำความเข้าใจหลายรูปแบบ เช่น GPQA Diamond (86.9%) และ MMMU Pro (76.8%) โมเดลนี้มีประสิทธิภาพเหนือกว่าโมเดลในระดับเดียวกัน และยังแซงหน้า Gemini 2.5 Flash รุ่นก่อนหน้าที่มีขนาดใหญ่กว่าด้วย

ปัญญาประดิษฐ์แบบปรับได้สำหรับนักพัฒนา
โมเดลนี้รองรับ “ระดับการคิด” ที่ปรับได้โดยค่าเริ่มต้นใน AI Studio และ Vertex AI ช่วยให้นักพัฒนาสามารถปรับสมดุลระหว่างต้นทุน ความเร็ว และความลึกของการให้เหตุผลตามความต้องการของงาน
- งานขนาดใหญ่: เหมาะสำหรับการประมวลผลปริมาณมากที่อ่อนไหวต่อต้นทุน เช่น การแปลขนาดใหญ่ การตรวจสอบเนื้อหา
- เวิร์กโฟลว์ที่ซับซ้อน: สามารถจัดการงานที่ต้องใช้การให้เหตุผลเชิงลึก เช่น การสร้างอินเทอร์เฟซผู้ใช้ การสร้างสภาพแวดล้อมจำลอง การปฏิบัติตามคำสั่งที่ซับซ้อน
ต่อไปนี้คือตัวอย่างการใช้งาน:
- กรอกสินค้าหลายร้อยรายการในหมวดหมู่ต่างๆ ให้กับหน้าเว็บไวร์เฟรมของอีคอมเมิร์ซโดยอัตโนมัติ:
- สร้างแดชบอร์ดสภาพอากาศแบบไดนามิกโดยใช้ข้อมูลเรียลไทม์และข้อมูลย้อนหลัง:
- สร้างเอเจนต์อัจฉริยะสำหรับ SaaS ที่สามารถทำงานหลายขั้นตอนที่ซับซ้อน:
- วิเคราะห์และจัดประเภทเนื้อหาภาพจำนวนมหาศาลอย่างรวดเร็ว:
การประยุกต์ใช้ในอุตสาหกรรมและผลตอบรับเบื้องต้น
ผู้ทดสอบเบื้องต้นบางราย รวมถึงบริษัทต่างๆ เช่น Latitude, Cartwheel และ Whering ได้เริ่มใช้โมเดลนี้เพื่อจัดการกับปัญหาที่ซับซ้อนในระดับใหญ่แล้ว

ผลตอบรับชี้ให้เห็นว่าโมเดลนี้ได้สร้างสมดุลที่ดีระหว่างประสิทธิภาพและความสามารถในการให้เหตุผล สามารถประมวลผลอินพุตที่ซับซ้อนได้อย่างแม่นยำเหมือนโมเดลขนาดใหญ่ และปฏิบัติตามคำสั่งอย่างสม่ำเสมอ พร้อมทั้งรักษาความสม่ำเสมอของเอาต์พุต
GPT‑5.3 Instant: ปรับปรุงประสบการณ์การสนทนาประจำวัน
ในฐานะเวอร์ชันล่าสุดของ ChatGPT GPT‑5.3 Instant มีเป้าหมายเพื่อมอบประสบการณ์การสนทนาประจำวันที่เสถียรกว่า ใช้งานได้จริงกว่า และลื่นไหลกว่า การปรับปรุงเน้นที่ความรู้สึกในการใช้งานจริงมากกว่าคะแนนมาตรฐาน
การปรับปรุงที่เฉพาะเจาะจงรวมถึง: ให้คำตอบที่แม่นยำกว่า; เมื่อใช้การค้นหาผ่านอินเทอร์เน็ต สามารถให้ผลลัพธ์ที่หลากหลายและมีบริบทมากกว่า; ลดการตอบสนองที่ไม่ได้ช่วยเหลือ การแจ้งข้อจำกัดความรับผิดชอบที่มากเกินไป หรือการแสดงออกที่ด่วนสรุด
กลยุทธ์การตอบสนองที่สมเหตุสมผลกว่า
เมื่อเทียบกับรุ่นก่อนหน้า GPT-5.3 Instant ลดการปฏิเสธการตอบที่ไม่จำเป็นลงอย่างมีนัยสำคัญ และลดการแจ้งข้อจำกัดความรับผิดชอบที่ป้องกันตัวเกินไปหรือมีลักษณะสั่งสอนก่อนให้คำตอบ สำหรับคำถามที่เหมาะสม โมเดลจะให้คำตอบโดยตรงมากขึ้น
คำตอบจากการค้นหาผ่านอินเทอร์เน็ตที่มีคุณภาพกว่า
โมเดลปรับปรุงความสามารถในการบูรณาการข้อมูลจากอินเทอร์เน็ต สามารถปรับสมดุลระหว่างผลการค้นหาและการให้เหตุผลจากความรู้ของตัวเองได้ดีขึ้น เมื่อทำงานเช่นการตีความข่าว จะอธิบายพร้อมบริบท แทนที่จะเพียงแจกแจงลิงก์ โมเดลเข้าใจความหมายแฝงของคำถามได้ดีกว่า นำเสนอข้อมูลสำคัญเป็นลำดับแรก ทำให้คำตอบมีความเกี่ยวข้องและใช้งานง่ายมากขึ้น โดยไม่เสียสละความเร็วในการตอบสนองและน้ำเสียงการสนทนา
ตัวอย่างเช่น สำหรับคำถาม “การเซ็นสัญญาที่ใหญ่ที่สุดในฤดูกาลปิดฤดูกาล MLB 2025-26 และผลกระทบต่อโครงสร้างระยะยาว”:


การเปรียบเทียบแสดงให้เห็นว่าคำตอบของ GPT-5.3 Instant มีความทันสมัยกว่า ระบุการเซ็นสัญญาล่าสุดที่มีผลกระทบระยะยาวได้อย่างแม่นยำ และวางไว้ในบริบทมหภาคของแนวโน้มลีก (เช่น การรวมศูนย์ความสามารถ) และการเจรจาระหว่างแรงงานและนายจ้าง ในขณะที่คำตอบสำหรับการเปรียบเทียบค่อนข้างล้าสมัยและมีความเกี่ยวข้องน้อยกว่า
สไตล์การสนทนาที่ลื่นไหลกว่า
โมเดลมีน้ำเสียงการสนทนาที่เป็นธรรมชาติและลื่นไหลกว่า
การปรับปรุงสไตล์การสนทนา
น้ำเสียงการสนทนาของ GPT-5.2 Instant บางครั้งอาจดูแข็งทื่อหรือแข็งกร้าวเกินไป และอาจคาดการณ์ความตั้งใจและอารมณ์ของผู้ใช้ไม่ถูกต้อง
GPT-5.3 Instant นำมาซึ่งประสบการณ์การสนทนาที่เป็นธรรมชาติและมีสมาธิมากกว่า โมเดลลดการแสดงออกแบบประกาศตามรูปแบบและประโยคชี้นำ เช่น “หยุดก่อน ลองหายใจลึกๆ” ทำให้การสื่อสารลื่นไหลขึ้น ผู้ใช้ยังสามารถปรับสไตล์น้ำเสียงของโมเดลในการตั้งค่าได้ เช่น ระดับความอบอุ่นหรือความกระตือรือร้นในการแสดงออก
ตัวอย่าง: ผู้ใช้ถามว่า “ทำไมฉันถึงหาความรักไม่ได้ในซานฟรานซิสโก?”


การวิเคราะห์เปรียบเทียบ: GPT-5.3 Instant เข้าสู่หัวใจของปัญหาเพื่อแก้ไขโดยตรง หลีกเลี่ยงคำนำที่ปลอบโยนแต่ไม่ได้ช่วยเหลือเชิงสาระ เช่น “คุณไม่มีปัญหา และนี่ก็ไม่ใช่แค่เพราะคุณ” การตอบสนองมีประสิทธิภาพและตรงประเด็นกว่า
ความน่าเชื่อถือและความแม่นยำของคำตอบ
เมื่อเทียบกับโมเดลรุ่นก่อนหน้า GPT-5.3 Instant มีการปรับปรุงอย่างมีนัยสำคัญในด้านความถูกต้องของข้อเท็จจริง ลด “ภาพลวงตา” (ข้อผิดพลาดเชิงข้อเท็จจริง) ลงอย่างมาก
ตามข้อมูลการประเมิน:
* พื้นที่ความเสี่ยงสูง: เมื่อใช้ฟังก์ชันการค้นหาผ่านอินเทอร์เน็ต อัตราการเกิดภาพลวงตาลดลง 26.8%; เมื่อใช้ความรู้ภายในเพียงอย่างเดียว ลดลง 19.7%
* จากผลตอบรับของผู้ใช้: เมื่อใช้ฟังก์ชันการค้นหาผ่านอินเทอร์เน็ต อัตราการเกิดภาพลวงตาลดลง 22.5%; เมื่อไม่ได้ใช้ฟังก์ชันการค้นหาผ่านอินเทอร์เน็ต ลดลง 9.6%
ความสามารถในการเขียนและการแสดงออกที่เพิ่มขึ้น
GPT-5.3 Instant มีประสิทธิภาพดีขึ้นในการเขียนเชิงสร้างสรรค์ การขัดเกลาข้อความ และการคิด构思 สามารถช่วยผู้ใช้สร้างงานเขียนที่มีพลังดึงดูดใจ จินตนาการ และความสมจริงมากขึ้น
ตัวอย่าง: เขียนบทกวีสั้นที่มีพลังทางอารมณ์ ธีมคือ “บุรุษไปรษณีย์ในฟิลาเดลเฟียเสร็จสิ้นการส่งจดหมายรอบสุดท้ายของเขาในวันที่เขาเกษียณ”


ผลการเปรียบเทียบ: บทกวีของ GPT-5.3 มีกลิ่นอายของชีวิตประจำวันและรายละเอียดที่เฉพาะเจาะจงมากขึ้น มีการควบคุมโครงสร้างที่ดีกว่า และการสรุปอารมณ์ในตอนจบเป็นไปโดยธรรมชาติและไม่ตั้งใจ ในทางตรงกันข้าม งานของ GPT-5.2 แม้จะดี แต่มีแนวโน้มไปทางอารมณ์และนามธรรมมากกว่า; ในขณะที่ GPT-5.3 สร้างอารมณ์ผ่านการวาดภาพรายละเอียด ทำให้มีระดับชั้นที่หลากหลายกว่า
ข้อจำกัดที่ทราบและความพยายามในการปรับปรุงอย่างต่อเนื่อง
แม้ว่า GPT-5.3 Instant จะมีความก้าวหน้าอย่างเป็นรูปธรรมในประสบการณ์ประจำวัน แต่ก็ยังมีพื้นที่ที่สามารถปรับปรุงได้:
* ภาษาที่ไม่ใช่ภาษาอังกฤษ: ในบางภาษา เช่น ภาษาญี่ปุ่น ภาษาเกาหลี สไตล์การตอบอาจยังดูแข็งทื่อหรือมีร่องรอยการแปลตรงตัว การเพิ่มความธรรมชาติและความลื่นไหลในหลายภาษายังคงเป็นทิศทางการปรับปรุงที่สำคัญ
* การปรับแต่งน้ำเสียง: แม้น้ำเสียงโดยรวมจะลื่นไหลและเป็นธรรมชาติมากขึ้นแล้ว OpenAI ระบุว่าจะรวบรวมผลตอบรับอย่างต่อเนื่อง และในขณะที่ปรับปรุงประสิทธิภาพของโมเดล จะขยายตัวเลือกการปรับแต่งน้ำเสียงส่วนบุคคลเพิ่มเติม
⚠️ หมายเหตุ: เนื้อหาได้รับการแปลโดย AI และตรวจสอบโดยมนุษย์ หากมีข้อผิดพลาดโปรดแจ้ง
本文来自网络搜集,不代表คลื่นสร้างอนาคต立场,如有侵权,联系删除。转载请注明出处:https://www.itsolotime.com/th/archives/24042
