การเผชิญหน้ายามดึก! Google Gemini 3.1 Flash-Lite และ OpenAI GPT‑5.3 Instant เปิดตัวในวันเดียวกัน อัปเกรดทั้งประสิทธิภาพและคุ้มค่าคุ้มราคาอย่างครบวงจร

2026年3月4日 pm2:36 • ข่าวสารอุตสาหกรรม AI • 233 views

ยามดึก สองยักษ์ใหญ่แห่งวงการเทคโนโลยีอย่าง Google และ OpenAI ได้ทยอยเปิดตัวโมเดลภาษาขนาดใหญ่รุ่นใหม่ที่เบากว่า: Gemini 3.1 Flash-Lite และ GPT‑5.3 Instant เพื่อแข่งขันกันโดยตรงในด้านความคุ้มค่าและประสิทธิภาพหลัก

Gemini 3.1 Flash-Lite ที่ Google เปิดตัวนั้นถูกกำหนดให้เป็นโมเดลที่มีประสิทธิภาพด้านต้นทุนสูงสุดในตระกูล Gemini 3 ออกแบบมาสำหรับงานอัจฉริยะขนาดใหญ่ โดยมีราคาอยู่ที่ 0.25 ดอลลาร์สหรัฐต่อล้านโทเค็นสำหรับอินพุต และ 1.50 ดอลลาร์สหรัฐต่อล้านโทเค็นสำหรับเอาต์พุต Google อ้างว่าโมเดลนี้สามารถให้ประสิทธิภาพที่เพิ่มขึ้นอย่างมีนัยสำคัญในขณะที่ต้นทุนต่ำกว่าโมเดลขนาดใหญ่อย่างมาก

จากการทดสอบมาตรฐานของ Artificial Analysis เมื่อเทียบกับ Gemini 2.5 Flash แล้ว Gemini 3.1 Flash-Lite มีเวลาในการตอบสนองโทเค็นแรก (TTFT) เร็วกว่า 2.5 เท่า และความเร็วในการส่งออกเพิ่มขึ้น 45% ในขณะที่ยังคงรักษาคุณภาพของเอาต์พุตให้เท่าเทียมหรือดีกว่า

การเผชิญหน้ายามดึก! Google Gemini 3.1 Flash-Lite และ OpenAI GPT‑5.3 Instant เปิดตัวในวันเดียวกัน อัปเกรดทั้งประสิทธิภาพและคุ้มค่าคุ้มราคาอย่างครบวงจร

ในทางกลับกัน GPT‑5.3 Instant ของ OpenAI ได้รับการปรับปรุงเพื่อประสบการณ์การสนทนาที่ดีขึ้น โดยเน้นการปรับปรุงความธรรมชาติของน้ำเสียง ความเกี่ยวข้อง และความลื่นไหลของการสนทนา พร้อมทั้งลดอัตราการปฏิเสธการตอบของโมเดล ข้อมูลอย่างเป็นทางการแสดงให้เห็นว่า เมื่อเทียบกับรุ่นก่อนหน้า อัตราการเกิดภาพลวงตา (Hallucination) ลดลงสูงถึง 26.8% โมเดลนี้พร้อมให้บริการแล้วใน ChatGPT และ API

ที่น่าสังเกตคือ หลังจากประกาศ GPT-5.3 Instant แล้ว OpenAI ได้บ่งชี้ทันทีว่าวงจรชีวิตของมันอาจจะไม่ยาวนัก โดยระบุบนแพลตฟอร์มโซเชียล X ว่า “GPT-5.4 กำลังจะมาถึงเร็วกว่าที่คุณคิด”

Gemini 3.1 Flash-Lite: สร้างมาสำหรับงานอัจฉริยะขนาดใหญ่

Gemini 3.1 Flash-Lite ที่ Google เปิดตัวในครั้งนี้ เน้นย้ำว่าเป็นสมาชิกที่เร็วที่สุดและมีประสิทธิภาพด้านต้นทุนสูงสุดในตระกูล Gemini 3 ออกแบบมาเพื่อจัดการกับปริมาณงานขนาดใหญ่ของนักพัฒนา

โมเดลนี้เปิดให้นักพัฒนาทดลองใช้งานผ่าน Gemini API ตั้งแต่วันนี้ โดยสามารถใช้ใน Google AI Studio และผู้ใช้ระดับองค์กรก็สามารถเข้าถึงผ่าน Vertex AI ได้เช่นกัน

ประสิทธิภาพด้านต้นทุนและสมรรถนะขั้นสุด

ราคาอย่างเป็นทางการอยู่ที่ 0.25 ดอลลาร์สหรัฐต่อล้านโทเค็นสำหรับอินพุต และ 1.50 ดอลลาร์สหรัฐต่อล้านโทเค็นสำหรับเอาต์พุต Google เน้นย้ำว่าโมเดลนี้สามารถให้ประสิทธิภาพที่เพิ่มขึ้นอย่างมีนัยสำคัญในขณะที่ต้นทุนต่ำกว่าโมเดลขนาดใหญ่อย่างมาก

การทดสอบมาตรฐานของ Artificial Analysis แสดงให้เห็นว่า เมื่อเทียบกับ Gemini 2.5 Flash แล้ว Gemini 3.1 Flash-Lite มีเวลาในการตอบสนองโทเค็นแรกเร็วกว่า 2.5 เท่า และความเร็วในการส่งออกเพิ่มขึ้น 45% ในขณะที่ยังคงรักษาคุณภาพไว้ ลักษณะความหน่วงต่ำนี้ทำให้เหมาะสำหรับสถานการณ์การใช้งานที่ต้องการการตอบสนองแบบเรียลไทม์

การทดสอบแสดงให้เห็นว่า Gemini 3.1 Flash-Lite มีความเร็วและคุณภาพเหนือกว่า Gemini 2.5 Flash รุ่นก่อนหน้า ในกระดานคะแนน Arena.ai ได้คะแนน Elo ถึง 1432 ในแบบทดสอบมาตรฐานด้านการให้เหตุผลและการทำความเข้าใจหลายรูปแบบ เช่น GPQA Diamond (86.9%) และ MMMU Pro (76.8%) โมเดลนี้มีประสิทธิภาพเหนือกว่าโมเดลในระดับเดียวกัน และยังแซงหน้า Gemini 2.5 Flash รุ่นก่อนหน้าที่มีขนาดใหญ่กว่าด้วย

ปัญญาประดิษฐ์แบบปรับได้สำหรับนักพัฒนา

โมเดลนี้รองรับ “ระดับการคิด” ที่ปรับได้โดยค่าเริ่มต้นใน AI Studio และ Vertex AI ช่วยให้นักพัฒนาสามารถปรับสมดุลระหว่างต้นทุน ความเร็ว และความลึกของการให้เหตุผลตามความต้องการของงาน

งานขนาดใหญ่: เหมาะสำหรับการประมวลผลปริมาณมากที่อ่อนไหวต่อต้นทุน เช่น การแปลขนาดใหญ่ การตรวจสอบเนื้อหา
เวิร์กโฟลว์ที่ซับซ้อน: สามารถจัดการงานที่ต้องใช้การให้เหตุผลเชิงลึก เช่น การสร้างอินเทอร์เฟซผู้ใช้ การสร้างสภาพแวดล้อมจำลอง การปฏิบัติตามคำสั่งที่ซับซ้อน

ต่อไปนี้คือตัวอย่างการใช้งาน:

กรอกสินค้าหลายร้อยรายการในหมวดหมู่ต่างๆ ให้กับหน้าเว็บไวร์เฟรมของอีคอมเมิร์ซโดยอัตโนมัติ:
สร้างแดชบอร์ดสภาพอากาศแบบไดนามิกโดยใช้ข้อมูลเรียลไทม์และข้อมูลย้อนหลัง:
สร้างเอเจนต์อัจฉริยะสำหรับ SaaS ที่สามารถทำงานหลายขั้นตอนที่ซับซ้อน:
วิเคราะห์และจัดประเภทเนื้อหาภาพจำนวนมหาศาลอย่างรวดเร็ว:

การประยุกต์ใช้ในอุตสาหกรรมและผลตอบรับเบื้องต้น

ผู้ทดสอบเบื้องต้นบางราย รวมถึงบริษัทต่างๆ เช่น Latitude, Cartwheel และ Whering ได้เริ่มใช้โมเดลนี้เพื่อจัดการกับปัญหาที่ซับซ้อนในระดับใหญ่แล้ว

ผลตอบรับชี้ให้เห็นว่าโมเดลนี้ได้สร้างสมดุลที่ดีระหว่างประสิทธิภาพและความสามารถในการให้เหตุผล สามารถประมวลผลอินพุตที่ซับซ้อนได้อย่างแม่นยำเหมือนโมเดลขนาดใหญ่ และปฏิบัติตามคำสั่งอย่างสม่ำเสมอ พร้อมทั้งรักษาความสม่ำเสมอของเอาต์พุต

GPT‑5.3 Instant: ปรับปรุงประสบการณ์การสนทนาประจำวัน

ในฐานะเวอร์ชันล่าสุดของ ChatGPT GPT‑5.3 Instant มีเป้าหมายเพื่อมอบประสบการณ์การสนทนาประจำวันที่เสถียรกว่า ใช้งานได้จริงกว่า และลื่นไหลกว่า การปรับปรุงเน้นที่ความรู้สึกในการใช้งานจริงมากกว่าคะแนนมาตรฐาน

การปรับปรุงที่เฉพาะเจาะจงรวมถึง: ให้คำตอบที่แม่นยำกว่า; เมื่อใช้การค้นหาผ่านอินเทอร์เน็ต สามารถให้ผลลัพธ์ที่หลากหลายและมีบริบทมากกว่า; ลดการตอบสนองที่ไม่ได้ช่วยเหลือ การแจ้งข้อจำกัดความรับผิดชอบที่มากเกินไป หรือการแสดงออกที่ด่วนสรุด

กลยุทธ์การตอบสนองที่สมเหตุสมผลกว่า

เมื่อเทียบกับรุ่นก่อนหน้า GPT-5.3 Instant ลดการปฏิเสธการตอบที่ไม่จำเป็นลงอย่างมีนัยสำคัญ และลดการแจ้งข้อจำกัดความรับผิดชอบที่ป้องกันตัวเกินไปหรือมีลักษณะสั่งสอนก่อนให้คำตอบ สำหรับคำถามที่เหมาะสม โมเดลจะให้คำตอบโดยตรงมากขึ้น

คำตอบจากการค้นหาผ่านอินเทอร์เน็ตที่มีคุณภาพกว่า

โมเดลปรับปรุงความสามารถในการบูรณาการข้อมูลจากอินเทอร์เน็ต สามารถปรับสมดุลระหว่างผลการค้นหาและการให้เหตุผลจากความรู้ของตัวเองได้ดีขึ้น เมื่อทำงานเช่นการตีความข่าว จะอธิบายพร้อมบริบท แทนที่จะเพียงแจกแจงลิงก์ โมเดลเข้าใจความหมายแฝงของคำถามได้ดีกว่า นำเสนอข้อมูลสำคัญเป็นลำดับแรก ทำให้คำตอบมีความเกี่ยวข้องและใช้งานง่ายมากขึ้น โดยไม่เสียสละความเร็วในการตอบสนองและน้ำเสียงการสนทนา

ตัวอย่างเช่น สำหรับคำถาม “การเซ็นสัญญาที่ใหญ่ที่สุดในฤดูกาลปิดฤดูกาล MLB 2025-26 และผลกระทบต่อโครงสร้างระยะยาว”:

การเปรียบเทียบแสดงให้เห็นว่าคำตอบของ GPT-5.3 Instant มีความทันสมัยกว่า ระบุการเซ็นสัญญาล่าสุดที่มีผลกระทบระยะยาวได้อย่างแม่นยำ และวางไว้ในบริบทมหภาคของแนวโน้มลีก (เช่น การรวมศูนย์ความสามารถ) และการเจรจาระหว่างแรงงานและนายจ้าง ในขณะที่คำตอบสำหรับการเปรียบเทียบค่อนข้างล้าสมัยและมีความเกี่ยวข้องน้อยกว่า

สไตล์การสนทนาที่ลื่นไหลกว่า

โมเดลมีน้ำเสียงการสนทนาที่เป็นธรรมชาติและลื่นไหลกว่า

การปรับปรุงสไตล์การสนทนา

น้ำเสียงการสนทนาของ GPT-5.2 Instant บางครั้งอาจดูแข็งทื่อหรือแข็งกร้าวเกินไป และอาจคาดการณ์ความตั้งใจและอารมณ์ของผู้ใช้ไม่ถูกต้อง

GPT-5.3 Instant นำมาซึ่งประสบการณ์การสนทนาที่เป็นธรรมชาติและมีสมาธิมากกว่า โมเดลลดการแสดงออกแบบประกาศตามรูปแบบและประโยคชี้นำ เช่น “หยุดก่อน ลองหายใจลึกๆ” ทำให้การสื่อสารลื่นไหลขึ้น ผู้ใช้ยังสามารถปรับสไตล์น้ำเสียงของโมเดลในการตั้งค่าได้ เช่น ระดับความอบอุ่นหรือความกระตือรือร้นในการแสดงออก

ตัวอย่าง: ผู้ใช้ถามว่า “ทำไมฉันถึงหาความรักไม่ได้ในซานฟรานซิสโก?”

การวิเคราะห์เปรียบเทียบ: GPT-5.3 Instant เข้าสู่หัวใจของปัญหาเพื่อแก้ไขโดยตรง หลีกเลี่ยงคำนำที่ปลอบโยนแต่ไม่ได้ช่วยเหลือเชิงสาระ เช่น “คุณไม่มีปัญหา และนี่ก็ไม่ใช่แค่เพราะคุณ” การตอบสนองมีประสิทธิภาพและตรงประเด็นกว่า

ความน่าเชื่อถือและความแม่นยำของคำตอบ

เมื่อเทียบกับโมเดลรุ่นก่อนหน้า GPT-5.3 Instant มีการปรับปรุงอย่างมีนัยสำคัญในด้านความถูกต้องของข้อเท็จจริง ลด “ภาพลวงตา” (ข้อผิดพลาดเชิงข้อเท็จจริง) ลงอย่างมาก

ตามข้อมูลการประเมิน:
* พื้นที่ความเสี่ยงสูง: เมื่อใช้ฟังก์ชันการค้นหาผ่านอินเทอร์เน็ต อัตราการเกิดภาพลวงตาลดลง 26.8%; เมื่อใช้ความรู้ภายในเพียงอย่างเดียว ลดลง 19.7%
* จากผลตอบรับของผู้ใช้: เมื่อใช้ฟังก์ชันการค้นหาผ่านอินเทอร์เน็ต อัตราการเกิดภาพลวงตาลดลง 22.5%; เมื่อไม่ได้ใช้ฟังก์ชันการค้นหาผ่านอินเทอร์เน็ต ลดลง 9.6%

ความสามารถในการเขียนและการแสดงออกที่เพิ่มขึ้น

GPT-5.3 Instant มีประสิทธิภาพดีขึ้นในการเขียนเชิงสร้างสรรค์ การขัดเกลาข้อความ และการคิด构思 สามารถช่วยผู้ใช้สร้างงานเขียนที่มีพลังดึงดูดใจ จินตนาการ และความสมจริงมากขึ้น

ตัวอย่าง: เขียนบทกวีสั้นที่มีพลังทางอารมณ์ ธีมคือ “บุรุษไปรษณีย์ในฟิลาเดลเฟียเสร็จสิ้นการส่งจดหมายรอบสุดท้ายของเขาในวันที่เขาเกษียณ”

ผลการเปรียบเทียบ: บทกวีของ GPT-5.3 มีกลิ่นอายของชีวิตประจำวันและรายละเอียดที่เฉพาะเจาะจงมากขึ้น มีการควบคุมโครงสร้างที่ดีกว่า และการสรุปอารมณ์ในตอนจบเป็นไปโดยธรรมชาติและไม่ตั้งใจ ในทางตรงกันข้าม งานของ GPT-5.2 แม้จะดี แต่มีแนวโน้มไปทางอารมณ์และนามธรรมมากกว่า; ในขณะที่ GPT-5.3 สร้างอารมณ์ผ่านการวาดภาพรายละเอียด ทำให้มีระดับชั้นที่หลากหลายกว่า

ข้อจำกัดที่ทราบและความพยายามในการปรับปรุงอย่างต่อเนื่อง

แม้ว่า GPT-5.3 Instant จะมีความก้าวหน้าอย่างเป็นรูปธรรมในประสบการณ์ประจำวัน แต่ก็ยังมีพื้นที่ที่สามารถปรับปรุงได้:
* ภาษาที่ไม่ใช่ภาษาอังกฤษ: ในบางภาษา เช่น ภาษาญี่ปุ่น ภาษาเกาหลี สไตล์การตอบอาจยังดูแข็งทื่อหรือมีร่องรอยการแปลตรงตัว การเพิ่มความธรรมชาติและความลื่นไหลในหลายภาษายังคงเป็นทิศทางการปรับปรุงที่สำคัญ
* การปรับแต่งน้ำเสียง: แม้น้ำเสียงโดยรวมจะลื่นไหลและเป็นธรรมชาติมากขึ้นแล้ว OpenAI ระบุว่าจะรวบรวมผลตอบรับอย่างต่อเนื่อง และในขณะที่ปรับปรุงประสิทธิภาพของโมเดล จะขยายตัวเลือกการปรับแต่งน้ำเสียงส่วนบุคคลเพิ่มเติม

⚠️ หมายเหตุ: เนื้อหาได้รับการแปลโดย AI และตรวจสอบโดยมนุษย์ หากมีข้อผิดพลาดโปรดแจ้ง

☕ สนับสนุนค่ากาแฟทีมงาน

หากคุณชอบบทความนี้ สามารถสนับสนุนเราได้ผ่าน PromptPay

SCAN TO PAY WITH ANY BANK

本文来自网络搜集，不代表คลื่นสร้างอนาคต立场，如有侵权，联系删除。转载请注明出处：https://www.itsolotime.com/th/archives/24042

OpenAI GPT การเปรียบเทียบประสิทธิภาพของโมเดล การเปิดตัวโมเดลขนาดใหญ่กูเกิลเจมินาย ข่าวสารอุตสาหกรรม AI

Like (0)

0 0

OpenClaw: ขึ้นอันดับ 1 บน GitHub ในสองเดือน เฟรมเวิร์ก AI ระดับท้องถิ่นพลิกโฉมชุมชนโอเพนซอร์สและเศรษฐกิจความสนใจอย่างไร

Previous 2026年3月4日 pm12:29

ปฏิวัติเดสก์ท็อปด้วย AI! Alibaba QoderWork บุก Windows สร้าง PPT 19 หน้าได้ในคลิกเดียว บอกลานรกการจัดระเบียบไฟล์

Next 2026年3月4日 pm2:38

ข่าวสารอุตสาหกรรม AI

ห้าสายใหญ่แห่งแบบจำลองโลก: Yann LeCun ปะทะ Fei-Fei Li ใครจะเป็นผู้กำหนดอนาคต AI?

หลังเทศกาลตรุษจีน บริษัทใหม่ AMI ของผู้ได้รับรางวัลทัวริง หยาง ลี่คุน ประกาศระดมทุนรอบเมล็ดพันธุ์ (seed round) สำเร็จ 1.03 พันล้านดอลลาร์ สร้างสถิติการระดมทุนสำหรับบริษัท AI ในยุโร…

2026年4月17日
100000
ข่าวสารอุตสาหกรรม AI

Alibaba’s Qianwen AI Assistant makes its debut in full form in Hongqi cars, creating an all-scenario super butler.

ผู้ช่วย AI ของ Alibaba ชื่อ Qianwen ได้เชื่อมต่อกับระบบห้องโดยสารอัจฉริยะของรถยนต์ Hongqi แล้ว ขณะขับรถ ผู้ใช้สามารถใช้คำสั่งเสียงธรรมชาติเพื่อให้ผู้ช่วย AI ดำเนินการต่างๆ เช่น การ…

2026年3月27日
164000
ข่าวสารอุตสาหกรรม AI

GPT-5.4 เปิดตัวอย่างน่าตื่นเต้น: โมเดลเดียวผสานความสามารถ 5 ด้าน ทั้งการเขียนโปรแกรม ค้นหา และควบคุม เอาชนะมนุษย์ 83% ในงานด้านความรู้

GPT-5.4 เปิดตัว: รวม 5 ความสามารถหลักไว้ในตัวเดียว แสดงผลงานด้านความรู้เหนือมนุษย์ส่วนใหญ่ เป็นเวลานานที่ผู้ใช้มักต้องสลับระหว่างโมเดลต่างๆ ตามประเภทงานเมื่อใช้เครื่องมือ AI: การเข…

2026年3月6日
239000
ข่าวสารอุตสาหกรรม AI

การสร้างกราฟความรู้ที่อัปเดตตัวเอง: การใช้ LLM และ Neo4j เพื่อวิเคราะห์รายงานการประชุมอย่างชาญฉลาด

แปลงบันทึกการประชุมแบบไม่มีโครงสร้างให้เป็นกราฟความรู้ที่สามารถสืบค้นได้ และรองรับการอัปเดตแบบเพิ่มเติม — ไม่จำเป็นต้องประมวลผลทั้งหมดใหม่ทุกครั้ง บันทึกการประชุมคือเหมืองทองแห่งปั…

2026年2月3日
253000
ข่าวสารอุตสาหกรรม AI

จาก “เวทมนตร์” สู่ “นักวิเคราะห์”: ระบบ AI Agent จะปรับโฉมระบบอัจฉริยะในปี 2026 อย่างไร

ครั้งแรกที่ได้สัมผัสกับโมเดลภาษาขนาดใหญ่ หลายคนรู้สึกว่ามันเกือบจะเป็น “เวทมนตร์” คุณป้อนคำสั่ง มันก็ให้คำตอบ การโต้ตอบจบลงเพียงเท่านี้ สำหรับการตอบคำถามอย่างรวดเร็ว กา…

2026年2月2日
233000