อัปเกรดครั้งใหญ่ของโมเดลเริ่มต้น ChatGPT: GPT-5.5 Instant ลดภาพหลอนลง 52.5% ผู้ใช้ฟรีใช้งานได้
โมเดลเริ่มต้นของ ChatGPT ได้รับการอัปเกรดครั้งใหญ่ในวันนี้
เวอร์ชันใหม่ GPT-5.5 Instant ผสานความฉลาดหลักของ 5.5 เข้ากับความเร็วในการตอบสนองที่รวดเร็วปานสายฟ้า
ผู้ใช้ฟรีก็สามารถเพลิดเพลินกับการอัปเกรดนี้ได้เช่นกัน
ไฮไลท์สำคัญสี่ประการ:
- อัตราภาพหลอนลดลง 52.5%
- เพิ่มฟังก์ชัน “แหล่งที่มาของความทรงจำ” แสดงให้เห็นอย่างชัดเจนว่าการสนทนาก่อนหน้านี้ส่งผลต่อการตอบสนองปัจจุบันอย่างไร
- คำตอบที่กระชับขึ้น: ลดคำถามที่ไม่จำเป็น ละอีโมจิที่ไม่จำเป็น หลีกเลี่ยงรูปแบบที่ซับซ้อน
- น้ำเสียงที่อบอุ่นและเป็นธรรมชาติมากขึ้น
อัลท์แมนเน้นย้ำเป็นพิเศษว่า หากคุณเพิ่งมุ่งเน้นไปที่โมเดลการคิดเชิงลึก ลองกลับมาสัมผัสประสบการณ์นี้ดู
ภารกิจหลักคือการลดภาพหลอน
ในฐานะโมเดลเริ่มต้น การปรับปรุงหลักคือการเพิ่มความแม่นยำ ลดการสร้างข้อมูลเท็จ
เมื่อเทียบกับรุ่นก่อนหน้า GPT-5.5 Instant มีความก้าวหน้าอย่างมากในด้านความแม่นยำตามข้อเท็จจริง โดยเฉพาะในสถานการณ์ที่มีความเสี่ยงสูง เช่น การแพทย์ กฎหมาย และการเงิน ข้อความเท็จที่สร้างขึ้นลดลง 52.5%
ในการสนทนาที่ยุ่งยากซึ่งผู้ใช้เคยทำเครื่องหมายว่ามีข้อผิดพลาดตามข้อเท็จจริง ข้อความที่ไม่ถูกต้องลดลง 37.3%
OpenAI ยกตัวอย่างปัญหาพีชคณิต: ผู้ใช้อัปโหลดรูปถ่ายสมการที่เขียนด้วยมือซึ่งมีข้อผิดพลาดในการคำนวณ

GPT-5.3 Instant ในตอนแรกเห็นด้วยกับวิธีแก้ปัญหาของผู้ใช้ จากนั้นพบว่า x=3 ไม่ถูกต้อง แต่กลับสรุปผิดว่าสมการนี้ไม่มีคำตอบ
GPT-5.5 Instant ในตอนแรกก็เห็นด้วยกับการคำนวณของผู้ใช้ แต่จากนั้นพบข้อผิดพลาดในการจัดเรียงสมการใหม่ของผู้ใช้ และแก้สมการกำลังสองที่แก้ไขแล้ว

การเปลี่ยนแปลงนี้มีความสำคัญมากยิ่งขึ้นเมื่อนำไปใช้กับโมเดลเริ่มต้น
เพราะหลายคนใช้ ChatGPT ทุกวันเพื่อจัดการกับปัญหา เช่น สัญญา การเบิกค่าใช้จ่าย การอธิบายอาการ ข้อผิดพลาดของโค้ด และแนวทางการทำการบ้าน
ในสถานการณ์เหล่านี้ การที่โมเดลตอบผิดอย่างจริงจังนั้นยุ่งยากกว่า “การไม่รู้”
ผลการทดสอบมาตรฐานก็ยืนยันสิ่งนี้เช่นกัน ในการทดสอบคณิตศาสตร์ที่มีการแข่งขันสูง AIME 2025 ความแม่นยำเพิ่มขึ้นจาก 65.4% เป็น 81.2%
การทดสอบความสามารถในการใช้เหตุผลทางวิทยาศาสตร์ระดับปริญญาเอก GPQA ความแม่นยำเพิ่มขึ้นจาก 78.5% เป็น 85.6%

การทดสอบมาตรฐาน CharXiv สำหรับการตีความและใช้เหตุผลเกี่ยวกับแผนภูมิทางวิทยาศาสตร์ ความแม่นยำก็เพิ่มขึ้นจาก 75.0% เป็น 81.6%
การทดสอบ MMMU-Pro ใช้วัดความสามารถของโมเดลในการจัดการปัญหาระดับผู้เชี่ยวชาญในข้อความและรูปภาพ ความแม่นยำเพิ่มขึ้นจาก 69.2% เป็น 76.0%

อัตราข้อผิดพลาดในการทดสอบ OmniDocBench (ใช้สำหรับดึงข้อมูลที่มีโครงสร้างจากเอกสารที่ซับซ้อน) ลดลงจาก 14.6% เป็น 12.5%

พูดน้อยลง ก็เป็นความสามารถเช่นกัน
หลังจากคำตอบแม่นยำขึ้น ยังมีปัญหาเก่า: คำตอบยาวเกินไป
การเปลี่ยนแปลงสไตล์ของ GPT-5.5 Instant ในครั้งนี้ แกนหลักคือสั้นลงและเจาะจงมากขึ้น แต่ไม่สูญเสียข้อมูลสำคัญ
ก่อนหน้านี้ สำหรับคำถามเดียวกัน บางครั้งก็เริ่มด้วยข้อความปฏิเสธความรับผิดชอบยาวๆ จากนั้นก็ซ้อนรายการสามชั้น และสุดท้ายก็ถามต่อว่า “คุณต้องการให้ฉันดำเนินการต่อไหม”
ตอนนี้ OpenAI กล่าวว่า: ลดการจัดรูปแบบที่มากเกินไป ลดคำถามที่ไม่จำเป็น และลดอีโมจิที่ไม่จำเป็น

ในตัวอย่างนี้ GPT-5.5 Instant ใช้จำนวนคำลดลง 30.2% และจำนวนบรรทัดลดลง 29.2%
มันจับน้ำเสียงที่เหมาะสม: ไม่เป็นทางการ ใช้งานได้จริง และสอดคล้องกับบรรทัดฐานในที่ทำงาน หลีกเลี่ยงการอธิบายมากเกินไป
ให้แนวทางที่ใช้ได้สำหรับสถานการณ์ต่างๆ และมุ่งเน้นที่ประเด็น ไม่ใช่ตัวบุคคล

OpenAI เชื่อว่าคำตอบของ GPT-5.3 Instant นั้นครอบคลุมมากกว่า โดยเฉพาะในส่วน “สิ่งที่ไม่ควรทำ” แต่สำหรับพรอมต์คำแนะนำที่ไม่เป็นทางการแล้ว ดูซับซ้อนเกินไป โครงสร้างและการปรับแต่งอาจเกินความต้องการที่แท้จริงของผู้ใช้

ความทรงจำดีขึ้น แต่คุณควบคุมได้
GPT-5.5 Instant ใช้บริบทที่คุณเคยให้ ChatGPT ไว้ได้ดีขึ้น
ซึ่งรวมถึงอีเมลที่เชื่อมต่อ ประวัติการสนทนาที่ผ่านมา และไฟล์ที่อัปโหลด
ประเด็นสำคัญคือ มันสามารถตัดสินได้ว่าเมื่อใดที่บริบทเหล่านี้จะทำให้คำตอบดีขึ้นจริงๆ แทนที่จะยัดเยียดความทรงจำทุกครั้ง

ครั้งนี้ OpenAI ยังได้เพิ่มฟังก์ชัน “แหล่งที่มาของความทรงจำ” ซึ่งจะแสดงให้ผู้ใช้เห็นว่าความทรงจำใดบ้างที่ส่งผลต่อการตอบกลับนี้
หากความทรงจำใดล้าสมัย ผู้ใช้ยังสามารถแก้ไขหรือลบได้

เมื่อไหร่จะได้ใช้?
GPT-5.5 Instant เริ่มทยอยเปิดตัวให้ผู้ใช้ ChatGPT ทุกคนตั้งแต่วันที่ 5 พฤษภาคม แทนที่ GPT-5.3 Instant ในฐานะโมเดลเริ่มต้น

ใน API ที่สอดคล้องกันคือ chat-latest
โมเดลเก่าจะไม่หายไปทันที ผู้ใช้ที่ชำระเงินยังสามารถเข้าถึง GPT-5.3 Instant ต่อไปได้ในการตั้งค่าโมเดลอีกสามเดือน ก่อนที่จะเลิกใช้งาน
ฟังก์ชันการปรับแต่งส่วนบุคคลจะเปิดตัวบนเว็บสำหรับผู้ใช้ Plus และ Pro ก่อน ตามด้วยมือถือ ผู้ใช้ Free, Go, Business, Enterprise จะขยายในอีกไม่กี่สัปดาห์ต่อมา
ลิงก์อ้างอิง:
[1]https://openai.com/index/gpt-5-5-instant/
⚠️ หมายเหตุ: เนื้อหาได้รับการแปลโดย AI และตรวจสอบโดยมนุษย์ หากมีข้อผิดพลาดโปรดแจ้ง
☕ สนับสนุนค่ากาแฟทีมงาน
หากคุณชอบบทความนี้ สามารถสนับสนุนเราได้ผ่าน PromptPay
本文来自网络搜集,不代表คลื่นสร้างอนาคต立场,如有侵权,联系删除。转载请注明出处:https://www.itsolotime.com/th/archives/33450
