Claude Opus 4.6 เปิดตัวอย่างยิ่งใหญ่: คะแนน ARC-AGI 68% ทำลายสถิติ หน้าต่างบริบทล้านโทเค็นเปิดยุคใหม่แห่ง AI

Anthropic ได้เปิดตัวรุ่นล่าสุดของโมเดลแฟลกชิป Claude Opus เวอร์ชัน 4.6 อย่างเป็นทางการ การอัปเกรดครั้งนี้มาพร้อมกับการเพิ่มขึ้นของความฉลาดอย่างมีนัยสำคัญ โดยเฉพาะอย่างยิ่งในแบบทดสอบ ARC-AGI 2 ซึ่งวัดความสามารถในการให้เหตุผลเชิงนามธรรม โดยได้คะแนน 68% สร้างสถิติใหม่และนำหน้าโมเดลหลักอื่นๆ อย่างมาก

Claude Opus 4.6 เปิดตัวอย่างยิ่งใหญ่: คะแนน ARC-AGI 68% ทำลายสถิติ หน้าต่างบริบทล้านโทเค็นเปิดยุคใหม่แห่ง AI

การเพิ่มประสิทธิภาพความสามารถหลัก

Opus 4.6 มีความก้าวหน้าอย่างสำคัญในด้านความสามารถในการเขียนโปรแกรม สามารถวางแผนงานได้ละเอียดยิ่งขึ้น ดำเนินการในโค้ดเบสขนาดใหญ่ได้อย่างน่าเชื่อถือมากขึ้น และเพิ่มทักษะในการตรวจสอบและดีบั๊กโค้ด นอกจากนี้ โมเดลนี้ยังเป็นรุ่นแรกในตระกูล Opus ที่รองรับหน้าต่างบริบท (context window) 1 ล้านโทเค็น (รุ่นเบต้า)

Claude Opus 4.6 เปิดตัวอย่างยิ่งใหญ่: คะแนน ARC-AGI 68% ทำลายสถิติ หน้าต่างบริบทล้านโทเค็นเปิดยุคใหม่แห่ง AI

ในสถานการณ์การทำงานประจำวัน โมเดลใหม่สามารถดำเนินการวิเคราะห์ทางการเงิน ทำการวิจัย และใช้และสร้างเอกสาร สเปรดชีต และงานนำเสนอได้อย่างเชี่ยวชาญ ในสภาพแวดล้อมการทำงานร่วมกัน Cowork ของ Claude, Opus 4.6 สามารถใช้ทักษะเหล่านี้เพื่อให้บริการผู้ใช้ได้อย่างอิสระ

ผลการทดสอบมาตรฐาน

นอกจากผลงานที่โดดเด่นในการทดสอบ ARC-AGI แล้ว Opus 4.6 ยังทำได้ในระดับแนวหน้าของอุตสาหกรรมในการประเมินที่สำคัญหลายรายการ:
* ได้คะแนนสูงสุดในการประเมินการเขียนโปรแกรมแบบเอเจนต์ Terminal-Bench 2.0 Claude Opus 4.6 เปิดตัวอย่างยิ่งใหญ่: คะแนน ARC-AGI 68% ทำลายสถิติ หน้าต่างบริบทล้านโทเค็นเปิดยุคใหม่แห่ง AI
* นำหน้าโมเดลล้ำสมัยทั้งหมดในการทดสอบการให้เหตุผลข้ามสาขาวิชาที่ซับซ้อน Humanity’s Last Exam Claude Opus 4.6 เปิดตัวอย่างยิ่งใหญ่: คะแนน ARC-AGI 68% ทำลายสถิติ หน้าต่างบริบทล้านโทเค็นเปิดยุคใหม่แห่ง AI
* ในการประเมินงานที่สร้างมูลค่าทางเศรษฐกิจ GDPval-AA ประสิทธิภาพของมันสูงกว่าโมเดลอันดับสองของอุตสาหกรรม (OpenAI GPT-5.2) ประมาณ 144 จุด Elo Claude Opus 4.6 เปิดตัวอย่างยิ่งใหญ่: คะแนน ARC-AGI 68% ทำลายสถิติ หน้าต่างบริบทล้านโทเค็นเปิดยุคใหม่แห่ง AI Claude Opus 4.6 เปิดตัวอย่างยิ่งใหญ่: คะแนน ARC-AGI 68% ทำลายสถิติ หน้าต่างบริบทล้านโทเค็นเปิดยุคใหม่แห่ง AI

สำหรับคะแนนสูงใน ARC-AGI 2 มีความคิดเห็นว่าสิ่งนี้บ่งชี้ว่าความสามารถในสาขานี้จะไปถึงระดับใหม่อย่างรวดเร็ว แต่ก็มีการถกเถียงกันว่าการทดสอบมาตรฐานสามารถวัดความสามารถที่มีความหมายได้จริงหรือไม่

ข้อคิดเห็นจากการใช้งานจริง

พันธมิตรที่ทดสอบในช่วงแรกให้คำวิจารณ์เชิงบวกกับ Opus 4.6 Notion เรียกมันว่า “โมเดลที่แข็งแกร่งที่สุดที่ Anthropic เปิดตัว” GitHub ชี้ให้เห็นว่ามันทำงานได้ยอดเยี่ยมใน “งานเขียนโค้ดหลายขั้นตอนที่ซับซ้อน” ในขณะที่ Replit มองว่ามันเป็นการ “ก้าวกระโดดครั้งใหญ่” ในการวางแผนของเอเจนต์

ราคาคงเดิม

แม้ประสิทธิภาพจะเพิ่มขึ้นอย่างมาก แต่กลยุทธ์การกำหนดราคาของโมเดลยังคงไม่เปลี่ยนแปลง: ค่าใช้จ่ายอินพุตต่อล้านโทเค็นอยู่ที่ 5 ดอลลาร์ และค่าใช้จ่ายเอาต์พุตอยู่ที่ 25 ดอลลาร์

Claude Opus 4.6 เปิดตัวอย่างยิ่งใหญ่: คะแนน ARC-AGI 68% ทำลายสถิติ หน้าต่างบริบทล้านโทเค็นเปิดยุคใหม่แห่ง AI

ความปลอดภัย

Anthropic เน้นย้ำว่าการเพิ่มความฉลาดครั้งนี้ไม่ได้แลกมาด้วยความปลอดภัย ในการตรวจสอบพฤติกรรมอัตโนมัติ Opus 4.6 รักษาอัตราพฤติกรรมที่ไม่สอดคล้อง (misalignment) ในระดับต่ำในด้านต่างๆ เช่น การหลอกลวง การประจบสอพลอ การส่งเสริมให้ผู้ใช้เพ้อฝัน และการละเมิดความร่วมมือ

Claude Opus 4.6 เปิดตัวอย่างยิ่งใหญ่: คะแนน ARC-AGI 68% ทำลายสถิติ หน้าต่างบริบทล้านโทเค็นเปิดยุคใหม่แห่ง AI

ฟีเจอร์ใหม่สำหรับนักพัฒนา

ด้าน API ได้แนะนำฟีเจอร์ใหม่หลายประการเพื่อเพิ่มประสบการณ์การพัฒนา:
* การคิดแบบปรับตัวได้ (Adaptive Thinking): โมเดลสามารถตัดสินใจได้ด้วยตัวเองว่าเมื่อใดจำเป็นต้องใช้การให้เหตุผลเชิงลึก
* การควบคุมความพยายาม (Effort Control): มีตัวเลือกระดับความฉลาดสี่ระดับที่ปรับได้
* การบีบอัดบริบท (Context Compression): สรุปและแทนที่ข้อมูลบริบทที่เก่ากว่าอัตโนมัติเพื่อประหยัดโทเค็น
* รองรับเอาต์พุตโทเค็น 128k: รองรับการสร้างคำตอบยาวสูงสุด 128k โทเค็น

Claude Opus 4.6 มีให้บริการแล้วผ่าน claude.ai, API และแพลตฟอร์มคลาวด์หลักทั้งหมด สำหรับผู้ใช้ที่ต้องการจัดการกับงานที่ซับซ้อนและงานเอเจนต์ระยะยาว การอัปเกรดครั้งนี้ควรค่าแก่การให้ความสนใจเป็นพิเศษ


ติดตาม “Whale Habitat” Mini Program เพื่อรับข่าวสาร AI ล่าสุด


⚠️ หมายเหตุ: เนื้อหาได้รับการแปลโดย AI และตรวจสอบโดยมนุษย์ หากมีข้อผิดพลาดโปรดแจ้ง

本文来自网络搜集,不代表คลื่นสร้างอนาคต立场,如有侵权,联系删除。转载请注明出处:https://www.itsolotime.com/th/archives/23024

Like (0)
Previous 2026年2月6日 am6:47
Next 2026年2月6日 am8:12

相关推荐