Claude Opus 4.7 เปิดตัวครั้งใหญ่: AI แก้ไขข้อผิดพลาดได้ด้วยตัวเอง, ความสามารถด้านภาพเพิ่มขึ้นสองเท่า, ทักษะการเขียนโปรแกรมพัฒนาอย่างต่อเนื่อง

Claude Opus 4.7 เปิดตัว: ความสามารถในการแก้ไขตัวเอง, การมองเห็น และประสิทธิภาพการเขียนโปรแกรมพัฒนาอย่างก้าวกระโดด

Anthropic ได้เปิดตัวโมเดล Claude Opus 4.7 อย่างเป็นทางการแล้ว เป้าหมายหลักของการอัปเดตครั้งนี้ สอดคล้องกับฟีเจอร์ “Routines” ที่เพิ่งเปิดตัวไป: เพื่อให้ AI สามารถจัดการกับโซ่งานที่ยาวและซับซ้อนได้ด้วยตนเอง และมีความสามารถในการตรวจสอบตัวเอง เพื่อลดความต้องการในการกำกับดูแลจากมนุษย์

Claude Opus 4.7 เปิดตัวครั้งใหญ่: AI แก้ไขข้อผิดพลาดได้ด้วยตัวเอง, ความสามารถด้านภาพเพิ่มขึ้นสองเท่า, ทักษะการเขียนโปรแกรมพัฒนาอย่างต่อเนื่อง

ในด้านราคา Opus 4.7 ยังคงมาตรฐานเดียวกับรุ่นก่อนหน้า 4.6: อินพุต 5 ดอลลาร์สหรัฐต่อล้าน Token เอาต์พุต 25 ดอลลาร์สหรัฐต่อล้าน Token

1. โมเดลที่มีความสามารถในการตรวจสอบความถูกต้องด้วยตนเอง

Opus 4.7 ได้นำเสนอความสามารถสำคัญที่ก่อนหน้านี้ไม่เด่นชัดนัก: ก่อนที่จะส่งคำตอบสุดท้ายให้ผู้ใช้ โมเดลจะทำการตรวจสอบความถูกต้องภายในตัวเองก่อนหนึ่งรอบ

เมื่อพบปัญหา โมเดลจะทำการแก้ไขภายใน จากนั้นจึงส่งออกผลลัพธ์ที่ได้รับการปรับปรุงแล้ว กลไกนี้มีความสำคัญอย่างมากในสถานการณ์ที่ AI ทำงานอัตโนมัติ ในอดีต เมื่อให้ Claude ทำงานที่ยาวนานหลายชั่วโมง อาจพบว่าขั้นตอนกลางมีข้อผิดพลาดเมื่อถึงตอนสุดท้าย แต่ตอนนี้ มันสามารถค้นพบและแก้ไขข้อผิดพลาดประเภทนี้ได้ด้วยตัวเอง จึงลดขั้นตอนที่ต้องมีการแทรกแซงจากมนุษย์ลงไปหนึ่งชั้น

Claude Opus 4.7 เปิดตัวครั้งใหญ่: AI แก้ไขข้อผิดพลาดได้ด้วยตัวเอง, ความสามารถด้านภาพเพิ่มขึ้นสองเท่า, ทักษะการเขียนโปรแกรมพัฒนาอย่างต่อเนื่อง

จากผลตอบรับการใช้งานของ Rakuten การใช้ Opus 4.7 ในการรันงานผลิต อัตราการแก้ไขปัญหาสูงขึ้น 3 เท่า คุณภาพโค้ดได้รับการปรับปรุง “มากกว่าสิบออเดอร์ออฟแมกนิจูด” ในการทดสอบเวิร์กโฟลว์หลายขั้นตอน Opus 4.7 มีประสิทธิภาพดีกว่า 4.6 ถึง 14% อัตราความผิดพลาดในการเรียกใช้เครื่องมือลดลงประมาณหนึ่งในสาม ในขณะที่การบริโภค Token ก็ลดลงเช่นกัน

Claude Opus 4.7 เปิดตัวครั้งใหญ่: AI แก้ไขข้อผิดพลาดได้ด้วยตัวเอง, ความสามารถด้านภาพเพิ่มขึ้นสองเท่า, ทักษะการเขียนโปรแกรมพัฒนาอย่างต่อเนื่อง

ผลลัพธ์คือการเพิ่มความน่าเชื่อถือ พร้อมกับการปรับปรุงต้นทุนให้ดีขึ้น

2. ความสามารถด้านการมองเห็นก้าวกระโดด

การอัปเดตครั้งนี้มีความก้าวหน้าอย่างเห็นได้ชัดในด้านความสามารถในการมองเห็น

Opus 4.7 รองรับการประมวลผลภาพที่มีความยาวด้านยาวที่สุดสูงถึง 2,576 พิกเซล ความละเอียดประมาณ 3.75 ล้านพิกเซล ซึ่งมากกว่าความสามารถของโมเดลก่อนหน้าถึง 3 เท่า สถานการณ์การใช้งานที่ทางการยกตัวอย่าง ได้แก่ การสร้างต้นแบบอินเทอร์เฟซ การสร้างงานนำเสนอ การตีความโครงสร้างเคมี และแผนภูมิทางเทคนิค ซึ่งเป็นงานที่ต้องการความแม่นยำในรายละเอียดสูง

Claude Opus 4.7 เปิดตัวครั้งใหญ่: AI แก้ไขข้อผิดพลาดได้ด้วยตัวเอง, ความสามารถด้านภาพเพิ่มขึ้นสองเท่า, ทักษะการเขียนโปรแกรมพัฒนาอย่างต่อเนื่อง

จากข้อมูลที่ XBOW ให้ไว้ ในการทดสอบมาตรฐานการรับรู้ทางคอมพิวเตอร์วิทัศน์ Opus 4.7 ได้คะแนน 98.5% ในขณะที่ Opus 4.6 ได้คะแนน 54.5% การก้าวกระโดดจาก 54.5% เป็น 98.5% ถูกประเมินว่า “แก้ไขจุดบกพร่องหลักของเราได้อย่างสิ้นเชิง”

Claude Opus 4.7 เปิดตัวครั้งใหญ่: AI แก้ไขข้อผิดพลาดได้ด้วยตัวเอง, ความสามารถด้านภาพเพิ่มขึ้นสองเท่า, ทักษะการเขียนโปรแกรมพัฒนาอย่างต่อเนื่อง

การเปลี่ยนแปลงนี้มีความสำคัญอย่างยิ่งสำหรับงานอัตโนมัติที่ต้องการความเข้าใจด้านการมองเห็น ในอดีต การให้ AI ระบุภาพหน้าจอ อ่านอินเทอร์เฟซผู้ใช้ หรือประมวลผลเอกสารที่มีทั้งข้อความและภาพ มีอัตราความผิดพลาดที่เห็นได้ชัด การเพิ่มขึ้นของความละเอียดและความสามารถในการเข้าใจครั้งนี้ เป็นรากฐานที่มั่นคงสำหรับ AI ในการจัดการกับงานด้านการมองเห็นที่ซับซ้อน

3. ความสามารถในการเขียนโปรแกรมที่พัฒนาอย่างต่อเนื่อง

ในด้านการเขียนโปรแกรม Opus 4.7 ก็แสดงให้เห็นถึงความแข็งแกร่งที่มากขึ้นเช่นกัน

Claude Opus 4.7 เปิดตัวครั้งใหญ่: AI แก้ไขข้อผิดพลาดได้ด้วยตัวเอง, ความสามารถด้านภาพเพิ่มขึ้นสองเท่า, ทักษะการเขียนโปรแกรมพัฒนาอย่างต่อเนื่อง

ข้อมูลการทดสอบของ Cursor บน CursorBench แสดงว่า: Opus 4.7 ได้คะแนน 70% ในขณะที่ Opus 4.6 ได้ 58%

Claude Opus 4.7 เปิดตัวครั้งใหญ่: AI แก้ไขข้อผิดพลาดได้ด้วยตัวเอง, ความสามารถด้านภาพเพิ่มขึ้นสองเท่า, ทักษะการเขียนโปรแกรมพัฒนาอย่างต่อเนื่อง

ผลตอบรับจาก Notion ชี้ให้เห็นว่า ประสิทธิภาพโดยรวมของโมเดลเพิ่มขึ้น 14% อัตราความผิดพลาดในการเรียกใช้เครื่องมือลดลงประมาณหนึ่งในสาม และเป็นครั้งแรกที่ผ่านการทดสอบรายการ “ความต้องการแฝง” ซึ่งคือความต้องการที่ไม่ได้ระบุไว้อย่างชัดเจน แต่ควรจะเข้าใจได้

Claude Opus 4.7 เปิดตัวครั้งใหญ่: AI แก้ไขข้อผิดพลาดได้ด้วยตัวเอง, ความสามารถด้านภาพเพิ่มขึ้นสองเท่า, ทักษะการเขียนโปรแกรมพัฒนาอย่างต่อเนื่อง

CodeRabbit พบว่าเมื่อใช้มันในการตรวจสอบโค้ด อัตราการเรียกคืนการเปลี่ยนแปลงโค้ดสำหรับ Pull Request ที่ซับซ้อนที่สุดเพิ่มขึ้นมากกว่า 10% โดยที่ความแม่นยำยังคงเดิม Databricks สังเกตเห็นว่าในงานการให้เหตุผลเกี่ยวกับเอกสาร อัตราความผิดพลาดลดลง 21%

4. เพิ่มฟีเจอร์ตรวจสอบโค้ดเชิงลึก /ultrareview

Claude Code ครั้งนี้ได้เพิ่ม คำสั่ง /ultrareview โดยเฉพาะสำหรับการดำเนินการตรวจสอบโค้ดเชิงลึกหนึ่งรอบ

Claude Opus 4.7 เปิดตัวครั้งใหญ่: AI แก้ไขข้อผิดพลาดได้ด้วยตัวเอง, ความสามารถด้านภาพเพิ่มขึ้นสองเท่า, ทักษะการเขียนโปรแกรมพัฒนาอย่างต่อเนื่อง

ฟีเจอร์นี้จะอ่านการเปลี่ยนแปลงโค้ดทั้งหมด และค้นหาปัญหาที่ผู้ตรวจสอบโค้ดที่เข้มงวดสามารถพบได้ รวมถึงข้อบกพร่องที่อาจเกิดขึ้นและปัญหาที่ระดับการออกแบบ ผู้ใช้ไม่จำเป็นต้องเปิดการสนทนาใหม่หรือขอตรวจสอบด้วยตนเอง เพียงคำสั่งเดียว โมเดลก็สามารถรันและสร้างรายงานการตรวจสอบได้โดยอัตโนมัติ

ในขณะเดียวกัน “โหมดอัตโนมัติ” ได้เปิดให้ผู้ใช้แผน Max ใช้งานแล้ว ทำให้ความถี่ของการถูกขัดจังหวะขณะรันงานยาวลดลง เมื่อรวมกับฟีเจอร์ Routines ที่เปิดตัวเร็วๆ นี้ ผู้ใช้สามารถกำหนดค่าการทำงานก่อนนอนและตั้งเงื่อนไขทริกเกอร์ แล้วดูผลลัพธ์ในเช้าวันรุ่งขึ้น สิ่งนี้ทำให้เวิร์กโฟลว์ “ให้ AI คอยดูแลแทน” เป็นไปอย่างราบรื่นมากขึ้น

Claude Opus 4.7 เปิดตัวครั้งใหญ่: AI แก้ไขข้อผิดพลาดได้ด้วยตัวเอง, ความสามารถด้านภาพเพิ่มขึ้นสองเท่า, ทักษะการเขียนโปรแกรมพัฒนาอย่างต่อเนื่อง

5. API เพิ่มระดับความละเอียดของการให้เหตุผล

สำหรับนักพัฒนา การอัปเดตครั้งนี้ได้เพิ่มระดับการให้เหตุผล xhigh ใน API ซึ่งอยู่ระหว่างระดับ high และ max เดิม ก่อนหน้านี้ ช่องว่างระหว่าง high กับ max ค่อนข้างใหญ่ การเพิ่มระดับใหม่นี้ช่วยให้สามารถปรับสมดุลระหว่างความลึกของการให้เหตุผลและความเร็วในการตอบสนองได้อย่างละเอียดยิ่งขึ้น

Claude Opus 4.7 เปิดตัวครั้งใหญ่: AI แก้ไขข้อผิดพลาดได้ด้วยตัวเอง, ความสามารถด้านภาพเพิ่มขึ้นสองเท่า, ทักษะการเขียนโปรแกรมพัฒนาอย่างต่อเนื่อง

นอกจากนี้ ระดับความพยายามในการให้เหตุผลเริ่มต้นก็ถูกปรับจาก high เป็น xhigh ด้วย ซึ่งหมายความว่านักพัฒนาไม่จำเป็นต้องเปลี่ยนการตั้งค่าใดๆ โมเดลจะทำงานในโหมดที่รอบคอบกว่าเดิมโดยค่าเริ่มต้น

ยังมีฟีเจอร์ที่อยู่ในขั้นทดสอบ “Task Budgets” ซึ่งทำให้ Claude สามารถจัดการการบริโภค Token ได้ด้วยตัวเองเมื่อทำงานที่ยาวขึ้น รู้ว่าควรลงทรัพยากรเพิ่มเติมที่ใด และสามารถประหยัดที่ใดได้ ฟีเจอร์นี้ยังเป็นเวอร์ชันเบต้า แต่แสดงถึงทิศทางการปรับปรุงที่ถูกต้อง

6. ข้อควรระวังในการย้ายข้อมูล

การอัปเดตครั้งนี้รวมถึงการอัปเกรดตัวแบ่งคำ (Tokenizer) สำหรับเนื้อหาอินพุตเดียวกัน จำนวน Token อาจมากกว่าก่อนหน้านี้ประมาณ 0% ถึง 35%

Claude Opus 4.7 เปิดตัวครั้งใหญ่: AI แก้ไขข้อผิดพลาดได้ด้วยตัวเอง, ความสามารถด้านภาพเพิ่มขึ้นสองเท่า, ทักษะการเขียนโปรแกรมพัฒนาอย่างต่อเนื่อง

ข้อดีของการเปลี่ยนแปลงนี้คือโมเดลจะได้รับข้อมูลที่สมบูรณ์มากขึ้น ส่งผลให้ผลลัพธ์ที่ได้มีความน่าเชื่อถือมากขึ้น ราคาที่ต้องจ่ายคือต้นทุนการประมวลผลอาจเพิ่มขึ้นตามไปด้วย

Claude Opus 4.7 เปิดตัวครั้งใหญ่: AI แก้ไขข้อผิดพลาดได้ด้วยตัวเอง, ความสามารถด้านภาพเพิ่มขึ้นสองเท่า, ทักษะการเขียนโปรแกรมพัฒนาอย่างต่อเนื่อง

หากเวิร์กโฟลว์ที่มีอยู่มีความอ่อนไหวต่อการคิดค่าใช้จ่าย Token ควรระวังการเปลี่ยนแปลงนี้เมื่อเปลี่ยนโมเดล ทางการได้จัดทำคู่มือการย้ายข้อมูลโดยละเอียดไว้สำหรับอ้างอิง

7. สรุป: การขยายขอบเขตของระบบอัตโนมัติ

โมเดลที่ Anthropic เปิดตัวครั้งนี้ สามารถจัดการกับโซ่งานที่ยาวขึ้น มีความสามารถในการตรวจสอบตัวเอง และความเข้าใจด้านการมองเห็นเพิ่มขึ้นอย่างมาก

Claude Opus 4.7 เปิดตัวครั้งใหญ่: AI แก้ไขข้อผิดพลาดได้ด้วยตัวเอง, ความสามารถด้านภาพเพิ่มขึ้นสองเท่า, ทักษะการเขียนโปรแกรมพัฒนาอย่างต่อเนื่อง

ไม่นานมานี้ ฟีเจอร์ Routines ได้เปิดตัว ทำให้ AI สามารถลาดตระเวนได้อย่างกระตือรือร้น โดยไม่ต้องมีมนุษย์ทริกเกอร์ให้ทำงานอัตโนมัติ เมื่อรวมกับคุณสมบัติต่างๆ เช่น บริบทที่ยาวมาก ซับเอเจนต์, คำสั่ง /ultrareview การอัปเดตแต่ละครั้งดูเหมือนจะเป็น “ฟีเจอร์เล็กๆ น้อยๆ”

Claude Opus 4.7 เปิดตัวครั้งใหญ่: AI แก้ไขข้อผิดพลาดได้ด้วยตัวเอง, ความสามารถด้านภาพเพิ่มขึ้นสองเท่า, ทักษะการเขียนโปรแกรมพัฒนาอย่างต่อเนื่อง

แต่เมื่อพิจารณาการอัปเดตเหล่านี้รวมกัน แนวโน้มหนึ่งกำลังเกิดขึ้นอย่างเงียบๆ: ขั้นตอนที่ต้องการการแทรกแซงจากมนุษย์กำลังค่อยๆ ลดลง

AI สามารถตรวจสอบการส่งโค้ดในยามเช้ามืด ซิงค์เอกสารในวันหยุดสุดสัปดาห์ หรือรันการทดสอบในเวลาอาหาร สิ่งนี้ทำให้เราต้องคิดว่า: ทิศทางการวิวัฒนาการของเทคโนโลยีนี้ หมายความว่าอย่างไรกันแน่?


ลิงก์ที่เกี่ยวข้อง:
* บล็อกทางการประกาศเปิดตัว: https://www.anthropic.com/news/claude-opus-4-7
* ระบบการ์ด: https://anthropic.com/claude-opus-4-7-system-card
* คู่มือการย้ายข้อมูล: https://platform.claude.com/docs/en/about-claude/models/migration-guide
* เอกสาร Claude Code Routines: https://code.claude.com/docs/en/routines


⚠️ หมายเหตุ: เนื้อหาได้รับการแปลโดย AI และตรวจสอบโดยมนุษย์ หากมีข้อผิดพลาดโปรดแจ้ง

☕ สนับสนุนค่ากาแฟทีมงาน

หากคุณชอบบทความนี้ สามารถสนับสนุนเราได้ผ่าน PromptPay

PromptPay QR
SCAN TO PAY WITH ANY BANK

本文来自网络搜集,不代表คลื่นสร้างอนาคต立场,如有侵权,联系删除。转载请注明出处:http://www.itsolotime.com/th/archives/30648

Like (0)
Previous 2 hours ago
Next 2 hours ago

相关推荐