
Anthropic ได้เปิดตัว Claude Opus 4.7 อย่างเป็นทางการแล้ว การอัปเดตครั้งนี้มุ่งเน้นไปที่การปรับปรุงความสามารถด้านวิศวกรรมซอฟต์แวร์อย่างมีนัยสำคัญ Opus 4.7 แสดงประสิทธิภาพโดดเด่นในงานการเขียนโปรแกรมที่ซับซ้อนที่สุด โดยผู้ใช้รายงานว่ามันสามารถจัดการงานโค้ดที่ซับซ้อนซึ่งก่อนหน้านี้ต้องได้รับการดูแลอย่างใกล้ชิดได้อย่างอิสระ โมเดลนี้สามารถทำงานที่ใช้เวลานานและมีหลายขั้นตอน ปฏิบัติตามคำสั่งอย่างเคร่งครัด และตรวจสอบผลลัพธ์ด้วยตัวเองก่อนที่จะส่งออกขั้นสุดท้าย

Opus 4.7 พร้อมให้บริการแล้วผ่านผลิตภัณฑ์ Claude ทั้งหมด API และแพลตฟอร์ม Amazon Bedrock, Google Cloud Vertex AI และ Microsoft Foundry ราคายังคงเหมือนกับ Opus 4.6: อินพุต 5 ดอลลาร์สหรัฐต่อล้านโทเค็น เอาต์พุต 25 ดอลลาร์สหรัฐต่อล้านโทเค็น นักพัฒนาสามารถเรียกใช้โมเดลนี้ได้ผ่านตัวระบุ claude-opus-4-7
ความสามารถในการรับอินพุตภาพก้าวกระโดด
Opus 4.7 รองรับความละเอียดของภาพอินพุตที่สูงขึ้นอย่างมาก โดยด้านที่ยาวที่สุดสามารถสูงถึง 2576 พิกเซล หรือประมาณ 3.75 ล้านพิกเซลรวม ซึ่งมากกว่าสามเท่าของโมเดล Claude รุ่นก่อนหน้า การปรับปรุงนี้ให้การสนับสนุนที่แข็งแกร่งขึ้นสำหรับเอเจนต์อัตโนมัติที่ต้องประมวลผลภาพหน้าจอที่มีข้อมูลหนาแน่น การดึงข้อมูลจากแผนภูมิที่ซับซ้อน และงานที่ต้องอาศัยการอ้างอิงรายละเอียดระดับพิกเซล

ในด้านงานมืออาชีพ Opus 4.7 สร้างอินเทอร์เฟซผู้ใช้ งานนำเสนอ และเอกสารที่มีคุณภาพสูงขึ้น การประเมินภายในแสดงให้เห็นว่ามันทำได้ในระดับที่ดีที่สุดในงานเอเจนต์ทางการเงิน สามารถทำการวิเคราะห์ทางการเงินที่เข้มงวดมากขึ้น สร้างงานนำเสนอที่มืออาชีพยิ่งขึ้น และบูรณาการข้ามงานได้แน่นแฟ้นยิ่งขึ้น ในการประเมินบุคคลที่สาม GDPval-AA ซึ่งครอบคลุมงานความรู้มูลค่าสูงหลายด้าน เช่น การเงิน กฎหมาย Opus 4.7 ก็ทำคะแนนได้ดีที่สุดเช่นกัน
ข้อควรทราบสำคัญ: ความสามารถในการปฏิบัติตามคำสั่งของ Opus 4.7 ได้รับการปรับปรุงอย่างมีนัยสำคัญ ซึ่งอาจนำไปสู่ผลลัพธ์ที่ไม่คาดคิดจากพรอมต์ที่เขียนสำหรับโมเดลรุ่นเก่า โมเดลรุ่นเก่าอาจตีความคำสั่งอย่างยืดหยุ่นหรือข้ามบางส่วน ในขณะที่ Opus 4.7 จะพยายามปฏิบัติตามคำสั่งอย่างเคร่งครัดตามตัวอักษร ผู้ใช้อาจจำเป็นต้องปรับพรอมต์และขั้นตอนการทำงานใหม่
ความสามารถในการจดจำของโมเดลก็ดีขึ้นเช่นกัน Opus 4.7 เก่งกว่าในการใช้ระบบไฟล์เพื่อจัดเก็บข้อมูลสำคัญ สามารถรักษาความต่อเนื่องของความทรงจำระหว่างงานที่ทำงานยาวนานหลายงานได้ ส่งผลให้ต้องการบริบทเบื้องต้นน้อยลงเมื่อรับงานใหม่
คุณลักษณะด้านความปลอดภัย
ก่อนหน้านี้ Anthropic ได้ประกาศ “Project Glasswing” ซึ่งมีเป้าหมายเพื่อสำรวจความเสี่ยงและคุณค่าของโมเดล AI ในด้านความปลอดภัยทางไซเบอร์ และวางแผนที่จะทดสอบมาตรการป้องกันความปลอดภัยทางไซเบอร์ใหม่กับโมเดลที่อ่อนแอก่อน แล้วจึงค่อยๆ นำไปใช้กับโมเดลที่ทรงพลังมากขึ้น
Opus 4.7 เป็นโมเดลแรกในแผนงานนี้ ความสามารถในการโจมตีทางเครือข่ายของมันต่ำกว่าโมเดล Mythos Preview โดย Anthropic จงใจยับยั้งความสามารถด้านนี้ในระหว่างการฝึกฝน เมื่อเปิดตัว โมเดลมีกลไกป้องกันในตัวที่ตรวจจับและบล็อกการใช้ประโยชน์ด้านความปลอดภัยทางไซเบอร์ที่ผิดกฎหมายหรือมีความเสี่ยงสูงโดยอัตโนมัติ Anthropic ระบุว่าประสบการณ์จากการปรับใช้ครั้งนี้จะให้ข้อมูลสนับสนุนสำหรับการเปิดตัวโมเดลระดับ Mythos ในวงกว้างในอนาคต
ผู้เชี่ยวชาญด้านความปลอดภัยที่มีความต้องการด้านความปลอดภัยทางไซเบอร์ที่ถูกกฎหมาย (เช่น การวิจัยช่องโหว่ การทดสอบเจาะระบบ การประเมินทีมแดง ฯลฯ) สามารถสมัครเข้าร่วม “โครงการตรวจสอบความปลอดภัยทางไซเบอร์” (Cyber Verification Program) ที่เปิดตัวใหม่ได้
ประสิทธิภาพด้านความปลอดภัยโดยรวมใกล้เคียงกับ Opus 4.6: มีอัตราการเกิดปัญหาต่างๆ เช่น การหลอกลวง การประจบสอพลอ การร่วมมือกับการใช้ในทางที่ผิด ในระดับต่ำ มีการปรับปรุงในด้านความซื่อสัตย์และการต้านทานการโจมตีด้วยการฉีดพรอมต์ที่เป็นอันตราย อย่างไรก็ตาม ประสิทธิภาพในการให้คำแนะนำเพื่อลดอันตรายจากสารควบคุมของ Opus 4.7 ลดลงเล็กน้อย ผลการประเมินการจัดแนวสรุปว่าโมเดลมีประสิทธิภาพโดยรวมดีและน่าเชื่อถือ แต่ยังไม่ถึงระดับในอุดมคติ โมเดลที่จัดแนวได้ดีที่สุดในปัจจุบันยังคงเป็น Mythos Preview สามารถอ่านการประเมินความปลอดภัยโดยละเอียดได้ใน “Claude Opus 4.7 System Card”
ฟังก์ชันใหม่ที่เปิดตัวพร้อมกัน
การควบคุมการให้เหตุผลที่ละเอียดยิ่งขึ้น: เพิ่มระดับความพยายาม “สูงมาก” (xhigh) ซึ่งอยู่ระหว่างระดับ “สูง” (high) และ “สูงสุด” (max) ช่วยให้ผู้ใช้สามารถปรับความลึกของการให้เหตุผลกับความเร็วในการตอบสนองได้อย่างละเอียดยิ่งขึ้น ใน Claude Code ระดับความพยายามเริ่มต้นสำหรับทุกแผนได้ถูกปรับขึ้นเป็น “สูงมาก” แล้ว เมื่อทดสอบการเขียนโปรแกรมและสถานการณ์เอเจนต์ แนะนำให้เริ่มจากระดับ “สูง” หรือ “สูงมาก”
การอัปเดต API: นอกเหนือจากการรองรับภาพความละเอียดสูงขึ้นแล้ว ฟังก์ชัน “งบประมาณงาน” (task budgets) ได้เข้าสู่ขั้นตอนการทดสอบสาธารณะแล้ว ช่วยให้นักพัฒนาสามารถควบคุมการจัดสรรการใช้โทเค็นของ Claude ในงานที่ทำงานยาวนานได้
การอัปเดต Claude Code: เพิ่มคำสั่งสแลช /ultrareview ซึ่งสามารถใช้เพื่ออ่านการเปลี่ยนแปลงโค้ดโดยเฉพาะ และระบุจุดบกพร่องและปัญหาการออกแบบที่ผู้ตรวจสอบอย่างละเอียดอาจพบ ผู้ใช้ Pro และ Max จะได้รับโอกาสทดลองใช้ฟรีสามครั้งแต่ละคน นอกจากนี้ โหมด “อัตโนมัติ” (Auto) ได้เปิดให้ผู้ใช้ Max แล้ว ในโหมดนี้ Claude จะตัดสินใจเกี่ยวกับสิทธิ์แทนผู้ใช้ ซึ่งจะลดการรบกวนผู้ใช้ในระหว่างการทำงานของงานยาวนาน ในขณะที่ปลอดภัยกว่าการข้ามการตรวจสอบสิทธิ์ทั้งหมด
ข้อควรพิจารณาก่อนอัปเกรดจาก Opus 4.6
ประการแรก Opus 4.7 ใช้โทเค็นไนเซอร์ที่ใหม่กว่า ข้อความอินพุตเดียวกันจะใช้จำนวนโทเค็นประมาณ 1.0 ถึง 1.35 เท่าของรุ่นก่อนหน้า ขึ้นอยู่กับประเภทของเนื้อหา ประการที่สอง ในรอบปฏิสัมพันธ์ต่อๆ ไปของสถานการณ์เอเจนต์ Opus 4.7 ที่ระดับความพยายามที่สูงขึ้นจะสร้างข้อความกระบวนการให้เหตุผลภายในมากขึ้น ซึ่งช่วยเพิ่มความน่าเชื่อถือแต่ก็เพิ่มจำนวนโทเค็นเอาต์พุตด้วย

ผู้ใช้สามารถควบคุมการใช้โทเค็นได้โดยการปรับพารามิเตอร์ระดับความพยายาม ตั้งค่างบประมาณงาน หรือขอให้โมเดลตอบอย่างกระชับมากขึ้นในพรอมต์ การทดสอบภายในของ Anthropic แสดงให้เห็นว่าในงานประเมินการเขียนโปรแกรม การใช้โทเค็นรวม (อินพุต+เอาต์พุต) ในทุกระดับความพยายามยังคงดีขึ้น แต่แนะนำให้วัดแยกต่างหากกับปริมาณการใช้งานจริง คำแนะนำโดยละเอียดในการอัปเกรดสามารถดูได้ในคู่มือการโยกย้ายอย่างเป็นทางการ
แหล่งที่มา: https://www.anthropic.com/news/claude-opus-4-7
⚠️ หมายเหตุ: เนื้อหาได้รับการแปลโดย AI และตรวจสอบโดยมนุษย์ หากมีข้อผิดพลาดโปรดแจ้ง
☕ สนับสนุนค่ากาแฟทีมงาน
หากคุณชอบบทความนี้ สามารถสนับสนุนเราได้ผ่าน PromptPay
本文来自网络搜集,不代表คลื่นสร้างอนาคต立场,如有侵权,联系删除。转载请注明出处:http://www.itsolotime.com/th/archives/30655
