Claude Opus 4.7 เปิดตัวครั้งใหญ่: AI แก้ไขข้อผิดพลาดได้ด้วยตัวเอง, ความสามารถด้านภาพเพิ่มขึ้นสองเท่า, ทักษะการเขียนโปรแกรมพัฒนาอย่างต่อเนื่อง

2 hours ago • ข่าวสารอุตสาหกรรม AI • 11 views

Claude Opus 4.7 เปิดตัว: ความสามารถในการแก้ไขตัวเอง, การมองเห็น และประสิทธิภาพการเขียนโปรแกรมพัฒนาอย่างก้าวกระโดด

Anthropic ได้เปิดตัวโมเดล Claude Opus 4.7 อย่างเป็นทางการแล้ว เป้าหมายหลักของการอัปเดตครั้งนี้ สอดคล้องกับฟีเจอร์ “Routines” ที่เพิ่งเปิดตัวไป: เพื่อให้ AI สามารถจัดการกับโซ่งานที่ยาวและซับซ้อนได้ด้วยตนเอง และมีความสามารถในการตรวจสอบตัวเอง เพื่อลดความต้องการในการกำกับดูแลจากมนุษย์

Claude Opus 4.7 เปิดตัวครั้งใหญ่: AI แก้ไขข้อผิดพลาดได้ด้วยตัวเอง, ความสามารถด้านภาพเพิ่มขึ้นสองเท่า, ทักษะการเขียนโปรแกรมพัฒนาอย่างต่อเนื่อง

ในด้านราคา Opus 4.7 ยังคงมาตรฐานเดียวกับรุ่นก่อนหน้า 4.6: อินพุต 5 ดอลลาร์สหรัฐต่อล้าน Token เอาต์พุต 25 ดอลลาร์สหรัฐต่อล้าน Token

1. โมเดลที่มีความสามารถในการตรวจสอบความถูกต้องด้วยตนเอง

Opus 4.7 ได้นำเสนอความสามารถสำคัญที่ก่อนหน้านี้ไม่เด่นชัดนัก: ก่อนที่จะส่งคำตอบสุดท้ายให้ผู้ใช้ โมเดลจะทำการตรวจสอบความถูกต้องภายในตัวเองก่อนหนึ่งรอบ

เมื่อพบปัญหา โมเดลจะทำการแก้ไขภายใน จากนั้นจึงส่งออกผลลัพธ์ที่ได้รับการปรับปรุงแล้ว กลไกนี้มีความสำคัญอย่างมากในสถานการณ์ที่ AI ทำงานอัตโนมัติ ในอดีต เมื่อให้ Claude ทำงานที่ยาวนานหลายชั่วโมง อาจพบว่าขั้นตอนกลางมีข้อผิดพลาดเมื่อถึงตอนสุดท้าย แต่ตอนนี้ มันสามารถค้นพบและแก้ไขข้อผิดพลาดประเภทนี้ได้ด้วยตัวเอง จึงลดขั้นตอนที่ต้องมีการแทรกแซงจากมนุษย์ลงไปหนึ่งชั้น

จากผลตอบรับการใช้งานของ Rakuten การใช้ Opus 4.7 ในการรันงานผลิต อัตราการแก้ไขปัญหาสูงขึ้น 3 เท่า คุณภาพโค้ดได้รับการปรับปรุง “มากกว่าสิบออเดอร์ออฟแมกนิจูด” ในการทดสอบเวิร์กโฟลว์หลายขั้นตอน Opus 4.7 มีประสิทธิภาพดีกว่า 4.6 ถึง 14% อัตราความผิดพลาดในการเรียกใช้เครื่องมือลดลงประมาณหนึ่งในสาม ในขณะที่การบริโภค Token ก็ลดลงเช่นกัน

ผลลัพธ์คือการเพิ่มความน่าเชื่อถือ พร้อมกับการปรับปรุงต้นทุนให้ดีขึ้น

2. ความสามารถด้านการมองเห็นก้าวกระโดด

การอัปเดตครั้งนี้มีความก้าวหน้าอย่างเห็นได้ชัดในด้านความสามารถในการมองเห็น

Opus 4.7 รองรับการประมวลผลภาพที่มีความยาวด้านยาวที่สุดสูงถึง 2,576 พิกเซล ความละเอียดประมาณ 3.75 ล้านพิกเซล ซึ่งมากกว่าความสามารถของโมเดลก่อนหน้าถึง 3 เท่า สถานการณ์การใช้งานที่ทางการยกตัวอย่าง ได้แก่ การสร้างต้นแบบอินเทอร์เฟซ การสร้างงานนำเสนอ การตีความโครงสร้างเคมี และแผนภูมิทางเทคนิค ซึ่งเป็นงานที่ต้องการความแม่นยำในรายละเอียดสูง

จากข้อมูลที่ XBOW ให้ไว้ ในการทดสอบมาตรฐานการรับรู้ทางคอมพิวเตอร์วิทัศน์ Opus 4.7 ได้คะแนน 98.5% ในขณะที่ Opus 4.6 ได้คะแนน 54.5% การก้าวกระโดดจาก 54.5% เป็น 98.5% ถูกประเมินว่า “แก้ไขจุดบกพร่องหลักของเราได้อย่างสิ้นเชิง”

การเปลี่ยนแปลงนี้มีความสำคัญอย่างยิ่งสำหรับงานอัตโนมัติที่ต้องการความเข้าใจด้านการมองเห็น ในอดีต การให้ AI ระบุภาพหน้าจอ อ่านอินเทอร์เฟซผู้ใช้ หรือประมวลผลเอกสารที่มีทั้งข้อความและภาพ มีอัตราความผิดพลาดที่เห็นได้ชัด การเพิ่มขึ้นของความละเอียดและความสามารถในการเข้าใจครั้งนี้ เป็นรากฐานที่มั่นคงสำหรับ AI ในการจัดการกับงานด้านการมองเห็นที่ซับซ้อน

3. ความสามารถในการเขียนโปรแกรมที่พัฒนาอย่างต่อเนื่อง

ในด้านการเขียนโปรแกรม Opus 4.7 ก็แสดงให้เห็นถึงความแข็งแกร่งที่มากขึ้นเช่นกัน

ข้อมูลการทดสอบของ Cursor บน CursorBench แสดงว่า: Opus 4.7 ได้คะแนน 70% ในขณะที่ Opus 4.6 ได้ 58%

ผลตอบรับจาก Notion ชี้ให้เห็นว่า ประสิทธิภาพโดยรวมของโมเดลเพิ่มขึ้น 14% อัตราความผิดพลาดในการเรียกใช้เครื่องมือลดลงประมาณหนึ่งในสาม และเป็นครั้งแรกที่ผ่านการทดสอบรายการ “ความต้องการแฝง” ซึ่งคือความต้องการที่ไม่ได้ระบุไว้อย่างชัดเจน แต่ควรจะเข้าใจได้

CodeRabbit พบว่าเมื่อใช้มันในการตรวจสอบโค้ด อัตราการเรียกคืนการเปลี่ยนแปลงโค้ดสำหรับ Pull Request ที่ซับซ้อนที่สุดเพิ่มขึ้นมากกว่า 10% โดยที่ความแม่นยำยังคงเดิม Databricks สังเกตเห็นว่าในงานการให้เหตุผลเกี่ยวกับเอกสาร อัตราความผิดพลาดลดลง 21%

4. เพิ่มฟีเจอร์ตรวจสอบโค้ดเชิงลึก /ultrareview

Claude Code ครั้งนี้ได้เพิ่ม คำสั่ง /ultrareview โดยเฉพาะสำหรับการดำเนินการตรวจสอบโค้ดเชิงลึกหนึ่งรอบ

ฟีเจอร์นี้จะอ่านการเปลี่ยนแปลงโค้ดทั้งหมด และค้นหาปัญหาที่ผู้ตรวจสอบโค้ดที่เข้มงวดสามารถพบได้ รวมถึงข้อบกพร่องที่อาจเกิดขึ้นและปัญหาที่ระดับการออกแบบ ผู้ใช้ไม่จำเป็นต้องเปิดการสนทนาใหม่หรือขอตรวจสอบด้วยตนเอง เพียงคำสั่งเดียว โมเดลก็สามารถรันและสร้างรายงานการตรวจสอบได้โดยอัตโนมัติ

ในขณะเดียวกัน “โหมดอัตโนมัติ” ได้เปิดให้ผู้ใช้แผน Max ใช้งานแล้ว ทำให้ความถี่ของการถูกขัดจังหวะขณะรันงานยาวลดลง เมื่อรวมกับฟีเจอร์ Routines ที่เปิดตัวเร็วๆ นี้ ผู้ใช้สามารถกำหนดค่าการทำงานก่อนนอนและตั้งเงื่อนไขทริกเกอร์ แล้วดูผลลัพธ์ในเช้าวันรุ่งขึ้น สิ่งนี้ทำให้เวิร์กโฟลว์ “ให้ AI คอยดูแลแทน” เป็นไปอย่างราบรื่นมากขึ้น

5. API เพิ่มระดับความละเอียดของการให้เหตุผล

สำหรับนักพัฒนา การอัปเดตครั้งนี้ได้เพิ่มระดับการให้เหตุผล xhigh ใน API ซึ่งอยู่ระหว่างระดับ high และ max เดิม ก่อนหน้านี้ ช่องว่างระหว่าง high กับ max ค่อนข้างใหญ่ การเพิ่มระดับใหม่นี้ช่วยให้สามารถปรับสมดุลระหว่างความลึกของการให้เหตุผลและความเร็วในการตอบสนองได้อย่างละเอียดยิ่งขึ้น

นอกจากนี้ ระดับความพยายามในการให้เหตุผลเริ่มต้นก็ถูกปรับจาก high เป็น xhigh ด้วย ซึ่งหมายความว่านักพัฒนาไม่จำเป็นต้องเปลี่ยนการตั้งค่าใดๆ โมเดลจะทำงานในโหมดที่รอบคอบกว่าเดิมโดยค่าเริ่มต้น

ยังมีฟีเจอร์ที่อยู่ในขั้นทดสอบ “Task Budgets” ซึ่งทำให้ Claude สามารถจัดการการบริโภค Token ได้ด้วยตัวเองเมื่อทำงานที่ยาวขึ้น รู้ว่าควรลงทรัพยากรเพิ่มเติมที่ใด และสามารถประหยัดที่ใดได้ ฟีเจอร์นี้ยังเป็นเวอร์ชันเบต้า แต่แสดงถึงทิศทางการปรับปรุงที่ถูกต้อง

6. ข้อควรระวังในการย้ายข้อมูล

การอัปเดตครั้งนี้รวมถึงการอัปเกรดตัวแบ่งคำ (Tokenizer) สำหรับเนื้อหาอินพุตเดียวกัน จำนวน Token อาจมากกว่าก่อนหน้านี้ประมาณ 0% ถึง 35%

ข้อดีของการเปลี่ยนแปลงนี้คือโมเดลจะได้รับข้อมูลที่สมบูรณ์มากขึ้น ส่งผลให้ผลลัพธ์ที่ได้มีความน่าเชื่อถือมากขึ้น ราคาที่ต้องจ่ายคือต้นทุนการประมวลผลอาจเพิ่มขึ้นตามไปด้วย

หากเวิร์กโฟลว์ที่มีอยู่มีความอ่อนไหวต่อการคิดค่าใช้จ่าย Token ควรระวังการเปลี่ยนแปลงนี้เมื่อเปลี่ยนโมเดล ทางการได้จัดทำคู่มือการย้ายข้อมูลโดยละเอียดไว้สำหรับอ้างอิง

7. สรุป: การขยายขอบเขตของระบบอัตโนมัติ

โมเดลที่ Anthropic เปิดตัวครั้งนี้ สามารถจัดการกับโซ่งานที่ยาวขึ้น มีความสามารถในการตรวจสอบตัวเอง และความเข้าใจด้านการมองเห็นเพิ่มขึ้นอย่างมาก

ไม่นานมานี้ ฟีเจอร์ Routines ได้เปิดตัว ทำให้ AI สามารถลาดตระเวนได้อย่างกระตือรือร้น โดยไม่ต้องมีมนุษย์ทริกเกอร์ให้ทำงานอัตโนมัติ เมื่อรวมกับคุณสมบัติต่างๆ เช่น บริบทที่ยาวมาก ซับเอเจนต์, คำสั่ง /ultrareview การอัปเดตแต่ละครั้งดูเหมือนจะเป็น “ฟีเจอร์เล็กๆ น้อยๆ”

แต่เมื่อพิจารณาการอัปเดตเหล่านี้รวมกัน แนวโน้มหนึ่งกำลังเกิดขึ้นอย่างเงียบๆ: ขั้นตอนที่ต้องการการแทรกแซงจากมนุษย์กำลังค่อยๆ ลดลง

AI สามารถตรวจสอบการส่งโค้ดในยามเช้ามืด ซิงค์เอกสารในวันหยุดสุดสัปดาห์ หรือรันการทดสอบในเวลาอาหาร สิ่งนี้ทำให้เราต้องคิดว่า: ทิศทางการวิวัฒนาการของเทคโนโลยีนี้ หมายความว่าอย่างไรกันแน่?

ลิงก์ที่เกี่ยวข้อง:
* บล็อกทางการประกาศเปิดตัว: https://www.anthropic.com/news/claude-opus-4-7
* ระบบการ์ด: https://anthropic.com/claude-opus-4-7-system-card
* คู่มือการย้ายข้อมูล: https://platform.claude.com/docs/en/about-claude/models/migration-guide
* เอกสาร Claude Code Routines: https://code.claude.com/docs/en/routines

⚠️ หมายเหตุ: เนื้อหาได้รับการแปลโดย AI และตรวจสอบโดยมนุษย์ หากมีข้อผิดพลาดโปรดแจ้ง

☕ สนับสนุนค่ากาแฟทีมงาน

หากคุณชอบบทความนี้ สามารถสนับสนุนเราได้ผ่าน PromptPay

SCAN TO PAY WITH ANY BANK

本文来自网络搜集，不代表คลื่นสร้างอนาคต立场，如有侵权，联系删除。转载请注明出处：http://www.itsolotime.com/th/archives/30648

Like (0)

0 0

JD.com เปิดตัวโครงสร้างพื้นฐานข้อมูลอัจฉริยะแบบครบวงจรระดับโลกเป็นครั้งแรก โดยระดมคน 600,000 คนเพื่อรวบรวมข้อมูลจากสถานการณ์จริง 10 ล้านชั่วโมง

Previous 2 hours ago

MiniMax ใช้ Alibaba Cloud ปรับโครงสร้างพื้นฐานของ Agent สนับสนุนการเปลี่ยนแปลงระบบในยุคของ Intelligent Agent

Next 2 hours ago

ข่าวสารอุตสาหกรรม AI

YOLO26 วิเคราะห์เชิงลึก: วิวัฒนาการทศวรรษ เร่งความเร็วการประมวลผล CPU 43% และตรวจจับแบบเรียลไทม์บนอุปกรณ์ Edge ได้อย่างไร

คำสำคัญ: YOLO26, การวิวัฒนาการของสถาปัตยกรรม YOLO, อัลกอริทึมตรวจจับแบบครั้งเดียว (YOLO), การตรวจจับวัตถุ, การมองเห็นด้วยคอมพิวเตอร์, การเรียนรู้เชิงลึก ตลอดทศวรรษที่ผ่านมา อัลกอริ…

2026年2月18日
368000
ข่าวสารอุตสาหกรรม AI

Microsoft Copilot Cowork ระเบิดกลางดึก: Claude ที่ทรงพลังที่สุดเข้าควบคุม Office, คนทำงาน 450 ล้านคนเปลี่ยนชะตากินข้ามคืน!

【บทนำของ New Zhiyuan】 วิธีการทำงานของประชากรสำนักงาน 450 ล้านคนทั่วโลก อาจกำลังเผชิญกับการเปลี่ยนแปลงที่พลิกโฉม Microsoft ได้เปิดตัว Copilot Cowork ใหม่ล่าสุด ซึ่งผสานรวมโมเดล Clau…

2026年3月10日
202000
ข่าวสารอุตสาหกรรม AI

Typeless AI คีย์บอร์ดเสียง ทดสอบจริง: ค่าใช้จ่ายรายเดือนสูงกว่า ChatGPT Plus ทำไมผู้ใช้ 100,000 คนถึงยอมจ่าย?

ค่าสมัครสมาชิกรายเดือนเกิน 200 หยวน ราคาสูงกว่า ChatGPT Plus โดยตรง แต่ฟังก์ชันกลับมีเพียงอย่างเดียวคือการป้อนเสียง ฟังดูเหมือน “ภาษีคนโง่” ใช่ไหม? แต่ได้ยินมาว่ามีผู้ใ…

2026年2月9日
231000
ข่าวสารอุตสาหกรรม AI

อาลีเปิดตัว Zvec: ฐานข้อมูลเวกเตอร์ต้อนรับการปฏิวัติแบบเบา AI เข้าสู่ยุคใหม่ของการพัฒนาแอปพลิเคชัน

อาลีบาบาเปิดตัวฐานข้อมูลเวกเตอร์ Zvec เป็นโอเพนซอร์ส สำหรับผู้อ่านที่ไม่คุ้นเคยกับฐานข้อมูลเวกเตอร์ อธิบายง่ายๆ คือ มันถูกออกแบบมาเพื่อจัดเก็บและค้นหาข้อมูลเวกเตอร์โดยเฉพาะ มักใช้ใ…

2026年2月23日
322000
ข่าวสารอุตสาหกรรม AI

MiniMax-M2.5 เปิดตัวอย่างยิ่งใหญ่: AI รุ่นจีนสู้ศึกเทศกาลตรุษจีน ความสามารถในการสร้างเว็บไซต์และการเขียนโปรแกรมอัปเกรดอย่างครอบคลุม

สั่งด้วยประโยคเดียวก็สร้างเกม “Gold Miner” และเว็บไซต์บริษัทที่สวยงามได้ ข่าวจาก Zhidongxi วันที่ 12 กุมภาพันธ์ ใกล้ถึงเทศกาลตรุษจีนแล้ว การแข่งขันระหว่างโมเดล AI ขนาดใ…

2026年2月12日
210000

Claude Opus 4.7 เปิดตัว: ความสามารถในการแก้ไขตัวเอง, การมองเห็น และประสิทธิภาพการเขียนโปรแกรมพัฒนาอย่างก้าวกระโดด

1. โมเดลที่มีความสามารถในการตรวจสอบความถูกต้องด้วยตนเอง

2. ความสามารถด้านการมองเห็นก้าวกระโดด

3. ความสามารถในการเขียนโปรแกรมที่พัฒนาอย่างต่อเนื่อง

4. เพิ่มฟีเจอร์ตรวจสอบโค้ดเชิงลึก /ultrareview

5. API เพิ่มระดับความละเอียดของการให้เหตุผล

6. ข้อควรระวังในการย้ายข้อมูล

7. สรุป: การขยายขอบเขตของระบบอัตโนมัติ

☕ สนับสนุนค่ากาแฟทีมงาน

相关推荐

Microsoft Copilot Cowork ระเบิดกลางดึก: Claude ที่ทรงพลังที่สุดเข้าควบคุม Office, คนทำงาน 450 ล้านคนเปลี่ยนชะตากินข้ามคืน!

Typeless AI คีย์บอร์ดเสียง ทดสอบจริง: ค่าใช้จ่ายรายเดือนสูงกว่า ChatGPT Plus ทำไมผู้ใช้ 100,000 คนถึงยอมจ่าย?

อาลีเปิดตัว Zvec: ฐานข้อมูลเวกเตอร์ต้อนรับการปฏิวัติแบบเบา AI เข้าสู่ยุคใหม่ของการพัฒนาแอปพลิเคชัน