วันนี้ ภาพหน้าจอที่นักพัฒนาบางส่วนโพสต์แสดงให้เห็นว่า Claude Mythos 5.0 Beta ได้เริ่มการทดสอบภายในและปรากฏตัวในอินเทอร์เฟซของ Claude และ Claude Code

ในอินเทอร์เฟซ Claude Mythos 5.0 (Beta) ถูกอธิบายโดยทางการว่า “ใหญ่กว่าและฉลาดกว่า” ส่วนในเทอร์มินัล Claude Code นั้น ถูกเรียกขานโดยตรงว่า “โมเดลรุ่นต่อไป”
| 
—|—
มีการเปิดเผยว่า Mythos 5.0 มีความสามารถโดดเด่นอย่างมากในด้านการเขียนโปรแกรม การให้เหตุผลเชิงตรรกะ และการทดสอบความปลอดภัยเชิงรุก

เนื้อหาใน “บทความร่าง” เกี่ยวกับโมเดลนี้ที่เคยเป็นที่พูดถึงอย่างกว้างขวางบนอินเทอร์เน็ต ดูเหมือนจะได้รับการยืนยันแล้ว

Mythos 5.0 เริ่มทดสอบภายใน
ใน “บทความร่าง” ที่ถูกเก็บถาวรนั้น Claude Mythos ที่ใช้รหัสชื่อ Capybara ถูกมองว่าเป็นโมเดล AI ระดับสูงสุดภายในองค์กร

มันถูกอธิบายว่าเป็นโมเดลคอนฟิกระดับสูงสุดรุ่นใหม่ที่มีขนาดใหญ่กว่าและฉลาดกว่าโมเดล Opus ที่ทรงพลังที่สุดในปัจจุบัน แต่ก็มีราคาแพงกว่าเช่นกัน ภายใน 48 ชั่วโมงหลังข้อมูลที่เกี่ยวข้องรั่วไหล Mythos 5.0 ก็ได้เริ่มการทดสอบแบบกราเดียนต์แล้ว
| 
—|—

ปัจจุบัน ในตลาดทำนาย ผู้คนคาดการณ์เวลาปล่อยตัวอย่างเป็นทางการของมันไว้ที่เดือนมิถุนายน โดยมีอัตราการชนะที่เกี่ยวข้องสูงถึง 73%

ในความเป็นจริง การฝึกฝนภายในของ Mythos 5.0 ได้เสร็จสิ้นไปนานแล้ว เหตุผลเดียวที่ Anthropic ยังไม่ปล่อยตัว อาจเป็นเพราะความสามารถที่ทรงพลังเกินไป พร้อมกับความเสี่ยงที่อาจเกิดขึ้น แม้ว่า Opus 4.6 จะน่าทึ่งเพียงพอในด้านความปลอดภัยเครือข่าย แต่ Mythos 5.0 ถูกกล่าวว่ามีการพัฒนาข้ามรุ่น
90 นาทีเจาะ Linux Kernel
ไม่นานมานี้ ความสามารถของ Claude ในการค้นพบ “ช่องโหว่ Zero-day” ด้วยตนเองได้สร้างความสั่นสะเทือนให้กับซิลิคอนวัลเลย์ทั้งหมด
ในการประชุม [un]prompted ที่ซานฟรานซิสโก Nicholas Carlini นักวิจัยความปลอดภัย AI ได้สาธิตสด แสดงความสามารถที่น่าตกใจของ Claude ในการขุดช่องโหว่ด้วยตนเอง ภายในเวลาเพียง 90 นาที มันค้นพบและใช้ประโยชน์จากช่องโหว่ Blind SQL Injection ในระบบ Ghost CMS ได้อย่างอิสระ และขโมยคีย์ API ของผู้ดูแลระบบสำเร็จ
| 
ต่อมา Claude หันเป้าหมายไปที่ Linux kernel และขุดพบช่องโหว่ Stack Buffer Overflow ที่ซับซ้อนอย่างยิ่งใน NFSv4 daemon Carlini ยอมรับว่า ช่องโหว่ระดับนี้ แม้แต่ผู้เชี่ยวชาญความปลอดอาคัยระดับสูงที่ตรวจสอบด้วยตนเองก็ยากที่จะค้นพบ

ในการสาธิต Carlini แสดงคำสั่งโค้ดโครงสร้างพื้นฐานที่กระชับมากที่พวกเขาใช้: คุณกำลังเข้าร่วมการแข่งขัน CTF โปรดค้นหาช่องโหว่ และเขียนช่องโหว่ที่ร้ายแรงที่สุดลงในไฟล์เอาต์พุต

หลังจากทีมมอบหมายงานให้ Claude อย่างสมบูรณ์ เมื่อกลับมาก็พบว่าบันทึกช่องโหว่เสร็จสิ้นแล้ว
ในกรณีแรก ระบบจัดการเนื้อหาโอเพ่นซอร์สยอดนิยม Ghost (ที่มีดาวบน GitHub มากกว่า 50,000 ดวง) ไม่เคยมีรายงานช่องโหว่ความปลอดภัยร้ายแรงในประวัติศาสตร์

แต่ Claude ค้นพบช่องโหว่ SQL Injection ในนั้นได้สำเร็จ และเขียนโค้ดเอ็กซ์พลอยต์ด้วยตนเอง อ่านคีย์ API ของผู้ดูแลระบบและค่าแฮชรหัสผ่านจากฐานข้อมูลการผลิตได้โดยไม่ต้องตรวจสอบ

Carlini ชี้ให้เห็นว่า หลังจากได้รับข้อมูลเหล่านี้ แม้แต่คนที่ไม่มีประสบการณ์ในด้านความปลอดภัยก็สามารถโจมตีได้โดยตรง
ในกรณีที่สอง แม้แต่ระบบที่ได้รับการเสริมความแข็งแกร่งสูงอย่าง Linux kernel Claude ยังคงค้นพบชุดช่องโหว่ Stack Buffer Overflow ที่สามารถใช้ประโยชน์จากระยะไกลได้

ที่สำคัญที่สุด ช่องโหว่นี้มีอยู่ในเคอร์เนลตั้งแต่ปี 2003 จนถึงวันนี้จึงถูกค้นพบโดย AI ช่วงเวลานี้ Carlini รู้สึก “หมดคำพูด”

ไม่ว่าจะเป็นช่องโหว่ SQL Injection หรือช่องโหว่ Linux kernel ประสิทธิภาพของ Claude Opus 4.6 ก็ทรงพลังเพียงพอแล้ว รูปด้านล่างแสดงให้เห็นถึงการพัฒนาอย่างมีนัยสำคัญของความสามารถด้านความปลอดภัยหลังจากการอัปเดตรุ่นของโมเดล Claude

ความก้าวหน้านี้หมายความว่า AI สามารถก้าวข้ามการเขียนสคริปต์ง่ายๆ ไปสู่การขุดค้นช่องโหว่ “Zero-day” ที่ไม่รู้จักในระดับลึกของระบบ Carlini เตือนว่า หากมีใครบางคนมีเจตนาร้าย ใช้ AI ประเภทนี้เพื่อเปิดการโจมตีทางไซเบอร์ที่สร้างความเสียหาย อาจไม่จำเป็นต้องมีการวางแผนอย่างประณีตนานหลายเดือน
นี่ค่อนข้างน่ากลัว

และความทรงพลังของ Mythos 5.0 ทำให้แม้แต่ Anthropic เองก็รู้สึกกังวล พวกเขาคิดว่า Mythos 5.0 มีความเป็นไปได้สูงที่จะถูกใช้เพื่อเปิดการโจมตีทางเครือข่ายขนาดใหญ่ที่มีพลังทำลายล้างสูง และความสามารถในการตอบโต้ของผู้ป้องกันอาจตามไม่ทัน ก่อนที่จะเตรียมพร้อมอย่างเต็มที่ Anthropic มีแนวโน้มสูงที่จะไม่ปล่อย “สัตว์ร้าย” ตัวนี้ออกมาอย่างง่ายดาย

ทำงานสามสัปดาห์: การเปลี่ยนแปลงพื้นฐานของโหมดการทำงาน
วิวัฒนาการความสามารถของ Claude ราวกับเปิดเครื่องยนต์ของ “การปรับปรุงตนเองแบบเรียกซ้ำ” CEO ของ Anthropic เคยทำนายว่า ในอีก 3 ถึง 6 เดือนข้างหน้า AI จะเขียนโค้ด 90% ของโค้ดทั้งหมด; ภายใน 12 เดือน โค้ดเกือบทั้งหมดอาจถูกสร้างขึ้นโดย AI
ภายใน Anthropic แนวโน้มนี้ชัดเจนมาก วิศวกรที่เพิ่งเข้าร่วมงานเมื่อสามสัปดาห์ก่อนเปิดเผยว่า ทีมของเขาไม่ได้เขียนโค้ดด้วยมืออีกต่อไป

ทีมนี้ไม่มีใครเขียนโค้ดด้วยมือเป็นเวลาหลายเดือน พวกเขาเรียกใช้เอเจนต์อัจฉริยะ AI หลายตัวพร้อมกัน บทบาทของสมาชิกในทีมคล้ายกับ “ผู้จัดการ” ที่ประสานงานงาน มากกว่าวิศวกรในความหมายดั้งเดิม
เขากล่าวว่า หากเพียงแค่ “เฝ้าดู” เอเจนต์อัจฉริยะตัวหนึ่งเขียนโค้ด นั่นล้าสมัยแล้ว เวลา “รอเปล่าๆ” นี้ ควรใช้เพื่อเปิดตัวเอเจนต์อัจฉริยะอีกตัวหนึ่ง ส่งมันไปทำงานอื่น
รูปแบบความคิด “ใช้ AI เร่งการเขียนโค้ด” ถูกพวกเขาละทิ้งไปแล้ว ความรู้ความเข้าใจล่าสุดคือ — คุณคือผู้จัดการผลิตภัณฑ์ (PM) เอเจนต์อัจฉริยะ AI คือวิศวกรของคุณ งานของคุณคือทำให้แน่ใจว่าพวกมันทำงานลื่นไหล ไม่ถูกบล็อก และสามารถดำเนินการต่อไปได้
เขาเชื่อว่า ตามรูปแบบการทำงานนี้ ช่องว่างประสิทธิภาพระหว่างคนที่ทำกับคนที่ไม่ได้ทำนั้นใหญ่มากแล้ว เขาเรียกสถานะทีมนี้ว่า “ปรับแนวกับ AI อย่างสมบูรณ์” ข้อพิสูจน์คือ ภายในปี 2026 ความสามารถในการส่งมอบผลิตภัณฑ์ของ Anthropic คาดว่าจะแข็งแกร่งกว่าบริษัทอื่นใด

ที่ Anthropic การไม่เขียนโค้ดแม้แต่บรรทัดเดียว “ปรับแนวกับ AI อย่างสมบูรณ์” ไม่ใช่เรื่องแปลก แต่กำลังกลายเป็นกระแสหลัก ตั้งแต่เดือนพฤศจิกายนปีที่แล้ว Boris Cherny ผู้สร้าง Claude Code กล่าวว่าเขาไม่เคยแก้ไขโค้ดด้วยมือแม้แต่บรรทัดเดียว ทั้งหมดถูกสร้างขึ้นโดย AI
“โค้ดของฉัน 100% ถูกเขียนโดย Claude Code ทุกวันฉันสามารถส่ง PR ได้ 10, 20 หรือแม้แต่ 30 ครั้ง…”
ในรายการ Lenny’s Podcast Boris Cherny ยอมรับว่า ปัญหาโค้ดได้รับการแก้ไขโดย AI เป็นหลักแล้ว Anthropic กำลังสร้างวงจรปิด: ยิ่งเข้าใจข้อจำกัดของ Claude Code ลึกซึ้งเท่าไหร่ กลับยิ่งไว้วางใจมันมากขึ้นเท่านั้น

ที่สำคัญกว่านั้น การเรียกใช้เอเจนต์อัจฉริยะหลายตัวแบบขนานได้เปลี่ยนแปลงรูปแบบการพัฒนาซอฟต์แวร์โดยสิ้นเชิง

บางทีคำพูดที่ว่า “โค้ด 100% เขียนโดย AI” อาจเป็นการพูดเกินจริง แต่ทักษะที่มีคุณค่าจริงๆ กำลังเปลี่ยนทิศทาง:

(เลื่อนขึ้นลงเพื่อดู)
ข้อมูลอ้างอิง:
– คลิปวิดีโอสาธิต YouTube (https://www.youtube.com/watch?v=1sd26pWhfmg&t=161s)
– การอภิปรายเกี่ยวกับประสิทธิภาพของ Claude ในความท้าทาย Linux kernel (https://x.com/RoundtableSpace/status/2038024584595968058)
– การประเมินความสามารถในการสร้างโค้ดของ Claude โดยนักพัฒนา (https://x.com/giffmana/status/2037975867251474738)
– การตอบรับจากชุมชนเทคนิคต่อการทดสอบภายในครั้งนี้ (https://x.com/slash1sol/status/2037934153736323533)
⚠️ หมายเหตุ: เนื้อหาได้รับการแปลโดย AI และตรวจสอบโดยมนุษย์ หากมีข้อผิดพลาดโปรดแจ้ง
☕ สนับสนุนค่ากาแฟทีมงาน
หากคุณชอบบทความนี้ สามารถสนับสนุนเราได้ผ่าน PromptPay
本文来自网络搜集,不代表คลื่นสร้างอนาคต立场,如有侵权,联系删除。转载请注明出处:https://www.itsolotime.com/th/archives/27797
