วิจัยของ New Zhiyuan
บรรณาธิการ: ไรโน
【บทนำของ New Zhiyuan】 Anthropic ได้วางโมเดล Claude Mythos ที่ทรงพลังที่สุดของตนไว้ภายใต้ข้อจำกัดที่เข้มงวดโดยสมัครใจ การเคลื่อนไหวครั้งนี้แสดงให้เห็นอย่างชัดเจนเป็นครั้งแรกว่า AI กำลังก้าวจากขั้นตอน “พูดได้” ไปสู่ขั้นตอน “ทำได้” จุดเปลี่ยนทางเทคโนโลยี (Technological Singularity) ไม่ใช่แค่จินตนาการอีกต่อไป
วันที่ 8 เมษายน Anthropic ประกาศเปิดตัว Claude Mythos Preview อย่างเป็นทางการ
บริษัทที่ยึดถือ “ความปลอดภัย” เป็นอันดับแรกเสมอนี้ ได้โยนระเบิดลูกใหญ่ที่สั่นสะเทือนอุตสาหกรรมซอฟต์แวร์ทั่วโลก — จากนั้น แทนที่จะเฉลิมฉลอง กลับรีบดำเนินการควบคุมระเบิดลูกนี้ไว้ภายใต้การควบคุมที่เข้มงวดทันที
ตามตรรกะปกติ นี่ควรเป็นการเปิดตัวประจำเกี่ยวกับ “พารามิเตอร์ใหญ่ขึ้น คะแนนสูงขึ้น ราคาแพงขึ้น” อย่างไรก็ตาม การเปิดตัวครั้งนี้มีสไตล์ที่แตกต่างออกไป: โมเดลถูกสร้างขึ้นแล้ว แต่ไม่มีความตั้งใจที่จะเปิดให้ใช้งานอย่างกว้างขวาง
Anthropic ระบุชัดเจนว่า Mythos Preview จะไม่เปิดให้ใช้งานทั่วไป แต่จะถูกนำเข้าสู่แผนควบคุมที่ชื่อว่า Project Glasswing ก่อน โดยเปิดให้คู่ค้าจำนวนน้อยใช้สำหรับการวิจัยด้านความปลอดภัยเชิงรับเท่านั้น

นอกเหนือจากคู่ค้ารุ่นแรกแล้ว Anthropic ยังขยายการให้บริการแก่สถาบัน กว่า 40 แห่ง ที่ดูแลโครงสร้างพื้นฐานซอฟต์แวร์สำคัญ พร้อมทั้งให้คำมั่นว่าจะมอบ วงเงินการใช้สูงสุด 100 ล้านดอลลาร์สหรัฐ และ เงินบริจาคโดยตรง 4 ล้านดอลลาร์สหรัฐ แก่องค์กรความปลอดภัยโอเพ่นซอร์ส
กล่าวอีกนัยหนึ่ง สิ่งที่ Anthropic เปิดตัวไม่ใช่แค่ “โมเดลใหม่” เท่านั้น แต่เป็น ประกาศทางเทคนิคที่มาพร้อมกับมาตรการแยกกัก แผนฉุกเฉิน และแผนรับมือความเสี่ยง
สิ่งที่สะเทือนใจที่สุดในเรื่องนี้ ไม่ใช่ที่ Mythos ทำคะแนนได้สูงกว่า Opus 4.6 กี่คะแนนในการทดสอบมาตรฐาน แต่คือ Anthropic เองก็ไม่ได้อธิบายมันอีกต่อไปว่าเป็น “โมเดลที่คุยเก่งขึ้น”
Anthropic กำลังส่งข้อความไปยังโลกว่า: ความสามารถของโมเดลกำลังก้าวข้ามจาก “การตอบคำถาม” ไปสู่ “การปฏิบัติงาน”
โลกกำลังก้าวเข้าสู่ยุคแห่งปัญญาปฏิบัติการ
ความสามารถด้านเครือข่ายที่ทรงพลังของ Mythos Preview มาจาก ทักษะการเข้ารหัสและการให้เหตุผลของเอเจนต์อัจฉริยะ
หน้าการประเมินอย่างเป็นทางการแบ่งความสามารถหลักออกเป็นสามประเภท: การเข้ารหัสเอเจนต์อัจฉริยะ การให้เหตุผล การค้นหาเอเจนต์อัจฉริยะและการใช้คอมพิวเตอร์
สามคำนี้เชื่อมโยงกันเพื่อเปิดเผยความจริง: ความก้าวหน้าของมันไม่ได้อยู่ที่การคุยเก่งขึ้น แต่อยู่ที่ความเชี่ยวชาญมากขึ้นในกระบวนการวงจรปิดของ การสังเกต การให้เหตุผล การดำเนินการ ประเมินผล และดำเนินการต่อ

เมื่อเข้าใจความหมายของคำว่า “ลงมือทำ” แล้ว เหตุการณ์ทั้งหมดนี้ก็ไม่ใช่แค่ข่าว AI ทั่วไปอีกต่อไป
จุดเปลี่ยนทางเทคโนโลยีที่แท้จริงซึ่งน่าตกใจ ไม่เคยเป็นเรื่องที่ว่า “AI จะคิดเหมือนมนุษย์หรือไม่” แต่เป็นว่า “AI สามารถทำงานเหมือนมนุษย์ได้หรือไม่ และทำได้เร็วกว่า มั่นคงกว่า และถูกกว่า”
ตราบใดที่โมเดลยังคงอยู่ในระดับการส่งออกข้อความ ภาพ หรือคำแนะนำ ไม่ว่าจะน่าทึ่งแค่ไหน ผลกระทบหลักของมันก็ยังจำกัดอยู่ที่ระดับข้อมูล
อย่างไรก็ตาม เมื่อมันเริ่มอ่านโค้ด เปิดเทอร์มินัล รันทดสอบ ค้นหาช่องโหว่ เขียนโปรแกรมเอ็กซ์พลอยต์ ควบคุมเบราว์เซอร์ เรียกใช้เครื่องมือต่างๆ โดเมนที่มันเข้าสู่ก็ไม่ใช่ “ปัญญาในการแสดงออก” อีกต่อไป แต่เป็น ปัญญาปฏิบัติการ
สิ่งที่ Mythos กำลังเข้าใกล้คือเส้นแบ่งนี้

ตามบล็อกที่เผยแพร่โดยทีม Red Team ของ Anthropic Mythos Preview สามารถระบุและใช้ประโยชน์จากช่องโหว่ซีโร่เดย์ใน ระบบปฏิบัติการหลักทุกตัว และ เบราว์เซอร์หลักทุกตัว ภายใต้คำสั่งของผู้ใช้
ในกรณีที่ได้รับการแก้ไขซึ่งพวกเขากล่าวถึง มีแม้กระทั่งช่องโหว่ที่ ซ่อนอยู่ใน OpenBSD มาเป็นเวลา 27 ปี

แล้วทำไมวอลล์สตรีทถึงรู้สึกไม่สบายใจก่อนใคร?
เพราะตลาดการเงินตระหนักได้เร็วกว่าสาธารณชนว่า: หนึ่งในเสาหลักพื้นฐานที่สุดของอุตสาหกรรมซอฟต์แวร์กำลังถูกสั่นคลอน
ตลอดหลายทศวรรษที่ผ่านมา การขุดค้นและใช้ประโยชน์จากช่องโหว่เป็นงานฝีมือที่หายาก ต้องพึ่งพาประสบการณ์ สัญชาตญาณ และความอดทนของนักวิจัยความปลอดภัยระดับสูงเพียงไม่กี่คน
ความหายากนี้ ได้หล่อเลี้ยงบริษัทความปลอดภัยนับไม่ถ้วน และสนับสนุนตรรกะการประเมินมูลค่าของโลก SaaS ทั้งหมด: ซอฟต์แวร์มีช่องโหว่เสมอ ดังนั้นแพตช์ การป้องกัน การตรวจสอบ การโฮสต์ และบริการให้คำปรึกษาจึงมีตลาดอยู่เสมอ; บุคลากรความปลอดภัยระดับสูงหายากเสมอ ดังนั้นบริการที่มีกำไรสูงจึงขายได้เสมอ
แต่ถ้าโมเดลเริ่มทำให้งานนี้เป็นอัตโนมัติ ขยายขนาดได้ และเร็วอย่างน่าตกใจ วันเวลาที่สบายที่สุดของอุตสาหกรรมซอฟต์แวร์ก็คงจะสิ้นสุดลง
หลังการอัปเดตการเปิดตัวของ Anthropic หุ้นซอฟต์แวร์สหรัฐฯ ร่วงลงอีกครั้ง ดัชนีซอฟต์แวร์และบริการ S&P 500 ลดลงสะสม 25.5% ตั้งแต่ต้นปี
ทุนกำลังทบทวนคำถามอีกครั้ง: หาก “การค้นพบช่องโหว่” และ “การซ่อมแซมโค้ด” ดูเหมือนจะเป็นความสามารถที่ได้มาจากการกองทรัพยากรการคำนวณมากขึ้นเรื่อยๆ แล้วคูเมืองของซอฟต์แวร์แบบดั้งเดิมจะมีมูลค่าเท่าใด?

ที่น่าสนใจยิ่งกว่านั้น ความกังวลนี้ได้แพร่กระจายจากตลาดไปสู่ระดับผู้กำกับดูแลแล้ว
ตามรายงานของรอยเตอร์ รัฐมนตรีกระทรวงการคลังสหรัฐฯ Scott Bessent และประธานเฟด Jerome Powell ได้หารือกับซีอีโอของธนาคารใหญ่เกี่ยวกับความเสี่ยงด้านความปลอดภัยไซเบอร์ที่มาจากโมเดลของ Anthropic; ในสหราชอาณาจักร ธนาคารแห่งอังกฤษ หน่วยงานกำกับดูแลการปฏิบัติทางการเงิน กระทรวงการคลัง และศูนย์ความปลอดภัยไซเบอร์แห่งชาติ กำลังประเมินผลกระทบที่อาจเกิดขึ้นจาก Mythos Preview อย่างเร่งด่วน และเตรียมการบรรยายสรุปความเสี่ยงให้กับธนาคาร บริษัทประกันภัย และตลาดหลักทรัพย์
โมเดลที่ยังไม่เปิดตัวอย่างเต็มที่ ได้ทำให้ธนาคาร ธนาคารกลาง กระทรวงการคลัง และหน่วยงานกำกับดูแลนั่งล้อมวงกันเพื่อหารือแล้ว
หลายคนจินตนาการจุดเปลี่ยนทางเทคโนโลยีว่าเป็น “โลกพลิกหน้าหนึ่งวันอย่างกะทันหัน” แต่ในความเป็นจริง จุดเปลี่ยนมักปรากฏในรูปแบบของ โลกเริ่มปรับเปลี่ยนโครงสร้างเพื่อมัน

จุดเปลี่ยนที่แท้จริงไม่ใช่โมเดลที่เหมือนมนุษย์มากขึ้น แต่เป็นโมเดลที่กลายเป็น “ผู้กระทำการในโลกดิจิทัล” ในวงกว้างเป็นครั้งแรก
ระบบส่วนใหญ่ของสังคมมนุษย์ โดยพื้นฐานแล้วไม่ได้ทำงานด้วย “การโน้มน้าว” แต่พึ่งพา “การดำเนินการ”
การทำงานของธนาคารพึ่งพาการเรียกใช้ระบบ กระบวนการชำระบัญชี ตรรกะการควบคุมความเสี่ยง และสายโซ่อำนาจ; การส่งมอบของบริษัทซอฟต์แวร์พึ่งพาการอ่าน แก้ไข ทดสอบโค้ด และเผยแพร่เวอร์ชัน; การป้องกันความปลอดภัยเครือข่ายพึ่งพาวงจรปิดของการค้นพบปัญหา ตรวจสอบปัญหา และแก้ไขปัญหา
ตราบใดที่โมเดลยังคงอยู่ในระดับการให้คำแนะนำ ไม่ว่าจะฉลาดแค่ไหน มันก็เป็นเพียงที่ปรึกษาระดับสูง; แต่เมื่อมันสามารถดำเนินการตามวงจรปิดของการดำเนินการได้ด้วยตัวเอง มันก็เริ่มมี ความสามารถในการแทนที่ตำแหน่งงาน และ พลังในการปรับเปลี่ยนระเบียบ
สิ่งที่ทำให้ขนลุกเกี่ยวกับ Mythos จริงๆ คือการที่มันแสดงให้เห็นถึงต้นแบบของความสามารถวงจรปิดนี้
นี่ยังอธิบายความขัดแย้งที่ชัดเจนและสำคัญอีกอย่างหนึ่ง: ทำไม Anthropic ในด้านหนึ่งสามารถแสดงปัญญาปฏิบัติการที่น่ากลัวได้ใน Mythos แต่ในอีกด้านหนึ่งกลับถูกนักพัฒนาวิจารณ์ว่า “ความสามารถลดลง” ในด้านผลิตภัณฑ์?
Issue ที่มีชื่อเสียงบน GitHub กล่าวอย่างตรงไปตรงมาว่า: ตั้งแต่การอัปเดตเดือนกุมภาพันธ์ Claude Code ไม่สามารถใช้สำหรับงานวิศวกรรมที่ซับซ้อนได้อีกต่อไป
ผู้ส่ง วิเคราะห์จากไฟล์เซสชัน Claude Code 6,852 ไฟล์ โมดูลการคิด 17,871 โมดูล และการเรียกใช้เครื่องมือ 234,760 ครั้ง เชื่อว่าความสามารถในการจัดการงานวิศวกรรมที่ซับซ้อนลดลงอย่างเห็นได้ชัด

แต่นี่กลับเผยให้เห็นความท้าทายที่แท้จริงที่สุดของ “ปัญญาปฏิบัติการ”: หากต้องการให้มันสามารถปฏิบัติงานได้จริง จำเป็นต้องมอบการให้เหตุผลที่ลึกซึ้งกว่า โซ่งานที่ยาวขึ้น การใช้ Token ที่สูงขึ้น และการสนับสนุนพลังการคำนวณที่มากขึ้น
นี่เปิดเผยความจริงที่กว้างขึ้นของอุตสาหกรรมล่วงหน้า: ปัญญาปฏิบัติการไม่ใช่อาหารกลางวันฟรี มันเป็นความสามารถระดับระบบที่มีต้นทุนสูง
สิ่งที่มันต้องการไม่ใช่เพียงอินเทอร์เฟซแชทที่สวยงามขึ้น แต่เป็นหน้าต่างบริบทที่ยาวขึ้น ความสามารถในการเรียกใช้เครื่องมือที่ทรงพลังขึ้น การจัดสรรทรัพยากรที่มั่นคงขึ้น งบประมาณการให้เหตุผลที่แพงขึ้น การแยกกักความปลอดภัยที่เข้มงวดขึ้น และกลยุทธ์ผลิตภัณฑ์ที่ซับซ้อนขึ้น
การที่ Mythos ถูก “ขังไว้ในกรง” ในระดับหนึ่ง ไม่เพียงเพราะอันตรายที่อาจเกิดขึ้น แต่ยังเพราะอุตสาหกรรมทั้งหมดยังไม่พร้อมว่าจะส่งมอบความสามารถในการปฏิบัติการที่อันตรายและทรงพลังนี้ให้กับผู้ใช้ทั่วไปอย่างไร ด้วยวิธีที่ต้นทุนต่ำ ควบคุมได้ และขยายขนาดได้
Anthropic ระบุไว้อย่างชัดเจนบนหน้าโครงการ Glasswing: เป้าหมายสุดท้ายของพวกเขาคือให้ผู้ใช้สามารถ ปรับใช้โมเดลระดับ Mythos อย่างปลอดภัยในวงกว้าง ไม่เพียงเพื่อความปลอดภัยเครือข่าย แต่ยังสำหรับสถานการณ์ที่มีมูลค่าสูงอื่นๆ
นัยแฝงของประโยคนี้คือ: ในปัจจุบันยังทำไม่ได้
ด้วยเหตุนี้ ความท้าทายที่ใหญ่ที่สุดที่ OpenAI เผชิญในปัจจุบัน อาจไม่ใช่แค่การถูกแซงบนชาร์ต แต่คือลูกค้าองค์กรเริ่มจ่ายเงินอย่างจริงจังมากขึ้นเรื่อยๆ สำหรับความสามารถทางปัญญาที่ “ลงมือทำได้” ของ Anthropic
ตามข้อมูลเดือนมีนาคม 2026 ที่เผยแพร่โดย Ramp ในบรรดาบริษัทที่ซื้อบริการ AI เป็นครั้งแรก Anthropic ได้รับคำสั่งซื้อ ประมาณ 70% ในการแข่งขันโดยตรงกับ OpenAI

Axios อ้างอิงข้อมูลจาก Ramp ชี้เพิ่มเติมว่า ส่วนแบ่งของ Anthropic ในการใช้จ่ายการจัดซื้อองค์กรใหม่ประเภทนี้เกิน 73% แล้ว
นี่ไม่ได้หมายความว่า OpenAI พ่ายแพ้โดยสิ้นเชิง — รายได้ที่คาดการณ์ของ OpenAI ในปีนี้ยังคงสูงกว่า Anthropic
แต่มันเปิดเผยแนวโน้มที่สำคัญยิ่งกว่า: องค์กรเริ่มเดิมพันด้วยเงินจริง ไม่ใช่แค่ “ใครตอบคำถามเก่งที่สุด” อีกต่อไป แต่คือใคร更像 ระบบที่สามารถฝังตัวในเวิร์กโฟลว์และเริ่มปฏิบัติงานได้จริง
สรุปแล้ว สิ่งที่ควรให้ความสนใจที่สุดเกี่ยวกับการเปิดตัว Mythos ของ Anthropic ครั้งนี้คือประเด็นเดียว: เรากำลังเห็นจุดเปลี่ยนที่ AI ก้าวจาก “ปัญญาภาษา” ไปสู่ “ปัญญาปฏิบัติการ” อย่างชัดเจนเป็นครั้งแรก
โมเดลในอดีต ไม่ว่าจะมีความสามารถแค่ไหน ก็更像是ที่ปรึกษา ครู นักเล่าเรื่อง หรือเลขาส่วนตัว
พวกมันสามารถโน้มน้าวคุณ เปิดหูเปิดตาคุณ ปลอบโยนคุณ สร้างข้อความให้คุณ แต่พวกมันแทบไม่เคยเข้าไปลึกในระบบ เพื่อดำเนินการชุดการดำเนินงานดิจิทัลที่สมบูรณ์แทนคุณ
ความหมายของ Mythos อยู่ที่การทำให้อุตสาหกรรมทั้งตระหนักขึ้นมาอย่างฉับพลันว่า: เส้นทางสู่ “ปัญญาปฏิบัติการ” นี้เป็นไปได้จริง และใกล้กว่าที่หลายคนคาดคิด
เมื่อโมเดลเชี่ยวชาญความสามารถวงจรปิดของ “การสังเกตสภาพแวดล้อม—วางแผน—เรียกใช้เครื่องมือ—ควบคุมระบบ—ตรวจสอบผลลัพธ์—พัฒนาต่ออย่างต่อเนื่อง” อย่างแท้จริงในวงกว้าง ซอฟต์แวร์ การเงิน ความปลอดภัยเครือข่าย บริการองค์กร และแม้แต่ตรรกะการกำกับดูแล จะถูกปรับโครงสร้างตามไปด้วย
จุดเปลี่ยนทางเทคโนโลยีไม่ใช่การที่มันประกาศกะทันหันว่า “ฉันคิด ดังนั้นฉันจึงมีอยู่” แต่คือการที่มันเริ่ม ลงมือปฏิบัติ
⚠️ หมายเหตุ: เนื้อหาได้รับการแปลโดย AI และตรวจสอบโดยมนุษย์ หากมีข้อผิดพลาดโปรดแจ้ง
☕ สนับสนุนค่ากาแฟทีมงาน
หากคุณชอบบทความนี้ สามารถสนับสนุนเราได้ผ่าน PromptPay
本文来自网络搜集,不代表คลื่นสร้างอนาคต立场,如有侵权,联系删除。转载请注明出处:https://www.itsolotime.com/th/archives/31305
