คลาวด์ขัดข้อง 7 ครั้งในครึ่งเดือน ตกใจกัน 3 ชั่วโมง! Anthropic กำลังขาดแคลนพลังประมวลผล ลงทุน 500 ล้านดอลลาร์เพื่อพัฒนาชิปของตัวเองเพื่อช่วยตัวเอง

Claude ครึ่งเดือนล่ม 7 ครั้ง ตกใจ 3 ชั่วโมง! Anthropic ขาดแคลนกำลังประมวลผล ลงทุน 500 ล้านดอลลาร์ พัฒนาชิปเองเพื่อเอาตัวรอด

【บทนำ】 ครั้งที่ 7 ในครึ่งเดือนที่ผ่านมา เกิดเหตุขัดข้องครั้งใหญ่ Claude ล่ม 3 ชั่วโมง ทำให้นักพัฒนาจำนวนมากถึงกับท้อแท้ สาเหตุเบื้องหลังคือ Anthropic ขาดแคลนกำลังประมวลผลอย่างหนัก เพื่อเอาตัวรอด ยูนิคอร์นบริษัทนี้ตัดสินใจลงมือพัฒนาชิปเอง

Claude ล่มทั่วโลก อีกครั้งที่ติดเทรนด์ทวิตเตอร์

เช้าวันพุธตามเวลาในสหรัฐอเมริกา Anthropic เผชิญกับวิกฤตระบบครั้งรุนแรง หน้าแสดงสถานะอย่างเป็นทางการระบุว่า Claude, Claude Code, และอินเทอร์เฟซ API ทั้งหมดมีอัตราความผิดพลาดสูง

คลาวด์ขัดข้อง 7 ครั้งในครึ่งเดือน ตกใจกัน 3 ชั่วโมง! Anthropic กำลังขาดแคลนพลังประมวลผล ลงทุน 500 ล้านดอลลาร์เพื่อพัฒนาชิปของตัวเองเพื่อช่วยตัวเอง

ผู้ใช้ Claude จำนวนมากรายงานว่างานของตนได้รับผลกระทบ ในช่วงที่ขัดข้องรุนแรงที่สุด มีผู้ใช้กว่า 6,000 คน รายงานปัญหาผ่านเว็บไซต์ติดตามความขัดข้อง Downdetector พร้อมกัน

ก่อนหน้านี้มีประสิทธิภาพของโมเดล Claude Opus ที่ผันผวน ตามมาด้วยการล่มบ่อยครั้ง สิ่งนี้ดูเหมือนจะยืนยันมุมมองในอุตสาหกรรม: Anthropic ไม่สามารถสำรองกำลังประมวลผลได้ทันเวลา นับเป็นความผิดพลาดเชิงกลยุทธ์

เพื่อเติมเต็มช่องว่างด้านกำลังประมวลผล Anthropic ไม่ยอมนั่งเฉยอีกต่อไป ถูกเปิดเผยว่ากำลังเริ่มสำรวจการพัฒนาชิปเอง

Claude ล่มอีกแล้ว! ตกใจ 3 ชั่วโมง

การล่มของ Claude สำหรับผู้ใช้จำนวนมากที่พึ่งพามันในการทำงาน ถือได้ว่าเป็นการ “หยุดงานของผลิตภาพ”

จากข้อมูลการตรวจสอบของ Downdetector การขัดข้องครั้งนี้ถึงจุดสูงสุดประมาณ 10:42 น.

ไทม์ไลน์ของเหตุการณ์ขัดข้องมีดังนี้:
* 10:53 น.: Anthropic อย่างเป็นทางการเริ่ม介入ตรวจสอบสาเหตุข้อผิดพลาด
* 12:30 น.: อัตราความสำเร็จในการเข้าสู่ระบบ Claude เริ่มมีเสถียรภาพ เจ้าหน้าที่กำลังแก้ไขปัญหาที่เหลืออย่างเต็มที่
* 13:50 น.: หน้าแสดงสถานะอัปเดตอย่างเป็นทางการ ระบบทั้งหมดกลับมาทำงานปกติแล้ว

การล่มเกือบสามชั่วโมง ส่งผลกระทบไม่น้อยต่อผู้ใช้ Claude ในการเขียนโค้ด งานเขียนบทความ ฯลฯ มีผู้ใช้บ่นว่า “โปรเจกต์ส่วนตัวหายวับไปในพริบตา”

แม้แต่นักพัฒนาบางคนยังแสดงความคิดเห็นว่าจะพิจารณาเปลี่ยนไปใช้เครื่องมือเขียนโค้ด AI อื่น

อย่างไรก็ตาม การหยุดให้บริการของ Claude ไม่ใช่เรื่องใหม่แล้ว

ตั้งแต่เดือนเมษายน เป็นครั้งที่ 7 แล้ว

ย้อนดูประวัติหน้าแสดงสถานะของ Anthropic ตั้งแต่เดือนเมษายน จังหวะการหยุดให้บริการถี่อย่างน่าประหลาด:
* 1 เมษายน: อัตราไทม์เอาต์ของโมเดล Opus และ Sonnet ผิดปกติ
* 3 เมษายน: Claude Code ล่ม 1 ชั่วโมง 10 นาที
* 6, 7 เมษายน: ระบบเข้าสู่ระบบล่มติดต่อกันสองวัน
* 10 เมษายน: โมเดลที่ไม่ใช่ Opus เกิดข้อผิดพลาดพร้อมกัน
* 13 เมษายน: บริการ Claude.ai หยุดให้บริการ 15 นาที
* 15 เมษายน: การล่มครั้งใหญ่ครั้งนี้ที่กินเวลา 3 ชั่วโมง

ในเวลาเพียงครึ่งเดือน มีการหยุดให้บริการที่สามารถตรวจสอบได้ถึงเจ็ดครั้ง นี่ไม่ใช่เหตุการณ์ที่เกิดขึ้นเป็นครั้งคราวอีกต่อไป แต่เป็นระบบที่กำลังส่งสัญญาณเตือนอย่างต่อเนื่อง

Anthropic มักจะอธิบายเหตุการณ์ประเภทนี้ว่าเป็นเพราะ “ความต้องการที่ไม่เคยมีมาก่อนหลังจากการเปิดตัวครั้งสำคัญ” พูดตรงๆ ก็คือ ผู้ใช้เติบโตเร็วเกินไป โหลดเซิร์ฟเวอร์ใกล้ถึงขีดจำกัดแล้ว

ความขัดข้องเป็นเพียงภาพปรากฏ สาเหตุรากลึกอยู่ที่การขาดแคลนกำลังประมวลผล

ค่าธรรมเนียมเข้าสนาม 500 ล้านดอลลาร์ Anthropic ก็จะสร้างชิปเองแล้ว

เมื่อไม่นานมานี้ มีข่าวเปิดเผยว่า: Anthropic กำลังสำรวจการพัฒนาชิป AI ด้วยตัวเอง

ได้ข่าวว่า แผนการนี้ยังอยู่ในขั้นตอน “เริ่มต้นมาก” บริษัทยังไม่ได้กำหนดแผนการออกแบบที่ชัดเจน และยังไม่ได้จัดตั้งทีมเฉพาะสำหรับโครงการนี้

การประมาณการในอุตสาหกรรม ค่าใช้จ่ายเริ่มต้นในการออกแบบชิป AI ขั้นสูงประมาณ 500 ล้านดอลลาร์ 主要用于จ่ายค่าตอบแทนวิศวกรระดับสูง ทดสอบการผลิตชิป และรับประกันความน่าเชื่อถือของขั้นตอนการผลิต นี่เป็นเพียง “ค่าธรรมเนียมเข้าสนาม” เท่านั้น

จากการออกแบบถึงการผลิตจำนวนมาก โดยปกติต้องใช้เวลา 3 ถึง 4 ปี ในระหว่างนี้ หากมีปัญหาที่ขั้นตอนใดก็อาจทำให้การลงทุนก่อนหน้านี้สูญเปล่าได้

ยกตัวอย่าง TPU ของ Google ตั้งแต่เริ่มโครงการในปี 2013 จนถึงชิปรุ่นที่สามในปี 2018 ที่มีความสามารถในการฝึกฝนในระดับใหญ่ ใช้เวลาทั้งสิ้นห้าปี

ดังนั้น Anthropic ในที่สุดอาจเลือกที่จะซื้อต่อมากกว่าพัฒนาเอง แต่การ “สำรวจ” นี้ในตัวมันเอง ได้ปล่อยสัญญาณที่ชัดเจนออกมาแล้ว

ปัจจุบัน Anthropic ใช้ GPU ของ NVIDIA, TPU ของ Google, ชิปของ Amazon และฮาร์ดแวร์อื่นๆ ในการพัฒนาและใช้งาน Claude เมื่อสัปดาห์ที่แล้ว พวกเขาเพิ่งประกาศอย่างเป็นทางการว่าจะร่วมมือกับ Google และ Broadcom สร้างคลัสเตอร์ซูเปอร์คอมพิวเตอร์ขนาด 3.5GW

ยักษ์ใหญ่ AI กำลังหลีกเลี่ยง NVIDIA ทั้งหมด

Anthropic ไม่ใช่กรณีพิเศษ ยักษ์ใหญ่ AI อื่นๆ ก็กำลังแสวงหาความเป็นอิสระด้านกำลังประมวลผลเช่นกัน:
* Meta กำลังร่วมมือกับ Broadcom ขยายการผลิตชิป MTIA ที่พัฒนาด้วยตัวเอง วางแผนที่จะเริ่มติดตั้งกำลังประมวลผลระดับ “หลาย GW” ตั้งแต่ปี 2027
* แผนความร่วมมือกับ Broadcom ที่ OpenAI ประกาศในเดือนตุลาคมปีที่แล้ว มีเป้าหมายเริ่มติดตั้งในครึ่งหลังของปี 2026 และจะติดตั้งกำลังประมวลผลสะสม 10GW ภายในปี 2029

| คลาวด์ขัดข้อง 7 ครั้งในครึ่งเดือน ตกใจกัน 3 ชั่วโมง! Anthropic กำลังขาดแคลนพลังประมวลผล ลงทุน 500 ล้านดอลลาร์เพื่อพัฒนาชิปของตัวเองเพื่อช่วยตัวเอง
—|—

ทำไมยักษ์ใหญ่ AI ถึงหันหน้าเข้าหา Broadcom?

ความแตกต่างหลักระหว่างชิป ASIC ที่ออกแบบเองและ GPU ทั่วไปของ NVIDIA มีสองประการ:
1. ต้นทุนรวมในการถือครอง (TCO): ASIC ที่ปรับให้เหมาะสมกับโมเดลเฉพาะ สามารถต่ำกว่า GPU ทั่วไปได้ 30% ถึง 50%
2. ประสิทธิภาพพลังงาน: ประสิทธิภาพต่อวัตต์สูงกว่า GPU ทั่วไปถึงหนึ่งระดับ

ฟังดูเหมือนเป็นการโจมตีแบบลดมิติ แต่ ASIC ก็มีข้อด้อยของมันเช่นกัน: โดยปกติจะผูกกับสถาปัตยกรรมโมเดลเฉพาะ เมื่อโมเดลมีการพัฒนา ประสิทธิภาพของฮาร์ดแวร์อาจลดลง และขาดระบบนิเวศนักพัฒนาที่เป็นผู้ใหญ่เหมือน CUDA ในขั้นตอนการวิจัยและการทดลองยังต้องพึ่งพา NVIDIA อยู่

Anthropic เองก็ยอมรับอย่างชัดเจนว่า Claude ในปัจจุบันถูกปรับใช้ข้ามสถาปัตยกรรมบนฮาร์ดแวร์สามประเภท ได้แก่ AWS Trainium, Google TPU และ GPU ของ NVIDIA ไม่ได้วางเดิมพันทั้งหมดกับซัพพลายเออร์รายเดียว

แต่กลยุทธ์ “หลายคลาวด์ หลายชิป” นี้ในตัวมันเอง ยอมรับความจริงข้อหนึ่ง: ไม่มีซัพพลายเออร์รายใดที่สามารถตอบสนองความต้องการกำลังประมวลผลมหาศาลของบริษัท AI ชั้นนำได้เพียงลำพัง

และเงื่อนไขที่ดีที่สุดที่ซัพพลายเออร์สามารถให้ได้ มักจะสงวนไว้สำหรับชิปที่ออกแบบโดยตัวเองเท่านั้น นี่อาจเป็นแรงจูงใจพื้นฐานที่ทำให้ Anthropic สำรวจเส้นทางการพัฒนาด้วยตัวเอง

ยิ่งทำเงิน ยิ่งขาดเงิน

แน่นอน Anthropic เติบโตอย่างรวดเร็วในช่วงสองปีที่ผ่านมา ตามการเปิดเผยล่าสุดอย่างเป็นทางการ รายได้ต่อปีทะลุ 300 พันล้านดอลลาร์แล้ว ในตลาดองค์กร ข้อมูลแสดงว่า 73% ของการใช้จ่ายครั้งแรกขององค์กรสำหรับเครื่องมือ AI ไหลไปที่ Anthropic

ลูกค้าองค์กรกว่า 1,000 ราย มีการจ่ายเงินต่อปีเกิน 1 ล้านดอลลาร์ และตัวเลขนี้เพิ่มขึ้นเป็นสองเท่าในเวลาไม่ถึงสองเดือน

แต่ยิ่งเติบโตเร็ว แรงกดดันทางการเงินก็ยิ่งมาก

ผลิตภัณฑ์เอเจนต์ (Agent) เช่น Claude Code และ Claude Cowork เป็นหลุมดำของกำลังประมวลผลอย่างแท้จริง พวกมันสามารถทำงานต่อเนื่องหลายชั่วโมงเพื่อปฏิบัติงาน การตอบสนองแต่ละครั้งใช้ทรัพยากร GPU จำนวนมาก

อัตรากำไรขั้นต้นของ Anthropic ในปี 2025 ต่ำกว่าที่คาดไว้เนื่องจากต้นทุนการอนุมานโมเดลที่สูง นี่ไม่ใช่ความลับในอุตสาหกรรมอีกต่อไป

เพื่อปรับสมดุลบัญชี Anthropic ได้推出มาตรการสามข้อติดต่อกันในช่วงไม่กี่สัปดาห์ที่ผ่านมา:

ปรับราคาสำหรับ Enterprise Edition: เปลี่ยน Claude Enterprise จากระบบสมาชิกล้วนๆ เป็นรูปแบบ “ค่าธรรมเนียมรายเดือน 20 ดอลลาร์ + จ่ายตามการใช้งาน” ในรูปแบบใหม่ ค่าธรรมเนียมคงที่ลดลง แต่การใช้ Token จะคิดตามการใช้งานจริง (ไม่ส่งผลกระทบต่อบริษัทขนาดเล็กที่มีพนักงานน้อยกว่า 150 คน) การประมาณการแสดงว่า ต้นทุนของผู้ใช้ที่ใช้งานหนักอาจเพิ่มเป็นสองเท่าหรือสามเท่า

โฆษกของ Anthropic อธิบายเรื่องนี้ว่า การกำหนดราคาใหม่สามารถสะท้อนสถานการณ์การใช้งานจริงของลูกค้าได้อย่างแม่นยำมากขึ้น กล่าวอีกนัยหนึ่ง มุ่งเป้าไปที่การเรียกเก็บเงินแยกสำหรับผู้ใช้ที่ใช้กำลังประมวลผลมากที่สุด
จำกัดการเรียกใช้เครื่องมือของบุคคลที่สาม: ผู้ใช้สมาชิก Claude Code หากใช้เครื่องมือเอเจนต์ของบุคคลที่สามบางอย่าง ต้องจ่ายเงินเพิ่ม เจ้าหน้าที่ระบุว่า กำลังประมวลผลเป็นทรัพยากรที่ต้องคำนวณอย่างละเอียด ต้องให้ความสำคัญกับลูกค้าที่ใช้ผลิตภัณฑ์และ API ของตัวเองก่อน
เปิดตัวการตรวจสอบยืนยันตัวตนบังคับ (KYC): 要求ผู้ใช้提供เอกสารราชการและรูปเซลฟี่แบบเรียลไทม์เพื่อยืนยันตัวตน ประกาศอย่างเป็นทางการระบุชัดเจนว่า “การสร้างบัญชีจากภูมิภาคที่ไม่ได้รับการสนับสนุน” เป็นหนึ่งในเหตุผลที่ห้ามใช้ ซึ่งส่งผลกระทบอย่างมีนัยสำคัญต่อผู้ใช้ในบางภูมิภาค

บัญชีในประเทศที่พึ่งพาการเข้าถึง Claude ผ่านตัวกลาง, เปลือกหุ้ม หรือพูลแชร์ ภายใต้กระบวนการตรวจสอบยืนยันนี้แทบจะผ่านไม่ได้ บันทึกการสนทนา, พรอมต์ และบริบทโปรเจกต์ที่สะสมไว้ก่อนหน้านี้ จะถูกล้างทั้งหมดเมื่อบัญชีถูกระงับ

มาตรการข้างต้นทั้งหมดมุ่งเป้าไปที่การกดดันด้านอุปสงค์ เพื่อขจัดผู้ใช้ที่ใช้งานมากเกินไป

อย่างไรก็ตาม ไม่ว่าจะบีบอัดด้านอุปสงค์อย่างไร เพดานกำลังประมวลผลด้านอุปทานก็ยังคงมีอยู่

Sudip Roy ผู้ร่วมก่อตั้ง Adaption Labs และอดีตหัวหน้าฝ่ายอนุมานของ Cohere กล่าวถึงปัญหาพื้นฐานของผลิตภัณฑ์ AI แบบสมาชิก: การใช้รูปแบบสมาชิก สมมติฐานทางธุรกิจพื้นฐานเดิมคือการเดิมพันว่าผู้ใช้จะไม่ใช้เต็มโควตา

ถ้าเดิมพันแพ้ ก็ต้องลงมือทำ “พลั่ว” เอง