ยุคของเอเจนต์ต้องการปรัชญาการคิดเงินและวิศวกรรมแบบใด? หลัว ฟู่ลี่ หัวหน้าตัวแบบใหญ่ MiMo ของ Xiaomi ได้อธิบายมุมมองของเธอบนแพลตฟอร์มโซเชียล X เมื่อเร็วๆ นี้

ก่อนหน้านี้ มีข่าวหนึ่งดึงดูดความสนใจ: Anthropic ประกาศว่า ผู้ใช้สมาชิก Claude Pro และ Max จะไม่สามารถใช้โควต้าสมาชิกของตนกับเฟรมเวิร์กเอเจนต์ของบุคคลที่สามอย่าง OpenClaw ได้อีกต่อไป หากต้องการใช้งานต่อ ต้องเปลี่ยนไปใช้โหมด API ที่คิดเงินตามการใช้งาน การเปลี่ยนแปลงนี้ทำให้ผู้ใช้จำนวนมากที่พึ่งพาระบบสมาชิกในการสร้างเอเจนต์ด้วย Claude ตกอยู่ในสถานการณ์ลำบาก
Anthropic อธิบายอย่างเป็นทางการว่า โมเดลการกำหนดราคาของระบบสมาชิกออกแบบมาโดยอิงจาก “ความเข้มข้นของการใช้งานปกติของผู้ใช้รายบุคคล” อย่างไรก็ตาม ความเข้มข้นในการใช้งานของเครื่องมือเอเจนต์อัตโนมัติอย่าง OpenClaw นั้นสูงเกินความคาดหมายมาก – มีผู้ใช้หนักที่จ่ายค่าสมาชิกเพียง 20 ดอลลาร์ต่อเดือน แต่กลับใช้ทรัพยากรคอมพิวเตอร์ที่มีมูลค่าสูงถึง 5,000 ดอลลาร์ สร้างแรงกดดันด้านต้นทุนมหาศาลให้กับ Anthropic
เมื่อข่าวออกมา ปฏิกิริยามีหลากหลาย ผู้ใช้บางส่วนรู้สึก “ถูกแทงข้างหลัง” คิดว่าความน่าดึงดูดของโหมดสมาชิกลดลงอย่างรวดเร็ว บางคนก็แสดงการสนับสนุน คิดว่าการดำเนินการนี้ช่วยกำจัดการใช้งานที่ไม่มีประสิทธิภาพ และรับประกันความยั่งยืนโดยรวมของแพลตฟอร์ม
ไม่ว่าจะมีจุดยืนอย่างไร ปัญหาหลักหนึ่งได้ปรากฏชัดเจนแล้ว: โมเดลการคิดเงินปัจจุบันที่อิงตาม token กำลังเผชิญกับความท้าทายที่รุนแรง อุตสาหกรรมต้องการวิธีการใช้พลังคอมพิวเตอร์และการคิดเงินที่ชาญฉลาดและยั่งยืนยิ่งขึ้น
“หลุมลึก” ต้นทุนเบื้องหลังระบบสมาชิก
ในโพสต์ หลัว ฟู่ลี่ ชี้ให้เห็นเป็นอันดับแรกว่า ระบบสมาชิกของ Anthropic มีแนวโน้มสูงที่ดำเนินการขาดทุนมาตลอด
ระบบสมาชิกของ Claude Code เป็นระบบการกระจายสมดุลพลังคอมพิวเตอร์ที่ออกแบบมาอย่างดี การประเมินของฉันคือ – มันมีโอกาสสูงที่จะไม่ทำกำไร หรืออาจกำลังขาดทุนอยู่ เว้นแต่ว่าอัตรากำไรของ API ของพวกเขาจะสูงถึง 10-20 เท่า ซึ่งฉันยังสงสัยในเรื่องนี้ การเชื่อมต่อเฟรมเวิร์กของบุคคลที่สามสร้างความสูญเสียมากแค่ไหน ฉันไม่สามารถคำนวณได้อย่างแม่นยำ แต่ฉันเคยสังเกตการจัดการบริบทของ OpenClaw อย่างใกล้ชิด – มันเขียนได้แย่มาก ภายในคำขอหนึ่งครั้งของผู้ใช้ มันจะเรียกใช้เครื่องมือหลายรอบที่มีมูลค่าต่ำ แต่ละครั้งจะส่งออกเป็นคำขอ API แยกกัน และแต่ละครั้งจะพกพาหน้าต่างบริบทที่ยาวมาก (มักจะเกิน 100,000 token) – แม้แคชจะถูก命中 ก็ยังสิ้นเปลืองอย่างยิ่ง ในกรณีรุนแรงยังอาจดึงอัตราการไม่命中แคชของคำขออื่นๆ ให้สูงขึ้นได้
เมื่อคำนวณแล้ว จำนวนการเรียกใช้ API ที่ถูกเรียกจริงโดยคำขอผู้ใช้หนึ่งครั้ง มากกว่าของเฟรมเวิร์ก Claude Code เองหลายเท่า เมื่อแปลงเป็นราคา API ต้นทุนจริงน่าจะเป็นหลายสิบเท่าของราคาสมาชิก นี่ไม่ใช่ช่องว่าง – นี่คือหลุม
ความเจ็บปวดบังคับให้วิศวกรรมก้าวหน้า
สำหรับ “ความเจ็บปวด” ที่เกิดจากการที่ผู้ใช้สมาชิกถูกตัดสิทธิ์การเข้าถึง หลัว ฟู่ลี่ คิดว่าในระยะยาวสิ่งนี้มีประโยชน์ และจะบังคับให้เกิดความก้าวหน้าในทางปฏิบัติด้านวิศวกรรม
เฟรมเวิร์กของบุคคลที่สามอย่าง OpenClaw, OpenCode ยังคงสามารถเรียกใช้ Claude ผ่าน API ได้ เพียงแต่ไม่สามารถอาศัยระบบสมาชิกแบบ搭便车 (ขึ้นรถฟรี) ได้อีกต่อไป ในระยะสั้น ต้นทุนของผู้ใช้เอเจนต์เหล่านี้จะเพิ่มขึ้นอย่างง่ายดายหลายสิบเท่า และจะรู้สึกได้อย่างชัดเจน แต่แรงกดดันเช่นนี้ เป็นแรงผลักดันให้เฟรมเวิร์กเหล่านี้ปรับปรุงการจัดการบริบทอย่างจริงจัง เพิ่มอัตราการ命中แคชของพรอมต์ให้สูงสุดเพื่อนำบริบทที่ประมวลผลแล้วกลับมาใช้ใหม่ ลดการใช้ token ที่ไม่มีประสิทธิภาพ ความเจ็บปวดจะเปลี่ยนเป็นวินัยทางวิศวกรรมในที่สุด
ในขณะเดียวกัน เธอได้ส่งคำเตือนไปยังบริษัทตัวแบบใหญ่: อย่าเพิ่งรีบเร่งเข้าไปในสงครามราคาอย่างมืดบอด การขาย token ในราคาต่ำมากแต่ปล่อยให้เครื่องมือของบุคคลที่สาม “ถอนขนแกะ” (ใช้ประโยชน์) เป็นกับดัก
ฉันอยากจะแนะนำผู้ผลิตตัวแบบใหญ่ว่า ก่อนที่จะคิดให้ชัดเจนว่าจะกำหนดราคาสำหรับสมาชิกประเภทการเขียนโปรแกรมอย่างไร เพื่อไม่ให้ก่อให้เกิดการขาดทุนมหาศาล อย่าเพิ่งรีบเร่งเข้าไปสู่ด้านล่างของราคาอย่างมืดบอด การขาย token ในราคาถูกมาก และในขณะเดียวกันก็เปิดประตูต้อนรับเฟรมเวิร์กของบุคคลที่สาม 表面上 (ดูเผินๆ) เป็นมิตรกับผู้ใช้ แต่จริงๆ แล้วเป็นกับดัก – Anthropic เพิ่งจะปีนออกมาจากกับดักนี้ ปัญหาที่ลึกซึ้งยิ่งกว่าคือ: หากผู้ใช้ใช้เวลาและพลังงานไปกับเฟรมเวิร์กเอเจนต์คุณภาพต่ำ ไปกับบริการการอนุมานที่ไม่มีเสถียรภาพและช้า ไปกับโมเดลที่หดตัวลงเพื่อลดต้นทุน และในที่สุดก็พบว่ายังทำอะไรสำเร็จไม่ได้เลย – นี่จะเป็นวงจรชั่วร้ายต่อประสบการณ์ผู้ใช้และการคงอยู่ของผู้ใช้
การตอบสนองของ Xiaomi: MiMo Token Plan
หลัว ฟู่ลี่ ได้แนะนำ MiMo Token Plan ที่ Xiaomi เปิดตัวเมื่อเร็วๆ นี้ และเน้นย้ำถึงแนวคิดการออกแบบของมัน
เกี่ยวกับ MiMo Token Plan – มันรองรับการเชื่อมต่อเฟรมเวิร์กของบุคคลที่สาม คิดเงินตามโควต้า token ตรรกะเหมือนกับแพ็คเกจการใช้เพิ่มเติมที่ Claude เปิดตัวใหม่ เพราะสิ่งที่เราต้องการคือการส่งมอบโมเดลและบริการคุณภาพสูงอย่างมั่นคงในระยะยาว – ไม่ใช่ให้ผู้ใช้จ่ายเงินอย่างหุนหันพลันแล่น แล้วละทิ้งเรือไป


ทางออกในอนาคต: วิวัฒนาการร่วมกัน ไม่ใช่ token ราคาถูก
เธอชี้ให้เห็นในตอนท้ายว่า อัตราการเติบโตของอุปทานพลังคอมพิวเตอร์ทั่วโลกในปัจจุบันตามไม่ทันความต้องการ token ที่ถูกสร้างขึ้นโดยแอปพลิเคชันเอเจนต์ ทางออกที่แท้จริงไม่ใช่ token ที่ถูกกว่า แต่คือวิวัฒนาการร่วมกันระหว่าง “เฟรมเวิร์กเอเจนต์ที่ใช้ token น้อยลง” กับ “โมเดลที่ทรงพลังและมีประสิทธิภาพมากขึ้น”
หลัว ฟู่ลี่ คิดว่าการดำเนินการของ Anthropic ครั้งนี้ ไม่ว่าจุดประสงค์ดั้งเดิมจะเป็นอย่างไร แต่โดยวัตถุประสงค์แล้วกำลังผลักดันระบบนิเวศทั้งหมด – รวมถึงโอเพ่นซอร์สและปิดซอร์ส – ไปในทิศทางนี้ นี่อาจเป็นสิ่งที่ดี
การอภิปรายร้อนในชุมชน: ตั้งแต่ข้อโต้แย้งเรื่องราคาสู่การเขียนโครงสร้างใหม่
มุมมองของหลัว ฟู่ลี่ ได้ก่อให้เกิดเสียงสะท้อนอย่างรุนแรงในชุมชนนักพัฒนา จุดสนใจของการอภิปรายได้เปลี่ยนอย่างรวดเร็วจาก “Anthropic ทำถูกหรือไม่” เป็นปัญหาพื้นฐานหลายประการ:
1. นี่ไม่ใช่ข้อโต้แย้งเรื่องราคา แต่เป็นการเขียนโครงสร้างเศรษฐศาสตร์ AI ใหม่
ดังที่หลัว ฟู่ลี่ กล่าว ต้นทุนต่อหน่วยของบริการ AI ไม่เคยถูกกำหนดโดยโมเดลเพียงอย่างเดียว แต่ถูกกำหนดโดยการซ้อนทับของ “โมเดล × เฟรมเวิร์ก × การจัดการบริบท” การดำเนินการของ Anthropic ครั้งนี้ ได้ทำการทดสอบแรงกดดันการคัดเลือกโดยธรรมชาติต่อเฟรมเวิร์กเอเจนต์โดยไม่ตั้งใจ

มีมุมมองที่พูดตรงไปตรงมาว่า: สัญญาณที่แท้จริงที่การดำเนินการของ Anthropic ส่งผ่านคือ – ชั้นการจัดเรียง (Orchestration Layer) เองคือผลิตภัณฑ์ ไม่ใช่แค่โมเดลพื้นฐาน ความตึงเครียดระหว่างระบบสมาชิกกับการคิดเงิน API เป็นเพียงอาการพื้นผิวของตรรกะที่ลึกซึ้งกว่านี้

2. อย่าเพิ่งรีบวิพากษ์วิจารณ์การกำหนดราคา ให้ตรวจสอบก่อนว่าพลังคอมพิวเตอร์ถูกทำให้สูญเสียไปอย่างไร
“การทำให้พลังคอมพิวเตอร์สูญเปล่า” ที่หลัว ฟู่ลี่ กล่าวถึง ได้ก่อให้เกิดเสียงสะท้อนจากผู้ปฏิบัติงานจำนวนมาก มีคนพูดตรงประเด็นว่า: นี่ไม่ใช่ปัญหา “AI แพงเกินไป” แต่เป็นปัญหา “พลังคอมพิวเตอร์ถูกทำลาย” – การออกแบบเฟรมเวิร์กที่หยาบ หน้าต่างบริบทขนาดใหญ่ บวกกับการเรียกใช้ที่ซ้ำซ้อนไม่จำเป็น เผาผลาญเงินจำนวนมากแต่แลกมาด้วยผลผลิตจริงที่ไม่ได้สัดส่วน

ความเข้าใจลึกซึ้งของนักพัฒนาคนหนึ่งลึกซึ้งยิ่งกว่า: การตัดสินใจประมวลผลบริบทภายใน Claude Code ไม่เคยเป็นพารามิเตอร์เริ่มต้นอะไร แต่เป็นผลลัพธ์ของการอบ “ความสามารถในการตัดสินใจทางวิศวกรรม” ที่ผ่านการพิจารณาอย่างรอบคอบซ้ำแล้วซ้ำเล่า เช่น “เก็บอะไร ทิ้งอะไร บีบอัดเมื่อไหร่” เข้าไปในโครงสร้างอย่างลึกซึ้ง สิ่งที่เฟรมเวิร์กของบุคคลที่สามมักขาดหายไปมักไม่ใช่ฟังก์ชันการทำงาน แต่คือ “ความเห็นทางวิศวกรรม” ที่ถูกสร้างเข้าไปภายในและผ่านการไตร่ตรองอย่างลึกซึ้งเช่นนี้

นักพัฒนาอีกคนใช้ประสบการณ์ของตัวเองมายืนยันจุดนี้: เมื่อเดือนที่แล้วเขาใช้เวลามากมายในการทำความสะอาดตรรกะที่ซ้ำซ้อนในชั้นการจัดเรียงเก่าที่สร้างให้ลูกค้า “การทำความสะอาดความยุ่งเหยิง ยากกว่าตอนสร้างเสียอีก”

3. การแข่งขันคัดออกของตลาดเริ่มต้นแล้ว แต่ผลลัพธ์ยังไม่แน่นอน
หลัว ฟู่ลี่ คิดว่าแรงกดดันด้านต้นทุนจะบังคับให้เฟรมเวิร์กวิวัฒนาการ แต่เหล่านักพัฒนาได้ตั้งคำถามที่แหลมคมยิ่งขึ้น: เฟรมเวิร์กของบุคคลที่สามจะสามารถเติมเต็มช่องว่างด้านประสิทธิภาพได้เร็วพอหรือไม่ ทำให้การกำหนดราคาแบบอิง API ยังคงเป็นไปได้ในทางเศรษฐกิจ? หรือผู้ใช้ส่วนใหญ่จะกลับไปใช้แพลตฟอร์มอย่างเป็นทางการอย่าง Claude Code โดยค่าเริ่มต้น เนื่องจากต้นทุนที่รุนแรงเกินไป?

เส้นทางทั้งสองนี้จะนำไปสู่โครงสร้างระบบนิเวศที่แตกต่างกันโดยสิ้นเชิง มีนักพัฒนาเสริมว่า: สิ่งที่นักพัฒนาเฟรมเวิร์กต้องการจริงๆ ไม่ใช่สิทธิ์การเข้าถึงที่คลุมเครือแบบ “ถูกบรรจุไว้ภายใน” แต่คือโควต้าและข้อจำกัดของ token ที่ชัดเจนและคาดการณ์ได้ – ขอบเขตที่ชัดเจนจะส่งเสริมพฤติกรรมผลิตภัณฑ์ที่ดีขึ้น ในขณะที่พื้นที่สีเทาที่คลุมเครือจะสร้างความสับสนและไม่มีประสิทธิภาพ

สรุป
โพสต์ของหลัว ฟู่ลี่ นี้ ถูกมองว่าเป็นสัญญาณความก้าวหน้าทางเทคโนโลยีที่มีวิสัยทัศน์ไกลอย่างยิ่ง และการอภิปรายที่เกี่ยวข้องก็ตรงกับจุดปวดหลักในปัจจุบันของสาขาวิศวกรรมซอฟต์แวร์ AI ต่อไป ตลาดจะเปลี่ยนจาก “การเผาผลาญพลังคอมพิวเตอร์แบบหยาบ” ไปสู่ “โครงสร้างทางวิศวกรรมแบบละเอียด” อย่างไร น่าจับตามองอย่างต่อเนื่อง
⚠️ หมายเหตุ: เนื้อหาได้รับการแปลโดย AI และตรวจสอบโดยมนุษย์ หากมีข้อผิดพลาดโปรดแจ้ง
☕ สนับสนุนค่ากาแฟทีมงาน
หากคุณชอบบทความนี้ สามารถสนับสนุนเราได้ผ่าน PromptPay
本文来自网络搜集,不代表คลื่นสร้างอนาคต立场,如有侵权,联系删除。转载请注明出处:https://www.itsolotime.com/th/archives/28760
