รายงานโดย New Zhiyuan
บรรณาธิการ: Aeneas 好困
【บทนำโดย New Zhiyuan】 เช้าวันนี้ ข่าวหนึ่งได้สร้างความสั่นสะเทือนให้กับวงการ AI: DeepSeek ซึ่งก่อนหน้านี้ยืนยันจะไม่ระดมทุน กำลังแสวงหาการระดมทุนจากภายนอกครั้งแรกด้วยมูลค่าธุรกิจไม่ต่ำกว่า 10 หมื่นล้านดอลลาร์ โดยมีเป้าหมายระดมทุนอย่างน้อย 300 ล้านดอลลาร์ การเคลื่อนไหวนี้เกิดขึ้นในช่วงเวลาก่อนการเปิดตัวโมเดลรุ่นต่อไป V4 ซึ่งมีข่าวลือว่าจะมีพารามิเตอร์ระดับล้านล้าน และเป็นครั้งแรกที่ปรับให้เข้ากับชิป Ascend ของ Huawei อย่างลึกซึ้ง
การเปลี่ยนแปลงครั้งใหญ่ในกลยุทธ์การระดมทุน
ตามรายงานของสื่อต่างประเทศ The Information DeepSeek กำลังแสวงหาการระดมทุนจากภายนอกครั้งแรก โดยวางแผนระดมทุนอย่างน้อย 300 ล้านดอลลาร์ด้วยมูลค่าธุรกิจไม่ต่ำกว่า 10 หมื่นล้านดอลลาร์ สิ่งนี้ถือเป็นสัญญาณว่าบริษัทที่ได้รับการสนับสนุนจากยักษ์ใหญ่เฮดจ์ฟันด์อย่าง幻方量化 ได้ละทิ้งหลักการ “ไม่ระดมทุน” ที่ยึดถือมายาวนาน
ในการแข่งขันพัฒนาโมเดลใหญ่ AI ที่ใช้เงินทุนมหาศาล DeepSeek ก็จำเป็นต้องเสริมความแข็งแกร่งให้กับทุนสำรองทางการเงิน หากการระดมทุนครั้งนี้สำเร็จ จะช่วยจัดหาแหล่งทรัพยากรคอมพิวเตอร์เพิ่มเติม และช่วยป้องกันไม่ให้สูญเสียบุคลากรวิจัยระดับหัวกะทิด้วยค่าตอบแทนที่มีความสามารถในการแข่งขันมากขึ้น
ก่อนหน้านี้ หลังจากโมเดล R1 ของ DeepSeek ได้รับความสนใจจากทั่วโลก บริษัทเคยปฏิเสธข้อเสนอการลงทุนจากบริษัท Venture Capital ชั้นนำและยักษ์ใหญ่ด้านเทคโนโลยีภายในประเทศหลายครั้ง Liang Wenfeng ผู้ก่อตั้ง ในฐานะนักอุดมคติทางเทคนิค ต้องการรักษาความเป็นอิสระของบริษัทและหลีกเลี่ยงแรงกดดันทางธุรกิจมาโดยตลอด อย่างไรก็ตาม ตั้งแต่เปิดตัว R1 ในปี 2025 DeepSeek ไม่ได้เปิดตัวโมเดลรุ่นใหม่มาเป็นเวลา 1 ปีครึ่งแล้ว เมื่อเผชิญกับการพัฒนาอย่างรวดเร็วของโมเดลชั้นนำระดับโลกและการแข่งขันที่ดุเดือดระหว่างยักษ์ใหญ่ด้านเทคโนโลยีจีนและสหรัฐฯ แรงกดดันจากภายนอกอาจเป็นปัจจัยสำคัญที่ทำให้เปลี่ยนกลยุทธ์การระดมทุน
โมเดล V4: สงครามยากกับพารามิเตอร์ล้านล้าน
การเปิดตัวโมเดล DeepSeek V4 ที่รอคอยอย่างใจจดใจจ่อถูกเลื่อนออกไปหลายครั้งแล้ว ตามข่าวของรอยเตอร์สต้นเดือนเมษายน กำหนดเวลาเปิดตัวล่าสุดคือ “ภายในไม่กี่สัปดาห์ข้างหน้า” จากข้อมูลที่ทราบ V4 มีการก้าวกระโดดครั้งใหญ่ทั้งในด้านขนาดและความสามารถ:
- ระดับพารามิเตอร์เพิ่มขึ้น: ใช้สถาปัตยกรรม MoE (Mixture of Experts) พารามิเตอร์ทั้งหมดประมาณ 1 ล้านล้าน แต่จะเปิดใช้งานพารามิเตอร์ประมาณ 37 พันล้านต่อ token เท่านั้น โดยมีเป้าหมายเพื่อรักษาต้นทุนการอนุมานให้เทียบเท่ากับ V3
- บริบทยาวพิเศษ: ขยายหน้าต่างบริบทเป็น 1 ล้าน token และนำสถาปัตยกรรมความจำแบบมีเงื่อนไขชื่อ “Engram” มาใช้ ซึ่งอ้างว่าสามารถดึงข้อมูลได้ในเวลาคงที่ โดยมีอัตราการเรียกคืนข้อมูลที่ 97% ที่ความยาว 1 ล้าน token
- มัลติโมดัลแบบเนทีฟ: ตามรายงานของ Financial Times V4 จะเป็นโมเดลมัลติโมดัลแบบเนทีฟตัวแรกของ DeepSeek ที่รองรับการสร้างข้อความ ภาพ และวิดีโอ
- ความสามารถด้านโค้ดแข็งแกร่งขึ้น: การทดสอบมาตรฐานภายในแสดงให้เห็นว่าคะแนนบน SWE-bench เกิน 80% และ HumanEval ถึง 90% อ้างว่าสามารถจัดการการแก้ไข Bug ที่ซับซ้อนระดับ repository ความสามารถในการให้เหตุผลโค้ดบริบทยาวมีแนวโน้มจะเหนือกว่า Claude และซีรีส์ GPT
นอกจากนี้ มีการเปิดเผยว่า V4 อาจเปิดตัวสองเวอร์ชัน: เวอร์ชันเต็ม (พารามิเตอร์เกินล้านล้าน) สำหรับงานการให้เหตุผลขั้นสูงและงานโค้ดที่ซับซ้อน ปรับให้เข้ากับชิป Ascend ของ Huawei อย่างลึกซึ้ง; เวอร์ชันเบา (ประมาณ 2 แสนล้านพารามิเตอร์) สำหรับการสนทนาทั่วไปและบริการ API สามารถทำงานบนชิปจีนอื่นๆ ได้ คาดว่าโมเดลจะยังคงเปิดตัวเป็นโอเพ่นซอร์สภายใต้สัญญาอนุญาต Apache 2.0
เมื่อเร็วๆ นี้ มีเวอร์ชันทดสอบชื่อ “V4 Lite” ปรากฏขึ้นชั่วคราว และ DeepSeek เริ่มรับสมัครตำแหน่งโครงสร้างพื้นฐานเช่นการบำรุงรักษาเซิร์ฟเวอร์ใน Ulanqab มองโกเลียใน สัญญาณต่างๆ บ่งชี้ว่า V4 เข้าสู่ขั้นตอนสุดท้ายของการเตรียมการปรับใช้ขนาดใหญ่แล้ว
การย้ายฐานเชิงกลยุทธ์ของฮาร์ดแวร์พื้นฐาน
หนึ่งในความท้าทายหลักที่ทำให้ V4 ล่าช้า คือการเปลี่ยนแปลงครั้งใหญ่ของฮาร์ดแวร์พื้นฐาน ตามรายงานของรอยเตอร์ส V4 จะทำงานบนชิป Ascend ล่าสุดของ Huawei ซึ่งหมายความว่าวิศวกรของ DeepSeek จำเป็นต้องย้ายโมเดลจากระบบนิเวศ CUDA ของ Nvidia ไปยังสถาปัตยกรรม CANN ของ Huawei และเขียนโค้ดหลักจำนวนมากใหม่เพื่อแก้ไขปัญหาการปรับให้เข้ากัน
ทางเลือกนี้เป็นทั้งการตัดสินใจทางเทคนิคและมีความหมายเชิงกลยุทธ์ DeepSeek ไม่ได้ให้ V4 แก่ Nvidia หรือ AMD ล่วงหน้าเพื่อการปรับให้เหมาะสม แต่ให้สิทธิ์การเข้าถึงช่วงแรกแก่ผู้ผลิตชิปจีนแต่เพียงผู้เดียว หาก V4 สามารถแสดงประสิทธิภาพที่มีความสามารถในการแข่งขันบนชิป Huawei ได้ มันจะกลายเป็นโมเดล AI ขั้น前沿ระดับโลกตัวแรกที่ไม่ต้องพึ่งพาระบบนิเวศของ Nvidia
Jensen Huang CEO ของ Nvidia แสดงความกังวลเกี่ยวกับเรื่องนี้ในการให้สัมภาษณ์ล่าสุด โดยกล่าวว่าโมเดลใหม่ของ DeepSeek ที่ใช้แพลตฟอร์ม Huawei “จะเป็นผลลัพธ์ที่แย่สำหรับสหรัฐอเมริกา” บ่งชี้ว่าอาจสั่นคลอนความได้เปรียบดั้งเดิมของชิปสหรัฐฯ ในด้าน AI
เดิมพัน 300 ล้านดอลลาร์กับอนาคต
ในบริบทที่ต้นทุนการแข่งขัน AI สูงขึ้นเรื่อยๆ แม้แต่ DeepSeek ที่ขึ้นชื่อเรื่องประสิทธิภาพสูงก็ยากที่จะพึ่งพาการสนับสนุนทางการเงินจากผู้ถือหุ้นรายเดียวอย่างต่อเนื่อง ตามรายงานดัชนี AI ปี 2026 ของมหาวิทยาลัยสแตนฟอร์ด ช่องว่างประสิทธิภาพระหว่างโมเดลชั้นนำของจีนและสหรัฐฯ ลดลงเหลือ 2.7 จุดเปอร์เซ็นต์ และต้นทุนส่วนเพิ่มในการไล่ตามก็สูงขึ้นเรื่อยๆ
การระดมทุน 300 ล้านดอลลาร์ที่กำลังแสวงหานี้ เมื่อเทียบกับการระดมทุน 40 พันล้านดอลลาร์ของ OpenAI ที่เพิ่งเสร็จสิ้นด้วยมูลค่าธุรกิจ 3 แสนล้านดอลลาร์แล้ว มีขนาดเล็กกว่า แต่เดิมพันที่แท้จริงคือการพิสูจน์ว่า การพัฒนาและปรับใช้โมเดล AI ขั้น前沿สามารถดำเนินการได้อย่างสมบูรณ์โดยไม่ต้องพึ่งพาระบบนิเวศฮาร์ดแวร์เดิมที่นำโดย Nvidia
ข้อมูลอ้างอิง:
https://www.theinformation.com/articles/chinas-deepseek-raising-money-first-time-10-billion-plus-valuation?rc=epv9gi










⚠️ หมายเหตุ: เนื้อหาได้รับการแปลโดย AI และตรวจสอบโดยมนุษย์ หากมีข้อผิดพลาดโปรดแจ้ง
☕ สนับสนุนค่ากาแฟทีมงาน
หากคุณชอบบทความนี้ สามารถสนับสนุนเราได้ผ่าน PromptPay
本文来自网络搜集,不代表คลื่นสร้างอนาคต立场,如有侵权,联系删除。转载请注明出处:http://www.itsolotime.com/th/archives/30885
