DeepSeek-V4 เปิดตัวพร้อมรองรับทันที: Cambricon แสดงให้เห็นถึงความร่วมมือระดับใหม่ระหว่างชิปจีนและโมเดล AI

2 hours ago • ข่าวสารอุตสาหกรรม AI • 9 views

เผยแพร่โดย Machine Heart

เช้าวันนี้ DeepSeek-V4 โมเดล AI ระดับชาติที่วงการ AI รอคอย ได้เปิดตัวแล้ว!

ทันทีที่เปิดตัว Cambricon ได้ทำการปรับใช้ vLLM inference framework เพื่อรองรับทั้งสองเวอร์ชัน 285B DeepSeek-V4-flash และ 1.6T DeepSeek-V4-pro ในวันแรก (Day 0) โดยโค้ดที่ปรับใช้ได้เปิดเผยสู่สาธารณะบน GitHub community แล้ว

ร่วมกับการเปิดตัว DeepSeek-V3.2 ในปีที่แล้ว Cambricon ได้ปรับใช้ชิป国产ที่รองรับเป็นครั้งที่สองติดต่อกัน ความร่วมมือที่ใกล้ชิดนี้เกิดจากระบบนิเวศซอฟต์แวร์ NeuWare ที่พัฒนาเองและเทคโนโลยีการออกแบบชิปที่สะสมมาเป็นเวลานานของ Cambricon รวมถึงการลงทุนอย่างต่อเนื่องในนวัตกรรมร่วมระหว่างชิปและอัลกอริทึม การทำงานของ DeepSeek-V4 บนชิป Cambricon ถือเป็นเหตุการณ์สำคัญสำหรับอุตสาหกรรม AI ของจีน ก่อนหน้านี้ Cambricon ได้ดำเนินการปรับประสิทธิภาพซอฟต์แวร์และฮาร์ดแวร์ร่วมกันสำหรับโมเดลซีรีส์ DeepSeek อย่างลึกซึ้ง และบรรลุระดับการใช้กำลังประมวลผลที่นำหน้าในอุตสาหกรรม

ที่อยู่โครงการ GitHub: https://github.com/Cambricon/vllm-mlu?sessionid=

การปรับใช้นี้แสดงให้เห็นถึงความสามารถหลักทางเทคโนโลยีของ Cambricon จากสองมิติ: “การย้ายโมเดลอย่างรวดเร็ว” และ “การเพิ่มประสิทธิภาพสูงสุด”

ปรับใช้โมเดลใหม่ DeepSeek-V4 อย่างรวดเร็ว บรรลุการเปิดตัวในวันแรก

ในด้านระบบนิเวศซอฟต์แวร์ NeuWare software stack ของ Cambricon รองรับชุมชนโอเพนซอร์สอย่างเต็มที่ โดยรองรับเฟรมเวิร์ก AI หลัก เช่น PyTorch, vLLM, Diffusers ทำให้โมเดลใหม่สามารถย้ายไปยังแพลตฟอร์ม Cambricon ได้อย่างรวดเร็ว

ในด้านระบบนิเวศซอฟต์แวร์国产 Cambricon ร่วมมือกับระบบนิเวศ FlagOS ของ Zhongzhi อย่างต่อเนื่อง เพื่อลดอุปสรรคระหว่างโมเดลและชิปที่มีสถาปัตยกรรมต่างกัน ลดต้นทุนการย้ายและปรับใช้โมเดล

ในด้านการพัฒนาโอเปอเรเตอร์ Cambricon ใช้ประโยชน์จากความเข้ากันได้และความสะดวกของชุมชน Triton เพื่อพัฒนาโอเปอเรเตอร์อย่างรวดเร็ว ลดระยะเวลาการปรับใช้ฟังก์ชัน

ในด้านความร่วมมือ AI Cambricon พัฒนา CNAgent เอเจนต์สร้างโค้ด เพื่อเร่งกระบวนการสร้างโอเปอเรเตอร์และการย้ายโมเดลทั้งหมด

ในด้านฮาร์ดแวร์ ชิป Cambricon รองรับรูปแบบข้อมูลความแม่นยำต่ำหลักโดยตรง โดยไม่ต้องแปลงเพิ่มเติมเพื่อปรับใช้ฟังก์ชันและตรวจสอบความแม่นยำอย่างรวดเร็ว ด้วยความร่วมมือของซอฟต์แวร์และฮาร์ดแวร์ Cambricon สามารถทำงานได้อย่างเสถียรในวันเปิดตัวโมเดล ทำให้บรรลุการปรับใช้ในวันแรกอย่างแท้จริง

เพิ่มประสิทธิภาพสูงสุด ปลดปล่อยศักยภาพการอนุมานของ DeepSeek-V4

สำหรับโครงสร้างใหม่ของ DeepSeek-V4 Cambricon ใช้ไลบรารีโอเปอเรเตอร์ฟิวชันประสิทธิภาพสูงที่พัฒนาเอง Torch-MLU-Ops เพื่อเร่งโมดูล เช่น Compressor และ mHC โดยเฉพาะ ใช้ภาษาโปรแกรมประสิทธิภาพสูง BangC เพื่อเขียน Kernel ที่ปรับแต่งสูงสุดสำหรับโอเปอเรเตอร์热点 เช่น Sparse/Compression Attention และ GroupGemm ปลดปล่อยประสิทธิภาพฮาร์ดแวร์ระดับล่างอย่างเต็มที่

ในด้านการปรับเฟรมเวิร์กการอนุมาน Cambricon รองรับเทคนิคการปรับใช้ใน vLLM อย่างเต็มที่ เช่น TP/PP/SP/DP/EP 5D mixed parallel, communication-computation parallel, low-precision quantization และ PD separation deployment ผ่านการปรับกลยุทธ์ เพื่อให้ได้ throughput โทเค็นที่ดีที่สุดภายใต้ข้อจำกัดด้านเวลาแฝง เพิ่มประสิทธิภาพการอนุมานแบบ end-to-end อย่างมีนัยสำคัญ

คุณสมบัติฮาร์ดแวร์ถูกใช้ประโยชน์อย่างลึกซึ้ง: ใช้ความสามารถในการเข้าถึงหน่วยความจำและการเรียงลำดับของ MLU เพื่อเร่งโครงสร้าง เช่น Sparse Attention และ Indexer แบนด์วิดท์การเชื่อมต่อสูงและเวลาแฝงการสื่อสารต่ำ ลดสัดส่วนการสื่อสารในสถานการณ์ Prefill และ Decode ให้เหลือน้อยที่สุด เพิ่มประสิทธิภาพการใช้งานการกระจายแบบกระจายสูงสุด

แนวทางการออกแบบซอฟต์แวร์และฮาร์ดแวร์แบบบูรณาการนี้ทำให้ Cambricon สามารถลดต้นทุนการประมวลผลในการปรับใช้โมเดลขนาดใหญ่ได้อย่างต่อเนื่อง และเพิ่มขีดจำกัดประสิทธิภาพ Cambricon จะยังคง深耕ระบบนิเวศซอฟต์แวร์และฮาร์ดแวร์ร่วมกันสำหรับโมเดลขนาดใหญ่ เพื่อให้บริการโซลูชันการปรับใช้โมเดลขนาดใหญ่ที่เร็วขึ้น ประหยัดขึ้น และมีประสิทธิภาพมากขึ้นแก่ผู้พัฒนาและลูกค้า

⚠️ หมายเหตุ: เนื้อหาได้รับการแปลโดย AI และตรวจสอบโดยมนุษย์ หากมีข้อผิดพลาดโปรดแจ้ง

☕ สนับสนุนค่ากาแฟทีมงาน

หากคุณชอบบทความนี้ สามารถสนับสนุนเราได้ผ่าน PromptPay

SCAN TO PAY WITH ANY BANK

本文来自网络搜集，不代表คลื่นสร้างอนาคต立场，如有侵权，联系删除。转载请注明出处：https://www.itsolotime.com/th/archives/31900

Like (0)

0 0

AI มองไม่เห็นในเวลากลางคืนด้วยมุมมองบุคคลที่หนึ่ง? เกณฑ์มาตรฐาน EgoNight เผยความสามารถในการเข้าใจของโมเดลขนาดใหญ่ลดลงอย่างมากในเวลากลางคืน

Previous 2 hours ago

DeepSeek-V4 เวอร์ชันพรีวิวเปิดตัวแล้ว: รองรับบริบทนับล้าน ความสามารถ Agent โดดเด่น พร้อมเปิดซอร์สโค้ด

Next 2 hours ago

ข่าวสารอุตสาหกรรม AI

Tencent Hunyuan เปิดตัว HY3D-Bench: สร้าง “ImageNet” ในวงการสร้างภาพ 3D แก้ปัญหาข้อมูลและการประเมิน

เทคโนโลยีการสร้าง 3D ในปัจจุบันมีความพร้อมใช้งานที่น่าทึ่งมาก อย่างไรก็ตาม ปัญหาสำคัญสามประการที่ยังคงกวนใจนักวิจัยในสาขานี้คือ คุณภาพข้อมูลที่ไม่สม่ำเสมอ ขาดมาตรฐานการประเมิน และก…

2026年2月6日
228000
ข่าวสารอุตสาหกรรม AI

ช่องว่าง AI ระหว่างจีน-สหรัฐ เหลือเพียง 2.7%! รายงานของสแตนฟอร์ดเผยการเปลี่ยนแปลงครั้งใหญ่ในแผนที่อำนาจ AI ทั่วโลก

สถาบันปัญญาประดิษฐ์เพื่อมนุษยชาติ (HAI) แห่งมหาวิทยาลัยสแตนฟอร์ด ได้เผยแพร่ “รายงานดัชนีปัญญาประดิษฐ์ปี 2026” รายงานความยาว 423 หน้านี้ประเมินสถานการณ์การพัฒนาปัญญาประด…

2026年4月14日
74000
ข่าวสารอุตสาหกรรม AI

หุ้นแรกของโลกด้านความฉลาดเชิงพื้นที่พุ่ง 171% หลังเข้าตลาด! Qunhe Technology กลายเป็นผู้นำในยุคหลังของ AI รับการลงทุนจาก Li Feifei, NVIDIA, Tencent และ Alibaba

หุ้นแรกของความฉลาดเชิงพื้นที่พุ่ง 171% หลังเข้าตลาดหลักทรัพย์ Qunhe Technology กลายเป็นผู้นำในยุคหลังของ AI “หุ้นแรกของความฉลาดเชิงพื้นที่” ได้เข้าสู่ตลาดทุนอย่างเป็นทางการแล้ว วัน…

2026年4月17日
62000
ข่าวสารอุตสาหกรรม AI

GPT-5.4 รั่วไหล? รีเควสต์ดึงโค้ดเผยโมเดลใหม่ หน้าต่างบริบท 2 ล้านโทเค็นอาจเป็นจริง

GPT-5.4 รั่วไหล? คำขอ Pull Request โค้ดเผยโมเดลใหม่ หน้าต่างบริบท 2 ล้านโทเค็นอาจกลายเป็นจริง ข่าวลือเกี่ยวกับ GPT-5.4 รั่วไหลออกมาจริงหรือ? ไม่กี่วันที่ผ่านมา ภาพหน้าจอหนึ่งถูกเผย…

2026年3月3日
251000
ข่าวสารอุตสาหกรรม AI

Google เปิดตัว Gemini Embedding 2 แบบจำลองฝังตัวหลายรูปแบบแรกที่สร้างขึ้นมาโดยเฉพาะ เพื่อรวมพื้นที่การฝังตัวของข้อความ ภาพ วิดีโอ เสียง และเอกสาร

Google ประกาศเปิดตัวโมเดลฝังตัวแบบหลายรูปแบบใหม่ล่าสุด Gemini Embedding 2 ซึ่งเป็นโมเดลฝังตัวแบบหลายรูปแบบดั้งเดิมตัวแรกที่สร้างขึ้นบนสถาปัตยกรรม Gemini ขณะนี้ โมเดลนี้พร้อมให้ผู้พ…

2026年3月11日
225000

DeepSeek-V4 เปิดตัวพร้อมรองรับทันที: Cambricon แสดงให้เห็นถึงความร่วมมือระดับใหม่ระหว่างชิปจีนและโมเดล AI

☕ สนับสนุนค่ากาแฟทีมงาน

相关推荐

Tencent Hunyuan เปิดตัว HY3D-Bench: สร้าง “ImageNet” ในวงการสร้างภาพ 3D แก้ปัญหาข้อมูลและการประเมิน

GPT-5.4 รั่วไหล? รีเควสต์ดึงโค้ดเผยโมเดลใหม่ หน้าต่างบริบท 2 ล้านโทเค็นอาจเป็นจริง