Redis บิดา antirez สร้างเครื่องมือประมวลผลในเครื่อง Mac สำหรับ DeepSeek V4 Flash โดยเฉพาะ ความเร็วเหลือเชื่อ

ออกแบบมาเพื่อ DeepSeek V4 Flash โดยเฉพาะ: antirez สร้างเอนจินอนุมานบน Mac ด้วยตัวเอง

เพียงสองสัปดาห์หลังจากเปิดตัว DeepSeek V4 โครงการโครงสร้างพื้นฐานดั้งเดิมแรกๆ ก็ปรากฏขึ้นในชุมชนโอเพนซอร์ส

นี่ไม่ใช่การปรับแต่งเล็กๆ น้อยๆ ที่ “หุ้มเปลือก” บนเฟรมเวิร์กที่มีอยู่ — ไม่ใช่ตัวโหลด GGUF ทั่วไป ไม่ใช่การห่อหุ้ม llama.cpp และไม่รองรับโมเดลอื่นใดเลย

มันทำเพียงสิ่งเดียว:

ทำให้ DeepSeek V4 Flash ทำงานได้ดีที่สุดบน Mac

Redis บิดา antirez สร้างเครื่องมือประมวลผลในเครื่อง Mac สำหรับ DeepSeek V4 Flash โดยเฉพาะ ความเร็วเหลือเชื่อ

“ทางด่วนพิเศษ” นี้มีชื่อว่า ds4.c และผู้สร้างมันมีความสำคัญอย่างยิ่ง —

Salvatore Sanfilippo หรือที่รู้จักกันดีในวงการโปรแกรมเมอร์ในชื่อ antirez

เขาเป็นผู้สร้าง Redis (7.4 หมื่นดาวบน GitHub) และเป็นผู้นำฐานข้อมูลในหน่วยความจำที่ได้รับความนิยมมากที่สุดในโลกนี้มาเป็นเวลา 11 ปี

ปัจจุบัน โครงการใหม่ของเขา ds4.c เป็นเอนจินอนุมานในเครื่องที่ออกแบบมาเฉพาะสำหรับ DeepSeek V4 Flash

ตามไทม์ไลน์ มีผู้ใช้อินเทอร์เน็ตบางรายสามารถรันมันบน Mac 128GB ได้สำเร็จแล้ว

Redis บิดา antirez สร้างเครื่องมือประมวลผลในเครื่อง Mac สำหรับ DeepSeek V4 Flash โดยเฉพาะ ความเร็วเหลือเชื่อ

อาจกล่าวได้ว่า ครั้งนี้ สต็อก Mac ถูก DeepSeek กวาดล้างอีกครั้ง

วาฬ มันคุ้มค่าจริงๆ

เอนจินอนุมานในเครื่องที่ออกแบบมาเฉพาะสำหรับ V4 Flash

เมื่อวันที่ 24 เมษายน DeepSeek เปิดตัวซีรีส์ V4 โดย V4 Flash เป็นเวอร์ชันที่เน้นประสิทธิภาพ: พารามิเตอร์รวม 284B, พารามิเตอร์ที่เปิดใช้งาน 13B, บริบท 1 ล้านโทเค็น

ขนาดดังกล่าว ในอดีตเกือบจะถือเป็นค่าเริ่มต้นสำหรับคลาวด์

สิ่งที่ antirez ต้องการทำคือยัดมันเข้าไปใน Mac เครื่องเดียว ดังนั้น ds4.c จึงถือกำเนิดขึ้น

Redis บิดา antirez สร้างเครื่องมือประมวลผลในเครื่อง Mac สำหรับ DeepSeek V4 Flash โดยเฉพาะ ความเร็วเหลือเชื่อ

นี่คือเอนจินอนุมานที่เขียนขึ้นใหม่ทั้งหมดด้วย C + Metal

ทั้งโครงการมีเพียงไม่กี่ไฟล์: C 55.4%, Objective-C 30.2%, Metal 13.8% Metal-only ไม่มีรันไทม์ ไม่มีการพึ่งพาเฟรมเวิร์ก ไม่มีเลเยอร์นามธรรม

Metal-only

Metal คือ API กราฟิกและการคำนวณของ Apple เอง ซึ่งใช้ในการเรียก GPU บน Mac, iPhone, iPad เทียบได้กับ CUDA ในระบบนิเวศของ Apple

การที่ ds4 ใช้ Metal เพียงอย่างเดียวหมายความว่า เอนจินนี้ทำงานบน Apple Silicon เท่านั้น ไม่สนใจการ์ด Nvidia หรือ AMD

ทั้งโครงการมีเป้าหมายเดียว:

ทำให้ V4 Flash บนเครื่อง Apple ในเครื่อง ไม่ใช่แค่ “รันได้” แต่ “ใช้งานได้จริง”

ผลการทดสอบในปัจจุบันน่าทึ่งมาก:

บน MacBook Pro M3 Max หน่วยความจำ 128GB, quantization 2-bit, บริบท 32K, การเติมคำล่วงหน้าด้วย prompt สั้น 58.52 token/s, การสร้าง 26.68 token/s

เปลี่ยนเป็น Mac Studio M3 Ultra 512GB, การเติมคำล่วงหน้าด้วย prompt ยาว (11709 โทเค็น) ทำได้ 468.03 token/s, การสร้าง 27.39 token/s

สำหรับโมเดล MoE ที่มีพารามิเตอร์ 284B ความเร็วนี้บนเครื่องในเครื่องถือว่าใช้งานได้แล้ว

ทำอย่างไร?

กุญแจสำคัญอยู่ที่สามสิ่ง

ประการแรก การ量化แบบไม่สมมาตร

ds4 ไม่ได้บีบอัดพารามิเตอร์ทั้งหมดเป็น 2-bit แต่จะ量化เฉพาะเลเยอร์ผู้เชี่ยวชาญ MoE ที่ถูกเลือกเส้นทาง — up/gate ใช้ IQ2_XXS, down ใช้ Q2_K ซึ่งเลเยอร์เหล่านี้กินพื้นที่ส่วนใหญ่ของโมเดล

ส่วนประกอบอื่นๆ รวมถึงเลเยอร์ผู้เชี่ยวชาญที่ใช้ร่วมกัน เลเยอร์ projection และเลเยอร์เส้นทาง ยังคงความแม่นยำ Q8 ไว้ไม่เปลี่ยนแปลง

antirez เขียนประโยคที่ตรงไปตรงมาใน README:

การ量化 2-bit เหล่านี้ไม่ใช่เรื่องตลก พวกมันทำงานได้ดีภายใต้ coding agent และสามารถเรียกใช้เครื่องมือได้อย่างน่าเชื่อถือ

ประการที่สอง ย้าย KV cache ไปยังฮาร์ดดิสก์

ไคลเอนต์ LLM agent ในปัจจุบันทั้งหมดไม่มีสถานะ ทุกครั้งที่ร้องขอจะส่งบทสนทนาทั้งหมดซ้ำอีกครั้ง

วิธีของเอนจินทั่วไปคือทำ prefill ใหม่ทุกครั้ง

วิธีของ ds4 คือเขียนสถานะ KV ลงดิสก์ เมื่อคำขอถัดไปตรงกับคำนำหน้าโทเค็น หากตรงก็โหลดจากดิสก์โดยตรง ข้าม prefill

คีย์ของแคชคือค่าแฮช SHA1 ของลำดับ ID โทเค็น

สิ่งนี้มีประโยชน์อย่างยิ่งสำหรับสถานการณ์ agent เช่น Claude Code ซึ่งทุกครั้งที่เริ่มต้นจะส่ง prompt เริ่มต้น 25K โทเค็น — หลังจาก prefill เสร็จ เซสชันถัดไปจะกู้คืนจากดิสก์โดยตรง

ประการที่สาม มีเลเยอร์ความเข้ากันได้ API สองชุดในตัว: OpenAI และ Anthropic

/v1/chat/completions ใช้โปรโตคอล OpenAI, /v1/messages ใช้โปรโตคอล Anthropic tool calling ก็ได้รับการปรับให้เหมาะสมเช่นกัน README มีตัวอย่างการกำหนดค่าสำหรับไคลเอนต์ agent สามตัว: opencode, Pi, Claude Code

เกี่ยวกับสาเหตุที่ต้องทำสิ่งนี้ —

คำตอบของ antirez คือ มีโครงการที่ยอดเยี่ยมมากมายในด้านการอนุมานในเครื่อง แต่โมเดลใหม่ๆ ถูกปล่อยออกมาอย่างต่อเนื่อง ความสนใจจึงถูกดึงไปยังโมเดลถัดไปที่ต้องทำให้สำเร็จทันที

เอนจินทั่วไปต้องทำนามธรรมเพื่อรองรับโมเดลทั้งหมด นามธรรมหมายถึงการประนีประนอม สิ่งที่เขาต้องการทำคือเส้นทางแคบๆ ที่ตั้งใจ เล่นพนันกับโมเดลเดียวในแต่ละครั้ง ใช้ logits ทางการเพื่อตรวจสอบ ทำการทดสอบบริบทระยะยาว และทำการรวม agent อย่างเพียงพอเพื่อยืนยันว่ามันใช้งานได้จริง

ทันทีที่เฟรมเวิร์กถูกปล่อยออกมา มีผู้ใช้อินเทอร์เน็ตจำนวนมากรายงานว่าสามารถรันบน Mac ได้แล้ว

Redis บิดา antirez สร้างเครื่องมือประมวลผลในเครื่อง Mac สำหรับ DeepSeek V4 Flash โดยเฉพาะ ความเร็วเหลือเชื่อ

Redis บิดา antirez สร้างเครื่องมือประมวลผลในเครื่อง Mac สำหรับ DeepSeek V4 Flash โดยเฉพาะ ความเร็วเหลือเชื่อ

Redis บิดา antirez สร้างเครื่องมือประมวลผลในเครื่อง Mac สำหรับ DeepSeek V4 Flash โดยเฉพาะ ความเร็วเหลือเชื่อ

คุณพร้อมที่จะรัน V4 บนเครื่องของคุณหรือยัง?

หนึ่งโมเดล หนึ่งเฟรมเวิร์กอนุมาน

สิ่งนี้ยัง引爆การอภิปรายที่ใหญ่กว่าในวงการนักพัฒนา:

อนาคตจะเป็นแบบ — หนึ่งโมเดล หนึ่งเฟรมเวิร์กอนุมาน หรือไม่?

ความคิดเห็นที่ได้รับความนิยมสูงบน Hacker News เสนอทิศทางที่น่าสนใจ: จะเกิดอะไรขึ้นถ้าเราเริ่มสร้างเอนจินอนุมานที่ปรับให้เหมาะสมที่สุดสำหรับการผสมผสาน GPU และโมเดลที่แม่นยำ?

GPU มีราคาแพงขึ้นเรื่อยๆ หากลบเลเยอร์นามธรรมออกไปให้มากพอ และเขียนโค้ดโดยตรงสำหรับฮาร์ดแวร์และโมเดลที่แม่นยำ อาจสามารถปรับให้เหมาะสมได้มาก

ต้นทุนของเส้นทางนี้ก็ชัดเจนเช่นกัน ความคิดเห็นเดียวกันชี้ให้เห็นว่า เมื่อโมเดลล้าสมัย ทุกอย่างต้องเริ่มต้นใหม่

Redis บิดา antirez สร้างเครื่องมือประมวลผลในเครื่อง Mac สำหรับ DeepSeek V4 Flash โดยเฉพาะ ความเร็วเหลือเชื่อ

antirez เองก็ยอมรับปัญหานี้ เขาบอกว่า ds4 ปัจจุบันพนันกับ DeepSeek V4 Flash แต่โมเดลอาจเปลี่ยนไป

ข้อจำกัดที่ไม่เปลี่ยนแปลงคือ การอนุมานในเครื่องต้องทำงานได้อย่างน่าเชื่อถือบนเครื่องส่วนบุคคลระดับสูงหรือ Mac Studio โดยเริ่มต้นที่หน่วยความจำ 128GB

อนาคตจะเป็นอย่างไร README ทิ้งปมไว้

ปัจจุบันเป็น Metal-only ในอนาคตอาจรองรับ CUDA แต่เขาเขียนอย่างระมัดระวัง — อาจจะ แต่เท่านั้น โครงการนี้ตั้งใจให้เล็ก เร็ว และมีสมาธิ

Redis บิดา antirez สร้างเครื่องมือประมวลผลในเครื่อง Mac สำหรับ DeepSeek V4 Flash โดยเฉพาะ ความเร็วเหลือเชื่อ

สิ่งที่ควรให้ความสนใจมากกว่าคือมุมมองที่เขาโยนออกมาใน README: การอนุมานในเครื่องควรทำสามสิ่งร่วมกันให้ดี พร้อมใช้งานทันที

เอนจินอนุมานที่มี HTTP API, GGUF ที่สร้างขึ้นมาโดยเฉพาะสำหรับเอนจินนี้และสมมติฐานชุดนี้, การทดสอบและการตรวจสอบที่เชื่อมต่อกับ coding agent

นี่คือแนวคิด การอนุมานในเครื่องแบบฟูลสแต็ก — ไม่ใช่การประกอบส่วนประกอบเข้าด้วยกัน แต่เป็นการออกแบบห่วงโซ่ทั้งหมดเป็นผลิตภัณฑ์

หากเส้นทางนี้สำเร็จ มันอาจเปลี่ยนวิธีการเล่นของการอนุมานในเครื่อง

เมื่อผู้ผลิตโมเดลปล่อยโมเดลใหม่ ชุมชนจะมีคนกระโดดออกมาสร้างเอนจิน专属 สร้าง quantization 专属 สร้างการเชื่อมต่อ agent 专属 แต่ละรุ่นของโมเดลจะมี “antirez” ของตัวเอง

ds4 ยังมีรายละเอียดที่ตรงไปตรงมามาก README มีข้อความประกาศ: ซอฟต์แวร์นี้พัฒนาขึ้นด้วย “ความช่วยเหลืออันทรงพลัง” ของ GPT 5.5 โดยมนุษย์รับผิดชอบแนวคิด การทดสอบ และการดีบัก

antirez กล่าว: หากคุณไม่ยอมรับโค้ดที่พัฒนาด้วยความช่วยเหลือของ AI ซอฟต์แวร์นี้ไม่เหมาะกับคุณ

Redis บิดา antirez สร้างเครื่องมือประมวลผลในเครื่อง Mac สำหรับ DeepSeek V4 Flash โดยเฉพาะ ความเร็วเหลือเชื่อ

สองสัปดาห์ จากการ fork llama.cpp เพื่อปรับให้เหมาะสม ไปจนถึงการเขียนเอนจินเฉพาะทางตั้งแต่ต้น คงเป็นไปไม่ได้หากไม่มีความช่วยเหลือจาก AI สิ่งนี้อาจน่าสนใจยิ่งกว่า ds4 เสียอีก

One more thing

สุดท้าย มาพูดถึงตัวตนของ antirez

Redis บิดา antirez สร้างเครื่องมือประมวลผลในเครื่อง Mac สำหรับ DeepSeek V4 Flash โดยเฉพาะ ความเร็วเหลือเชื่อ

ชื่อจริง Salvatore Sanfilippo เกิดปี 1977 บนเกาะซิซิลี สร้าง Redis ในปี 2009 นำโครงการนี้สิบเอ็ดปี และออกในปี 2020

Redis บิดา antirez สร้างเครื่องมือประมวลผลในเครื่อง Mac สำหรับ DeepSeek V4 Flash โดยเฉพาะ ความเร็วเหลือเชื่อ

ตอนที่เขาออก เขาเขียนข้อความว่า การเขียนโค้ดของเขาคือการแสดงออกถึงตัวเอง โค้ดเป็นสิ่งประดิษฐ์ ไม่ใช่แค่เครื่องมือที่มีประโยชน์ เขาอยากให้คนจดจำเขาในฐานะศิลปินที่แย่ มากกว่าโปรแกรมเมอร์ที่ดี

ปลายปี 2024 เขากลับมาที่ Redis ในบทบาท evangelist

นอกจาก Redis แล้ว เขายังเขียน Kilo (โปรแกรมแก้ไขข้อความ C ไม่ถึง 1,000 บรรทัด), dump1090 (ตัวถอดรหัสสัญญาณ ADS-B การบิน), linenoise (ทางเลือกขนาดเล็กของ readline)

เขายังเล่น Flipper Zero เขียนเครื่องมือวิเคราะห์โปรโตคอล RF และพอร์ต Asteroids ลงไป ในปี 2022 เขาตีพิมพ์นิยายวิทยาศาสตร์เรื่อง “WOHPE” ซึ่งมีธีมเกี่ยวกับ AI การเปลี่ยนแปลงสภาพภูมิอากาศ โปรแกรมเมอร์ และปฏิสัมพันธ์ระหว่างมนุษย์กับเทคโนโลยี

บรรทัดแรกของหน้าเว็บส่วนตัวของเขาคือ: “ฉันใช้เวลาทำงานส่วนใหญ่ไปกับการเขียนโค้ดและเขียนนิยาย”

Redis บิดา antirez สร้างเครื่องมือประมวลผลในเครื่อง Mac สำหรับ DeepSeek V4 Flash โดยเฉพาะ ความเร็วเหลือเชื่อ

เกี่ยวกับการกำเนิดของ Redis เขาเขียนไว้ในหน้าเว็บส่วนตัว:

ภรรยาของฉันเคยพูดเล่นว่า โค้ดส่วนใหญ่ของ Redis ในช่วงแรก ฉันพิมพ์มันขณะนั่งอยู่บนโถส้วม โดยใช้ MacBook Air ขนาด 11 นิ้ว ฉันหวังว่าเธอจะพูดผิด แต่เสียดายที่เธอพูดถูกทุกคำ

สไตล์นี้แทรกซึมอยู่ในผลงานทั้งหมดของเขา: เล็ก แม่นยำ และเป็นเอกเทศ

ds4.c ก็ดำเนินตามแนวทางเดียวกัน

ดูหมายเหตุของเขาเกี่ยวกับบั๊ก macOS ใน README ของ ds4 คุณจะสัมผัสได้ถึงรสชาติที่เป็นเอกลักษณ์ของคนคนนี้ทันที

ds4 มีเส้นทางการอนุมาน CPU สำหรับตรวจสอบความถูกต้อง แต่ macOS เวอร์ชันปัจจุบันมีบั๊กในการใช้งานหน่วยความจำเสมือน การรันการอนุมาน CPU จะทำให้เคอร์เนลล่ม

เขาเขียนว่า: “จำไว้ไหม? ซอฟต์แวร์ทุกอย่างห่วย ฉันไม่สามารถหลีกเลี่ยงการล่มโดยการซ่อมแซมการอนุมาน CPU ได้ เพราะทุกครั้งต้องรีสตาร์ทคอมพิวเตอร์ ไม่สนุกเลย”

จากนั้นเขาเสริม: “ถ้าคุณกล้า มาช่วยเราสิ”

เขายังทิ้งข้อความนี้ไว้ในหน้าเว็บส่วนตัว:

การเขียนโปรแกรมสมัยใหม่กำลังซับซ้อน น่าเบื่อ และเต็มไปด้วยเลเยอร์ที่ต้องเชื่อมต่อ มันกำลังสูญเสียความสวยงามส่วนใหญ่ไป โปรแกรมเมอร์ส่วนใหญ่ไม่ได้เผชิญกับด้านศิลปะของการเขียนโปรแกรม หรือด้านวิศวกรรมขั้นสูงของการเขียนโปรแกรม

จาก Redis ถึง ds4.c สิบห้าปีผ่านไป antirez ยังคงเป็น antirez คนเดิม

เพียงแต่ครั้งนี้ เขาเริ่มปูทางให้กับ AI แล้ว

ลิงก์อ้างอิง

[1]http://invece.org/
[2]https://github.com/antirez/ds4
[3]https://news.ycombinator.com/item?id=48050751


⚠️ หมายเหตุ: เนื้อหาได้รับการแปลโดย AI และตรวจสอบโดยมนุษย์ หากมีข้อผิดพลาดโปรดแจ้ง

☕ สนับสนุนค่ากาแฟทีมงาน

หากคุณชอบบทความนี้ สามารถสนับสนุนเราได้ผ่าน PromptPay

PromptPay QR
SCAN TO PAY WITH ANY BANK

本文来自网络搜集,不代表คลื่นสร้างอนาคต立场,如有侵权,联系删除。转载请注明出处:https://www.itsolotime.com/th/archives/33790

Like (0)
Previous 4 days ago
Next 4 days ago

相关推荐