DeepSeek-V4 มาแล้ว: มาตรฐานบริบทนับล้าน พลังประมวลผลของหัวเว่ยจะเปิดตัวในช่วงครึ่งปีหลัง

เมื่อกี้ DeepSeek-V4 มาแล้ว!

เวอร์ชันพรีวิวเปิดตัวอย่างเป็นทางการและเปิดซอร์สพร้อมกัน

มีทั้งหมดสองเวอร์ชัน:

  • DeepSeek-V4-Pro: เทียบเท่ารุ่นปิดชั้นนำ 1.6T, 49B แอคทีฟ, ความยาวบริบท 1M;
  • DeepSeek-V4-Flash: รุ่นประหยัดที่เล็กและเร็วกว่า 284B, 13B แอคทีฟ, ความยาวบริบท 1M

DeepSeek-V4 มาแล้ว: มาตรฐานบริบทนับล้าน พลังประมวลผลของหัวเว่ยจะเปิดตัวในช่วงครึ่งปีหลัง

คำพูดอย่างเป็นทางการคือ: ในด้านความสามารถ Agent ความรู้โลก และประสิทธิภาพการอนุมาน ล้วนเป็นผู้นำในประเทศและในวงการโอเพนซอร์ส

และ:

ปัจจุบัน DeepSeek-V4 กลายเป็นโมเดล Agentic Coding ที่พนักงานภายในบริษัทใช้ ตามผลตอบรับการทดสอบ ประสบการณ์การใช้งานดีกว่า Sonnet 4.5 คุณภาพการส่งมอบใกล้เคียงกับ Opus 4.6 โหมดไม่คิด แต่ยังมีช่องว่างกับ Opus 4.6 โหมดคิด

DeepSeek-V4 มาแล้ว: มาตรฐานบริบทนับล้าน พลังประมวลผลของหัวเว่ยจะเปิดตัวในช่วงครึ่งปีหลัง

ตอนนี้ทั้งเว็บไซต์และแอปอัปเดตแล้ว บริการ API ก็อัปเดตพร้อมกัน

ในส่วนของพลังประมวลผลในประเทศที่ทุกคนสนใจ เน้นย้ำว่า ครึ่งปีหลังจะเริ่มใช้พลังประมวลผลของ Huawei จำนวนมาก

DeepSeek-V4 มาแล้ว: มาตรฐานบริบทนับล้าน พลังประมวลผลของหัวเว่ยจะเปิดตัวในช่วงครึ่งปีหลัง

รุ่นท็อปและรุ่นคุ้มค่า เปิดตัวสองเวอร์ชันพร้อมกัน

ครั้งนี้ V4 ปล่อยสองเวอร์ชันในคราวเดียว

V4-Pro ประสิทธิภาพเทียบเท่ารุ่นปิดชั้นนำ

ทางการให้เกณฑ์ตัดสินสามข้อ:

  • ความสามารถ Agent เพิ่มขึ้นอย่างมาก: ในการทดสอบ Coding ความสามารถ Agentic V4-Pro ถึงระดับที่ดีที่สุดในบรรดาโมเดลโอเพนซอร์สปัจจุบัน และยังทำผลงานดีเยี่ยมในการทดสอบ Agent อื่นๆ ในการทดสอบภายใน โหมด Agent Coding ประสบการณ์ V4 ดีกว่า Sonnet 4.5 คุณภาพการส่งมอบใกล้เคียง Opus 4.6 โหมดไม่คิด แต่ยังมีช่องว่างกับ Opus 4.6 โหมดคิด
  • ความรู้โลกที่หลากหลาย: ในการทดสอบความรู้โลก DeepSeek-V4-Pro นำหน้าโมเดลโอเพนซอร์สอื่นๆ อย่างมาก รองจากโมเดลปิดชั้นนำ Gemini-Pro-3.1 เพียงเล็กน้อย
  • ประสิทธิภาพการอนุมานระดับโลก: ในการทดสอบคณิตศาสตร์ STEM และโค้ดแข่งขัน V4-Pro เอาชนะโมเดลโอเพนซอร์สที่เปิดเผยผลทั้งหมดในปัจจุบัน ได้ผลลัพธ์ที่ยอดเยี่ยมเทียบเท่ารุ่นปิดชั้นนำของโลก

DeepSeek-V4 มาแล้ว: มาตรฐานบริบทนับล้าน พลังประมวลผลของหัวเว่ยจะเปิดตัวในช่วงครึ่งปีหลัง

V4-Flash รุ่นประหยัดที่เล็กและเร็วกว่า ความสามารถในการอนุมานใกล้เคียง Pro ความรู้โลกด้อยกว่าเล็กน้อย แต่พารามิเตอร์และการแอคทีฟน้อยกว่า API ถูกกว่า

ในงาน Agent DeepSeek-V4-Flash ในงานง่ายทำได้เทียบเท่า DeepSeek-V4-Pro แต่ในงานยากยังมีช่องว่าง

ในการทดสอบล้างรถ V4 ก็ผ่านอย่างรวดเร็ว

DeepSeek-V4 มาแล้ว: มาตรฐานบริบทนับล้าน พลังประมวลผลของหัวเว่ยจะเปิดตัวในช่วงครึ่งปีหลัง

และในสถานการณ์ชีววิทยาคลาสสิก “พ่อที่สิ้นหวัง” DeepSeek-V4 ไม่ได้เข้าใจจุดสำคัญเรื่องตาบอดสีแดง-เขียวในรอบแรก (ตามกฎพันธุศาสตร์ ถ้าผู้หญิงเป็นตาบอดสีแดง-เขียว พ่อทางชีววิทยาของเธอก็ต้องเป็นด้วย)

DeepSeek-V4 มาแล้ว: มาตรฐานบริบทนับล้าน พลังประมวลผลของหัวเว่ยจะเปิดตัวในช่วงครึ่งปีหลัง

บริบทล้านตัวอักษรกลายเป็นมาตรฐาน

ที่น่าสนใจคือ ตั้งแต่วันนี้เป็นต้นไป บริบท 1M เป็นมาตรฐานของบริการทางการทั้งหมดของ DeepSeek

เมื่อปีที่แล้ว บริบท 1M ยังเป็นไพ่เด็ดเฉพาะของ Gemini; โมเดลปิดอื่นๆ ทั้งหมดมีแค่ 128K หรือ 200K; ฝั่งโอเพนซอร์สแทบไม่มีใครเล่นในระดับนี้

DeepSeek เปลี่ยนบริบทล้านตัวอักษรจาก “ฟีเจอร์ระดับสูง” เป็น “สาธารณูปโภคพื้นฐาน”

และเปิดซอร์สด้วย พวกเขาทำได้อย่างไร ในเอกสารปล่อยตัวให้คำตอบทันที—

V4 สร้างกลไกความสนใจแบบใหม่ทั้งหมด บีบอัดในมิติ token ใช้ร่วมกับ DSA sparse attention เมื่อเทียบกับวิธีดั้งเดิม ความต้องการในการคำนวณและหน่วยความจำลดลงอย่างมาก

DeepSeek-V4 มาแล้ว: มาตรฐานบริบทนับล้าน พลังประมวลผลของหัวเว่ยจะเปิดตัวในช่วงครึ่งปีหลัง

DSA ไม่ใช่คำใหม่ เมื่อครึ่งปีก่อนในการอัปเดต V3.2-Exp ถูกนำมาใช้ครั้งแรก ตอนนั้นคนภายนอกไม่สนใจมาก เพราะคะแนนเกือบเท่า V3.1-Terminus ดูเหมือนรุ่นกลางที่ไม่มีอะไรพิเศษ

เมื่อมองย้อนกลับไป นั่นคือรากฐานของ V4

การปรับแต่งความสามารถ Agent โดยเฉพาะ

ด้าน Agent V4 ปรับแต่งและเพิ่มประสิทธิภาพสำหรับผลิตภัณฑ์ Agent หลัก เช่น Claude Code, OpenClaw, OpenCode, CodeBuddy งานโค้ดและงานสร้างเอกสารดีขึ้น

ในเอกสารปล่อยตัวยังมีตัวอย่างหน้า PPT ที่ V4-Pro สร้างภายใต้กรอบ Agent หนึ่ง

DeepSeek-V4 มาแล้ว: มาตรฐานบริบทนับล้าน พลังประมวลผลของหัวเว่ยจะเปิดตัวในช่วงครึ่งปีหลัง

ราคา API

ด้าน API V4-Pro และ V4-Flash เปิดตัวพร้อมกัน รองรับทั้งอินเทอร์เฟซ OpenAI ChatCompletions และอินเทอร์เฟซ Anthropic

base_url ไม่เปลี่ยนแปลง แค่เปลี่ยนพารามิเตอร์ model เป็น deepseek-v4-pro หรือ deepseek-v4-flash ก็เรียกใช้ได้

ทั้งสองเวอร์ชันมีบริบทสูงสุด 1M และรองรับทั้งโหมดไม่คิดและโหมดคิด ในโหมดคิดสามารถปรับความเข้มข้นด้วยพารามิเตอร์ reasoning_effort สองระดับ high และ max ทางการแนะนำให้ใช้ max โดยตรงในสถานการณ์ Agent ที่ซับซ้อน

DeepSeek-V4 มาแล้ว: มาตรฐานบริบทนับล้าน พลังประมวลผลของหัวเว่ยจะเปิดตัวในช่วงครึ่งปีหลัง

มีจุดสำคัญ—ครึ่งปีหลังจะเริ่มใช้พลังประมวลผลของ Huawei จำนวนมาก

นอกจากนี้ ชื่อโมเดลเก่าจะถูกยกเลิก

deepseek-chat และ deepseek-reasoner จะหยุดให้บริการในสามเดือน (24 กรกฎาคม 2026) ในช่วงนี้ ชื่อทั้งสองจะชี้ไปที่โหมดไม่คิดและโหมดคิดของ V4-Flash ตามลำดับ

มีผลกระทบน้อยต่อนักพัฒนาเดี่ยว แค่เปลี่ยนพารามิเตอร์ model ส่วนบริษัทที่เชื่อมต่อกับสภาพแวดล้อมการผลิต ต้องย้ายระบบภายในสามเดือนนี้

One more thing

ในตอนท้ายของเอกสารปล่อยตัว DeepSeek อ้างถึงประโยคหนึ่ง

“ไม่ถูกล่อลวงด้วยคำชม ไม่กลัวคำนินทา ดำเนินตามทางที่ตนเลือก ตั้งมั่นในความถูกต้อง”

นี่คือประโยคจาก “เฟยสิบสองจื่อ” ของซุนจื่อ ความหมายตามตัวอักษรคือ ไม่ถูก诱惑ด้วยคำชม ไม่กลัวคำใส่ร้าย เดินไปตามทางที่ตนเชื่อ ตั้งมั่นในตนเอง

เมื่อนำมาใช้ในสถานการณ์วันนี้ มันมีความหมายน่าสนใจ

ครึ่งปีที่ผ่านมา มีข่าวลือเกี่ยวกับ V4 ว่าจะปล่อยเมื่อไหร่ เลื่อนหรือไม่ ถูกโมเดลอื่นแซงหรือไม่ ถูก Claude ดึงข้อมูลไปแล้วหรือไม่ วนเวียนในวงการ AI จีนและอังกฤษหลายรอบ ต้นปียังมีคนมั่นใจว่า V4 จะปล่อยก่อนตรุษจีน แต่สุดท้ายรอถึงปลายเมษายน

พวกเขาไม่เคยตอบโต้สักครั้ง

แล้วในเช้าวันศุกร์หนึ่ง ก็ปล่อย V4 ออกมา เปิดซอร์สพร้อมกัน อัปเดตเว็บไซต์และแอป อัปเดต API พร้อมกัน และเขียนข้อเท็จจริงที่พนักงานภายในเลิกใช้ Claude แล้วลงในเอกสารปล่อยตัว

ไม่มีแผนงาน ไม่มีไลฟ์สด ไม่มีสัมภาษณ์

คำว่า “ดำเนินตามทางที่ตนเลือก” ฟังดูเหมือนสโลแกน แต่ถ้าคุณมองเส้นทางของ V3.2 Exp ที่ “ไม่มี亮点” เมื่อครึ่งปีก่อน DSA sparse attention ที่ปูทางให้ V4 ครึ่งปี และบริบท 1M ที่เปลี่ยนจากไพ่เด็ดเป็นมาตรฐาน

DeepSeek ทำได้แล้ว

ลิงก์โอเพนซอร์สโมเดล DeepSeek-V4:

[1]https://huggingface.co/collections/deepseek-ai/deepseek-v4
[2]https://modelscope.cn/collections/deepseek-ai/DeepSeek-V4

รายงานเทคนิค DeepSeek-V4:
https://huggingface.co/deepseek-ai/DeepSeek-V4-Pro/blob/main/DeepSeek_V4.pdf

DeepSeek-V4 มาแล้ว: มาตรฐานบริบทนับล้าน พลังประมวลผลของหัวเว่ยจะเปิดตัวในช่วงครึ่งปีหลัง


⚠️ หมายเหตุ: เนื้อหาได้รับการแปลโดย AI และตรวจสอบโดยมนุษย์ หากมีข้อผิดพลาดโปรดแจ้ง

☕ สนับสนุนค่ากาแฟทีมงาน

หากคุณชอบบทความนี้ สามารถสนับสนุนเราได้ผ่าน PromptPay

PromptPay QR
SCAN TO PAY WITH ANY BANK

本文来自网络搜集,不代表คลื่นสร้างอนาคต立场,如有侵权,联系删除。转载请注明出处:https://www.itsolotime.com/th/archives/31857

Like (0)
Previous 7 hours ago
Next 6 hours ago

相关推荐