DeepSeek-V4 มาแล้ว: มาตรฐานบริบทนับล้าน พลังประมวลผลของหัวเว่ยจะเปิดตัวในช่วงครึ่งปีหลัง

7 hours ago • ข่าวสารอุตสาหกรรม AI • 15 views

เมื่อกี้ DeepSeek-V4 มาแล้ว!

เวอร์ชันพรีวิวเปิดตัวอย่างเป็นทางการและเปิดซอร์สพร้อมกัน

มีทั้งหมดสองเวอร์ชัน:

DeepSeek-V4-Pro: เทียบเท่ารุ่นปิดชั้นนำ 1.6T, 49B แอคทีฟ, ความยาวบริบท 1M;
DeepSeek-V4-Flash: รุ่นประหยัดที่เล็กและเร็วกว่า 284B, 13B แอคทีฟ, ความยาวบริบท 1M

DeepSeek-V4 มาแล้ว: มาตรฐานบริบทนับล้าน พลังประมวลผลของหัวเว่ยจะเปิดตัวในช่วงครึ่งปีหลัง

คำพูดอย่างเป็นทางการคือ: ในด้านความสามารถ Agent ความรู้โลก และประสิทธิภาพการอนุมาน ล้วนเป็นผู้นำในประเทศและในวงการโอเพนซอร์ส

และ:

ปัจจุบัน DeepSeek-V4 กลายเป็นโมเดล Agentic Coding ที่พนักงานภายในบริษัทใช้ ตามผลตอบรับการทดสอบ ประสบการณ์การใช้งานดีกว่า Sonnet 4.5 คุณภาพการส่งมอบใกล้เคียงกับ Opus 4.6 โหมดไม่คิด แต่ยังมีช่องว่างกับ Opus 4.6 โหมดคิด

ตอนนี้ทั้งเว็บไซต์และแอปอัปเดตแล้ว บริการ API ก็อัปเดตพร้อมกัน

ในส่วนของพลังประมวลผลในประเทศที่ทุกคนสนใจ เน้นย้ำว่า ครึ่งปีหลังจะเริ่มใช้พลังประมวลผลของ Huawei จำนวนมาก

รุ่นท็อปและรุ่นคุ้มค่า เปิดตัวสองเวอร์ชันพร้อมกัน

ครั้งนี้ V4 ปล่อยสองเวอร์ชันในคราวเดียว

V4-Pro ประสิทธิภาพเทียบเท่ารุ่นปิดชั้นนำ

ทางการให้เกณฑ์ตัดสินสามข้อ:

ความสามารถ Agent เพิ่มขึ้นอย่างมาก: ในการทดสอบ Coding ความสามารถ Agentic V4-Pro ถึงระดับที่ดีที่สุดในบรรดาโมเดลโอเพนซอร์สปัจจุบัน และยังทำผลงานดีเยี่ยมในการทดสอบ Agent อื่นๆ ในการทดสอบภายใน โหมด Agent Coding ประสบการณ์ V4 ดีกว่า Sonnet 4.5 คุณภาพการส่งมอบใกล้เคียง Opus 4.6 โหมดไม่คิด แต่ยังมีช่องว่างกับ Opus 4.6 โหมดคิด
ความรู้โลกที่หลากหลาย: ในการทดสอบความรู้โลก DeepSeek-V4-Pro นำหน้าโมเดลโอเพนซอร์สอื่นๆ อย่างมาก รองจากโมเดลปิดชั้นนำ Gemini-Pro-3.1 เพียงเล็กน้อย
ประสิทธิภาพการอนุมานระดับโลก: ในการทดสอบคณิตศาสตร์ STEM และโค้ดแข่งขัน V4-Pro เอาชนะโมเดลโอเพนซอร์สที่เปิดเผยผลทั้งหมดในปัจจุบัน ได้ผลลัพธ์ที่ยอดเยี่ยมเทียบเท่ารุ่นปิดชั้นนำของโลก

V4-Flash รุ่นประหยัดที่เล็กและเร็วกว่า ความสามารถในการอนุมานใกล้เคียง Pro ความรู้โลกด้อยกว่าเล็กน้อย แต่พารามิเตอร์และการแอคทีฟน้อยกว่า API ถูกกว่า

ในงาน Agent DeepSeek-V4-Flash ในงานง่ายทำได้เทียบเท่า DeepSeek-V4-Pro แต่ในงานยากยังมีช่องว่าง

ในการทดสอบล้างรถ V4 ก็ผ่านอย่างรวดเร็ว

และในสถานการณ์ชีววิทยาคลาสสิก “พ่อที่สิ้นหวัง” DeepSeek-V4 ไม่ได้เข้าใจจุดสำคัญเรื่องตาบอดสีแดง-เขียวในรอบแรก (ตามกฎพันธุศาสตร์ ถ้าผู้หญิงเป็นตาบอดสีแดง-เขียว พ่อทางชีววิทยาของเธอก็ต้องเป็นด้วย)

บริบทล้านตัวอักษรกลายเป็นมาตรฐาน

ที่น่าสนใจคือ ตั้งแต่วันนี้เป็นต้นไป บริบท 1M เป็นมาตรฐานของบริการทางการทั้งหมดของ DeepSeek

เมื่อปีที่แล้ว บริบท 1M ยังเป็นไพ่เด็ดเฉพาะของ Gemini; โมเดลปิดอื่นๆ ทั้งหมดมีแค่ 128K หรือ 200K; ฝั่งโอเพนซอร์สแทบไม่มีใครเล่นในระดับนี้

DeepSeek เปลี่ยนบริบทล้านตัวอักษรจาก “ฟีเจอร์ระดับสูง” เป็น “สาธารณูปโภคพื้นฐาน”

และเปิดซอร์สด้วย พวกเขาทำได้อย่างไร ในเอกสารปล่อยตัวให้คำตอบทันที—

V4 สร้างกลไกความสนใจแบบใหม่ทั้งหมด บีบอัดในมิติ token ใช้ร่วมกับ DSA sparse attention เมื่อเทียบกับวิธีดั้งเดิม ความต้องการในการคำนวณและหน่วยความจำลดลงอย่างมาก

DSA ไม่ใช่คำใหม่ เมื่อครึ่งปีก่อนในการอัปเดต V3.2-Exp ถูกนำมาใช้ครั้งแรก ตอนนั้นคนภายนอกไม่สนใจมาก เพราะคะแนนเกือบเท่า V3.1-Terminus ดูเหมือนรุ่นกลางที่ไม่มีอะไรพิเศษ

เมื่อมองย้อนกลับไป นั่นคือรากฐานของ V4

การปรับแต่งความสามารถ Agent โดยเฉพาะ

ด้าน Agent V4 ปรับแต่งและเพิ่มประสิทธิภาพสำหรับผลิตภัณฑ์ Agent หลัก เช่น Claude Code, OpenClaw, OpenCode, CodeBuddy งานโค้ดและงานสร้างเอกสารดีขึ้น

ในเอกสารปล่อยตัวยังมีตัวอย่างหน้า PPT ที่ V4-Pro สร้างภายใต้กรอบ Agent หนึ่ง

ราคา API

ด้าน API V4-Pro และ V4-Flash เปิดตัวพร้อมกัน รองรับทั้งอินเทอร์เฟซ OpenAI ChatCompletions และอินเทอร์เฟซ Anthropic

base_url ไม่เปลี่ยนแปลง แค่เปลี่ยนพารามิเตอร์ model เป็น deepseek-v4-pro หรือ deepseek-v4-flash ก็เรียกใช้ได้

ทั้งสองเวอร์ชันมีบริบทสูงสุด 1M และรองรับทั้งโหมดไม่คิดและโหมดคิด ในโหมดคิดสามารถปรับความเข้มข้นด้วยพารามิเตอร์ reasoning_effort สองระดับ high และ max ทางการแนะนำให้ใช้ max โดยตรงในสถานการณ์ Agent ที่ซับซ้อน

มีจุดสำคัญ—ครึ่งปีหลังจะเริ่มใช้พลังประมวลผลของ Huawei จำนวนมาก

นอกจากนี้ ชื่อโมเดลเก่าจะถูกยกเลิก

deepseek-chat และ deepseek-reasoner จะหยุดให้บริการในสามเดือน (24 กรกฎาคม 2026) ในช่วงนี้ ชื่อทั้งสองจะชี้ไปที่โหมดไม่คิดและโหมดคิดของ V4-Flash ตามลำดับ

มีผลกระทบน้อยต่อนักพัฒนาเดี่ยว แค่เปลี่ยนพารามิเตอร์ model ส่วนบริษัทที่เชื่อมต่อกับสภาพแวดล้อมการผลิต ต้องย้ายระบบภายในสามเดือนนี้

One more thing

ในตอนท้ายของเอกสารปล่อยตัว DeepSeek อ้างถึงประโยคหนึ่ง

“ไม่ถูกล่อลวงด้วยคำชม ไม่กลัวคำนินทา ดำเนินตามทางที่ตนเลือก ตั้งมั่นในความถูกต้อง”

นี่คือประโยคจาก “เฟยสิบสองจื่อ” ของซุนจื่อ ความหมายตามตัวอักษรคือ ไม่ถูก诱惑ด้วยคำชม ไม่กลัวคำใส่ร้าย เดินไปตามทางที่ตนเชื่อ ตั้งมั่นในตนเอง

เมื่อนำมาใช้ในสถานการณ์วันนี้ มันมีความหมายน่าสนใจ

ครึ่งปีที่ผ่านมา มีข่าวลือเกี่ยวกับ V4 ว่าจะปล่อยเมื่อไหร่ เลื่อนหรือไม่ ถูกโมเดลอื่นแซงหรือไม่ ถูก Claude ดึงข้อมูลไปแล้วหรือไม่ วนเวียนในวงการ AI จีนและอังกฤษหลายรอบ ต้นปียังมีคนมั่นใจว่า V4 จะปล่อยก่อนตรุษจีน แต่สุดท้ายรอถึงปลายเมษายน

พวกเขาไม่เคยตอบโต้สักครั้ง

แล้วในเช้าวันศุกร์หนึ่ง ก็ปล่อย V4 ออกมา เปิดซอร์สพร้อมกัน อัปเดตเว็บไซต์และแอป อัปเดต API พร้อมกัน และเขียนข้อเท็จจริงที่พนักงานภายในเลิกใช้ Claude แล้วลงในเอกสารปล่อยตัว

ไม่มีแผนงาน ไม่มีไลฟ์สด ไม่มีสัมภาษณ์

คำว่า “ดำเนินตามทางที่ตนเลือก” ฟังดูเหมือนสโลแกน แต่ถ้าคุณมองเส้นทางของ V3.2 Exp ที่ “ไม่มี亮点” เมื่อครึ่งปีก่อน DSA sparse attention ที่ปูทางให้ V4 ครึ่งปี และบริบท 1M ที่เปลี่ยนจากไพ่เด็ดเป็นมาตรฐาน

DeepSeek ทำได้แล้ว

ลิงก์โอเพนซอร์สโมเดล DeepSeek-V4:

[1]https://huggingface.co/collections/deepseek-ai/deepseek-v4
[2]https://modelscope.cn/collections/deepseek-ai/DeepSeek-V4

รายงานเทคนิค DeepSeek-V4:
https://huggingface.co/deepseek-ai/DeepSeek-V4-Pro/blob/main/DeepSeek_V4.pdf

⚠️ หมายเหตุ: เนื้อหาได้รับการแปลโดย AI และตรวจสอบโดยมนุษย์ หากมีข้อผิดพลาดโปรดแจ้ง

☕ สนับสนุนค่ากาแฟทีมงาน

หากคุณชอบบทความนี้ สามารถสนับสนุนเราได้ผ่าน PromptPay

SCAN TO PAY WITH ANY BANK

本文来自网络搜集，不代表คลื่นสร้างอนาคต立场，如有侵权，联系删除。转载请注明出处：https://www.itsolotime.com/th/archives/31857

Like (0)

0 0

Greg Brockman เล่าเรื่องราว 72 ชั่วโมงที่อัลท์แมนถูกไล่ออก

Previous 7 hours ago

OpenAI เปิดตัว GPT-5.5: โมเดลการทำงานแบบเอเจนต์อัจฉริยะ ประสิทธิภาพเหนือกว่าคู่แข่ง

Next 6 hours ago

ข่าวสารอุตสาหกรรม AI

เงินทุนหมื่นล้านหยวนทุ่มลงหุ่นยนต์อัจฉริยะ! บริษัท Magic Atom ได้รับเงินลงทุน 500 ล้านหยวน การนำ AI หุ่นยนต์มาใช้เข้าสู่ขั้นตอนใหม่ของการ “แข่งขันระบบ”

เงินทุนแสนล้านบาททุ่มลงใน Embodied AI: AI Robot เข้าสู่ขั้นตอนใหม่ของการ “แข่งขันด้วยระบบ” ความเป็นจริงที่ยากจะหลีกเลี่ยงมากขึ้นเรื่อยๆ คือ หลายอุตสาหกรรมกำลังถูกปรับเป…

2026年3月12日
204000
ข่าวสารอุตสาหกรรม AI

การปฏิวัติกระบวนทัศน์ AI: จากทำนายคำถัดไปสู่ทำนายสถานะทางกายภาพถัดไป

อีกหนึ่งยักษ์ใหญ่เตรียมปฏิวัติกระบวนทัศน์เทคโนโลยี AI ที่มีอยู่ในปัจจุบัน ในเช้ามืดวันนี้ Jim Fan (Fan Linxi) นักวิทยาศาสตร์วิจัยอาวุโสของ Nvidia และหัวหน้าทีมหุ่นยนต์ ได้เผยแพร่บท…

2026年2月4日
205000
ข่าวสารอุตสาหกรรม AI

เทนเซนต์ ฮุนหยวน Hy3 เวอร์ชันพรีวิวเปิดตัว: นำโดยเหยา ซุนหยู่ พร้อมอัปเกรดความสามารถด้านเอเจนต์อัจฉริยะและการเขียนโค้ด

เมื่อสักครู่ที่ผ่านมา Tencent Hy3 preview เปิดตัวอย่างเป็นทางการ นี่คือเวอร์ชันแรกหลังจากทีม Tencent Hunyuan ปรับโครงสร้างสถาปัตยกรรมและโครงสร้างพื้นฐานอย่างสมบูรณ์ โมเดลที่เปิดตัว…

1 day ago
30000
ข่าวสารอุตสาหกรรม AI

โมเดลภาษาที่แพร่กระจาย: การสำรวจเชิงลึกจากความท้าทายด้านสถาปัตยกรรมสู่การเพิ่มประสิทธิภาพการอนุมาน

★ ลิงก์ต้นฉบับ: https://zhuanlan.zhihu.com/p/1998418717743289472 ผู้เขียน: Wang Yunhe เมื่อครุ่นคิดถึงหัวข้อนี้ สิ่งแรกที่ฉันนึกถึงคือคำถามที่ผู้มีประสบการณ์ท่านหนึ่งเคยถามไว้เมื่อ…

2026年2月8日
219000
ข่าวสารอุตสาหกรรม AI

OpenAI สูญเสียผู้มีความสามารถครั้งใหญ่! รองประธานฝ่ายหลักลดตำแหน่งตัวเองย้ายไป Anthropic เพื่อกลับสู่การวิจัย RL แนวหน้า

OpenAI สูญเสียบุคลากรครั้งใหญ่! รองประธานฝ่ายวิจัยลาออกไปร่วมงาน Anthropic เพื่อกลับสู่การวิจัย RL แบบลงมือทำ แม็กซ์ ชวาร์เซอร์ อดีตรองประธานฝ่ายวิจัยของ OpenAI ประกาศลาออกและได้เข…

2026年3月5日
216000

DeepSeek-V4 มาแล้ว: มาตรฐานบริบทนับล้าน พลังประมวลผลของหัวเว่ยจะเปิดตัวในช่วงครึ่งปีหลัง

รุ่นท็อปและรุ่นคุ้มค่า เปิดตัวสองเวอร์ชันพร้อมกัน

บริบทล้านตัวอักษรกลายเป็นมาตรฐาน

การปรับแต่งความสามารถ Agent โดยเฉพาะ

ราคา API

One more thing

☕ สนับสนุนค่ากาแฟทีมงาน

相关推荐

การปฏิวัติกระบวนทัศน์ AI: จากทำนายคำถัดไปสู่ทำนายสถานะทางกายภาพถัดไป

โมเดลภาษาที่แพร่กระจาย: การสำรวจเชิงลึกจากความท้าทายด้านสถาปัตยกรรมสู่การเพิ่มประสิทธิภาพการอนุมาน