ข่าวด่วนยามดึก! Claude Mythos เวอร์ชันพรีวิวประกาศไม่เปิดให้บริการสาธารณะ, DeepSeek เว็บไซต์เปิดตัวโหมดผู้เชี่ยวชาญอย่างเงียบๆ ผลทดสอบความสามารถแตกต่างอย่างชัดเจน

ช่วงดึกตามเวลาปักกิ่ง มีสองเหตุการณ์สำคัญเกิดขึ้นในวงการ AI:

  1. Anthropic เปิดตัว Claude Mythos เวอร์ชันพรีวิวอย่างเป็นทางการ แต่เนื่องจากความสามารถที่ทรงพลังเกินไป โมเดลนี้จะไม่เปิดให้ประชาชนทั่วไปใช้
  2. DeepSeek เว็บไซต์ได้รับการอัปเดตครั้งใหญ่ เปิดตัว “โหมดผู้เชี่ยวชาญ” อย่างเงียบๆ โดยไม่มีการแถลงข่าว ไม่มีบล็อกทางการ และแม้แต่การประกาศบนทวิตเตอร์ก็ไม่มี

ข่าวด่วนยามดึก! Claude Mythos เวอร์ชันพรีวิวประกาศไม่เปิดให้บริการสาธารณะ, DeepSeek เว็บไซต์เปิดตัวโหมดผู้เชี่ยวชาญอย่างเงียบๆ ผลทดสอบความสามารถแตกต่างอย่างชัดเจน

เหนือช่องป้อนข้อความของ DeepSeek เว็บไซต์ มีไอคอนใหม่สองอันปรากฏขึ้นอย่างเงียบๆ: ฟ้าผ่าและเพชร ซึ่งสอดคล้องกับ “โหมดด่วน” และ “โหมดผู้เชี่ยวชาญ” ตามลำดับ

ข่าวด่วนยามดึก! Claude Mythos เวอร์ชันพรีวิวประกาศไม่เปิดให้บริการสาธารณะ, DeepSeek เว็บไซต์เปิดตัวโหมดผู้เชี่ยวชาญอย่างเงียบๆ ผลทดสอบความสามารถแตกต่างอย่างชัดเจน
ข่าวด่วนยามดึก! Claude Mythos เวอร์ชันพรีวิวประกาศไม่เปิดให้บริการสาธารณะ, DeepSeek เว็บไซต์เปิดตัวโหมดผู้เชี่ยวชาญอย่างเงียบๆ ผลทดสอบความสามารถแตกต่างอย่างชัดเจน

เมื่อเลื่อนเมาส์ไปวางเหนือไอคอนจะเห็นคำแนะนำ: โหมดด่วน “เหมาะสำหรับบทสนทนาประจำวัน ตอบสนองทันที”; โหมดผู้เชี่ยวชาญ “เก่งปัญหาที่ซับซ้อน ช่วงพีคอาจต้องรอ” ผลการทดสอบจริงแสดงให้เห็นว่าความแตกต่างของโหมดทั้งสองนี้ ไม่ได้เป็นเพียงแค่ความแตกต่างง่ายๆ ระหว่าง “เร็ว” กับ “คิด” ในผลิตภัณฑ์ AI อื่นๆ — เพราะในกล่องข้อความของ DeepSeek นั้นมีตัวเลือกเปิดการคิดลึกซึ้งอยู่แล้ว

จากผลการทดสอบจริงและวิเคราะห์ของชาวเน็ตในปัจจุบัน ความแตกต่างของโหมดทั้งสองมีดังนี้:

  • โหมดด่วน: สามารถระบุข้อความในรูปภาพและไฟล์ได้ ความเร็วในการตอบสนองเร็วและทันที โมเดลที่ทำงานอยู่เบื้องหลังน่าจะเป็นโมเดล V4 Lite ที่ได้รับการปรับให้เบาและเน้นความเร็ว
    ข่าวด่วนยามดึก! Claude Mythos เวอร์ชันพรีวิวประกาศไม่เปิดให้บริการสาธารณะ, DeepSeek เว็บไซต์เปิดตัวโหมดผู้เชี่ยวชาญอย่างเงียบๆ ผลทดสอบความสามารถแตกต่างอย่างชัดเจน
  • โหมดผู้เชี่ยวชาญ: สงสัยว่าเส้นทางไปยังโมเดลที่ใหญ่และทรงพลังกว่า — มีการคาดเดาว่า นี่น่าจะเป็นรูปแบบหนึ่งของ DeepSeek V4 เวอร์ชันเต็มอย่างเป็นทางการ แต่ ปัจจุบันไม่รองรับการอัปโหลดไฟล์ และขาดความสามารถแบบมัลติโมดัล โมเดลที่แข็งแกร่งกว่ากลับมีฟังก์ชันน้อยกว่า นี่สมเหตุสมผลหรือ?
    ข่าวด่วนยามดึก! Claude Mythos เวอร์ชันพรีวิวประกาศไม่เปิดให้บริการสาธารณะ, DeepSeek เว็บไซต์เปิดตัวโหมดผู้เชี่ยวชาญอย่างเงียบๆ ผลทดสอบความสามารถแตกต่างอย่างชัดเจน
    ข่าวด่วนยามดึก! Claude Mythos เวอร์ชันพรีวิวประกาศไม่เปิดให้บริการสาธารณะ, DeepSeek เว็บไซต์เปิดตัวโหมดผู้เชี่ยวชาญอย่างเงียบๆ ผลทดสอบความสามารถแตกต่างอย่างชัดเจน

ความแตกต่างของความสามารถจากการทดสอบจริง

เราทดสอบอย่างง่ายหนึ่งรอบ เช่น ขอให้ทั้งสองโหมดเขียนโปรแกรม p5.js เพื่อจำลองการกระดอนของทรงกลมภายใต้อิทธิพลของแรงโน้มถ่วงและแรงเสียดทานภายในหกเหลี่ยมหมุน ผลลัพธ์แสดงให้เห็นว่า โหมดผู้เชี่ยวชาญ ให้ผลลัพธ์ที่สอดคล้องกับสัญชาตญาณทางฟิสิกส์มากกว่า จุดตกแม่นยำกว่า วิถีการกระดอนสมจริงกว่า
ข่าวด่วนยามดึก! Claude Mythos เวอร์ชันพรีวิวประกาศไม่เปิดให้บริการสาธารณะ, DeepSeek เว็บไซต์เปิดตัวโหมดผู้เชี่ยวชาญอย่างเงียบๆ ผลทดสอบความสามารถแตกต่างอย่างชัดเจน

ในทางตรงกันข้าม ผลลัพธ์ของ โหมดด่วน ต่ำกว่าอย่างเห็นได้ชัด
ข่าวด่วนยามดึก! Claude Mythos เวอร์ชันพรีวิวประกาศไม่เปิดให้บริการสาธารณะ, DeepSeek เว็บไซต์เปิดตัวโหมดผู้เชี่ยวชาญอย่างเงียบๆ ผลทดสอบความสามารถแตกต่างอย่างชัดเจน

ช่องว่างเช่นนี้ค่อนข้างน่าเชื่อถือ การจำลองทางฟิสิกส์ต้องการความสามารถในการให้เหตุผลทางคณิตศาสตร์สูง โมเดลที่อ่อนแอกว่ามักให้ผลลัพธ์ที่ “ดูคล้ายแต่ไม่ใช่” การแสดงผลของโหมดผู้เชี่ยวชาญในที่นี้ สะท้อนถึงความแตกต่างของความสามารถที่แท้จริง

แต่ผลการทดสอบของชาวเน็ต @AiBattle_ ที่ให้สร้างเกม “Space Invaders” กลับคาดไม่ถึง: ช่องว่างของผลลัพธ์ระหว่างโหมดผู้เชี่ยวชาญและโหมดด่วนไม่ชัดเจนนัก ผู้ทดสอบตัดสินว่า: “ผมคาดว่าโหมดผู้เชี่ยวชาญตอนนี้ยังคงเส้นทางไปยัง V4 Lite เวอร์ชันหนึ่งอยู่ การจะเห็น V4 เวอร์ชันเต็มบนเว็บไซต์ อาจต้องรออีกสักพัก” การตัดสินนี้สอดคล้องกับไทม์ไลน์จากรายงานภายนอก ก่อนหน้านี้ตามรายงานของ LatePost คาดว่า V4 เวอร์ชันเต็มจะปรากฏตัวในเดือนเมษายนปีนี้ และมีแนวโน้มสูงที่จะยังคงเป็น “โอเพ่นซอร์สที่แข็งแกร่งที่สุด” แต่รายงานยังชี้ด้วยว่า “คงยากที่จะแข็งแกร่งแบบท่วมท้น” กล่าวอีกนัยหนึ่ง “โหมดผู้เชี่ยวชาญ” ที่เปิดตัวแบบกราเดียนท์ครั้งนี้ อาจไม่ใช่รูปแบบสุดท้าย

ด้านการเขียนเชิงสร้างสรรค์ เราให้โจทย์การเขียนโต้แย้งกับทั้งสองโหมด: “ปกป้องความเบื่อหน่าย โต้แย้งว่าความเบื่อหน่ายเป็นของฟุ่มเฟือยของคนสมัยใหม่” ผลลัพธ์ของโหมดผู้เชี่ยวชาญยาวกว่า โซ่ตรรกะสมบูรณ์กว่า; ลักษณะการเขียนของโหมดด่วนค่อนข้างเป็นธรรมชาติเรียบง่ายกว่า
ข่าวด่วนยามดึก! Claude Mythos เวอร์ชันพรีวิวประกาศไม่เปิดให้บริการสาธารณะ, DeepSeek เว็บไซต์เปิดตัวโหมดผู้เชี่ยวชาญอย่างเงียบๆ ผลทดสอบความสามารถแตกต่างอย่างชัดเจน
ข่าวด่วนยามดึก! Claude Mythos เวอร์ชันพรีวิวประกาศไม่เปิดให้บริการสาธารณะ, DeepSeek เว็บไซต์เปิดตัวโหมดผู้เชี่ยวชาญอย่างเงียบๆ ผลทดสอบความสามารถแตกต่างอย่างชัดเจน

ที่น่าสนใจคือ ในงานนี้ ความเร็วของทั้งคู่ไม่ต่างกันมาก แม้แต่เวลาในการคิดของโหมดผู้เชี่ยวชาญก็สั้นกว่า (ด่วน 5 วินาที ผู้เชี่ยวชาญ 3 วินาที) นี่ขัดกับสัญชาตญาณบางอย่าง แต่อาจเกี่ยวข้องกับลักษณะของงาน — การเขียนเชิงสร้างสรรค์มีความไวต่อขนาดโมเดลต่ำกว่ามาก เมื่อเทียบกับงานที่ต้องใช้เหตุผลทางคณิตศาสตร์

สำหรับงานง่ายๆ ความแตกต่างของทั้งสองโหมดมีจำกัด; ยิ่งเป็นสถานการณ์ที่ต้องใช้การให้เหตุผลลึกซึ้ง ข้อได้เปรียบของโหมดผู้เชี่ยวชาญยิ่งเด่นชัด

ในโจทย์ตรรกะคณิตศาสตร์ “เชือกพันรอบโลกหนึ่งรอบ ยาวขึ้น 1 เมตรและขยายออกอย่างสม่ำเสมอ ช่องว่างสูงเท่าไหร่?” แม้ทั้งคู่จะให้คำตอบเหมือนกัน แต่กระบวนการต่างกัน คำตอบของโหมดด่วนสั้นกระชับ; โหมดผู้เชี่ยวชาญแยกย่อยทีละขั้นตอน อธิบายแต่ละขั้นตอนการอนุมานอย่างชัดเจน สอดคล้องกับข้อกำหนดคำสั่ง “แสดงกระบวนการคิด” มากกว่า
ข่าวด่วนยามดึก! Claude Mythos เวอร์ชันพรีวิวประกาศไม่เปิดให้บริการสาธารณะ, DeepSeek เว็บไซต์เปิดตัวโหมดผู้เชี่ยวชาญอย่างเงียบๆ ผลทดสอบความสามารถแตกต่างอย่างชัดเจน
ข่าวด่วนยามดึก! Claude Mythos เวอร์ชันพรีวิวประกาศไม่เปิดให้บริการสาธารณะ, DeepSeek เว็บไซต์เปิดตัวโหมดผู้เชี่ยวชาญอย่างเงียบๆ ผลทดสอบความสามารถแตกต่างอย่างชัดเจน

มุมมองอนาคต: โหมด Vision และการแบ่งชั้นผลิตภัณฑ์

เป็นที่น่าสังเกตว่า ปัจจุบันเว็บไซต์เปิดตัวจริงเพียงสองโหมดคือด่วนและผู้เชี่ยวชาญ แต่การเปิดเผยก่อนหน้านี้แสดงให้เห็นว่า ตัวเลือกที่สาม “โหมด Vision” กำลังจะมา
ข่าวด่วนยามดึก! Claude Mythos เวอร์ชันพรีวิวประกาศไม่เปิดให้บริการสาธารณะ, DeepSeek เว็บไซต์เปิดตัวโหมดผู้เชี่ยวชาญอย่างเงียบๆ ผลทดสอบความสามารถแตกต่างอย่างชัดเจน

บล็อกเกอร์ Teortaxes ที่ติดตามเส้นทางเทคโนโลยีของ DeepSeek ชี้ว่า การแยก Vision ออกเป็นประเภทหนึ่งเป็นการออกแบบที่ผิดปกติ เขากล่าวว่า DeepSeek ปฏิเสธที่จะปรับใช้ซีรีส์ DS-VL บนเว็บไซต์ก่อนหน้านี้ ด้วยเหตุผลที่ว่า “ยังไม่成熟” หากโหมด Vision เปิดตัวจริง โมเดลที่รองรับอยู่เบื้องหลังอาจเป็นโมเดลภาษาภาพที่ “มีฟังก์ชันสมบูรณ์” แล้ว Teortaxes ยังให้การคาดเดาที่กล้าหาญยิ่งขึ้น: โมเดลภาพนี้อาจไม่ใช่ VLM แบบปกติทั่วไป แต่เป็น “โมเดลโลกแบบรวมลึก” บางประเภท เป็นขั้นตอนวิวัฒนาการต่อไปของซีรีส์ Janus หรือสถาปัตยกรรมแบบไม่ดั้งเดิมอื่นๆ

แน่นอน นี่เป็นเพียงการคาดเดา ชาวเน็ต @xhyctf บางคนยังแสดงให้เห็นว่า การย้อนกลับวิศวกรรมโค้ดส่วนหน้าของ DeepSeek แสดงว่าโหมด Vision ไม่มีโมเดลอิสระ “ความเข้าใจภาพ” ที่อ้างถึงมีแนวโน้มว่าจะเป็นการเพิ่มพารามิเตอร์หนึ่งอย่างเงียบๆ ในโหมดด่วน: filefeature.vision = true

อย่างไรก็ตาม มีสิ่งหนึ่งที่แน่นอน: DeepSeek มีการวางแผนในทิศทางมัลติโมดัลมาโดยตลอด บางทีอาจขาดเพียงเวลาปล่อยที่เหมาะสม และการนำทางเข้าสู่ด่วน ผู้เชี่ยวชาญ ฯลฯ มาแสดงต่อผู้ใช้ ชี้ไปยังทิศทางที่ควรให้ความสนใจยิ่งขึ้น:
ข่าวด่วนยามดึก! Claude Mythos เวอร์ชันพรีวิวประกาศไม่เปิดให้บริการสาธารณะ, DeepSeek เว็บไซต์เปิดตัวโหมดผู้เชี่ยวชาญอย่างเงียบๆ ผลทดสอบความสามารถแตกต่างอย่างชัดเจน

DeepSeek เริ่มดำเนินการแบ่งชั้นผลิตภัณฑ์แล้ว

ตั้งแต่โด่งดังต้นปีที่แล้ว ตรรกะผลิตภัณฑ์ของ DeepSeek มักเป็นแบบ “ต่อต้านธุรกิจ” สูง — ราคา API ต่ำ เว็บไซต์ฟรีทั้งหมด ฟังก์ชันก็ไม่แบ่งระดับ แต่ปัญหาตามมา: การรักษาโหมดการดำเนินงาน “ฟรีทั้งหมด ไม่แบ่งชั้น” เป็นเวลานาน ไม่ยั่งยืนในเชิงพาณิชย์

ปัจจุบัน DeepSeek เริ่มตั้ง “โมเดลที่แข็งแกร่งกว่า” และ “โมเดลพื้นฐานกว่า” เป็นสองทางเข้า แม้โหมดผู้เชี่ยวชาญจะยังฟรีอยู่ แต่เมื่อโครงสร้างนี้สร้างเสร็จ การสร้างระบบชำระเงินบนพื้นฐานนี้ในภายหลัง ก็ไม่มีอุปสรรคทางเทคนิคแล้ว

แน่นอน วัตถุประสงค์ของการแบ่งชั้นอาจไม่ใช่เพียงเพื่อเก็บเงิน

การแบ่งผู้ใช้ไปยังสองทางเข้าโดยธรรมชาติ ให้คำขอที่ต้องใช้การให้เหตุผลลึกซึ้งไปโหมดผู้เชี่ยวชาญ บทสนทนาประจำวันไปโหมดด่วน — นี่เองคือกลยุทธ์การจัดสรรทรัพยากรคอมพิวเตอร์ ช่วยจำกัดโควต้าและจำกัดการไหล บรรเทาความกดดันช่วงพีค
ข่าวด่วนยามดึก! Claude Mythos เวอร์ชันพรีวิวประกาศไม่เปิดให้บริการสาธารณะ, DeepSeek เว็บไซต์เปิดตัวโหมดผู้เชี่ยวชาญอย่างเงียบๆ ผลทดสอบความสามารถแตกต่างอย่างชัดเจน

การเก็บเงินเป็นเส้นทางหนึ่ง การจำกัดโควต้าเป็นอีกเส้นทางหนึ่ง ทั้งสองสามารถเลือกอย่างใดอย่างหนึ่ง หรือดำเนินการควบคู่กัน เมื่อมองภาพรวม นี่ยังประกอบเป็นเส้นทางการปูทางที่สมบูรณ์:

เปิดทางเข้าแบ่งชั้นแบบกราเดียนท์ก่อน → ให้ผู้ใช้รับรู้ความแตกต่าง → เชื่อมต่อความสามารถมัลติโมดัลและไฟล์ → เปิดโหมด Vision → ใช้โควต้าหรือกำหนดราคาสำหรับโหมดที่ทรงพลังกว่า

แน่นอน นี่เป็นเพียงการคาดเดาส่วนตัว เพราะ DeepSeek มักไม่เล่นตามกติกา

แน่นอน ผู้คนติดป้ายให้ DeepSeek มากเกินไป: อุดมคตินิยมทางเทคนิค ต่อต้านธุรกิจ AI เพื่อทุกคน อย่างไรก็ตาม ค่าใช้จ่ายในการอนุมาน GPU เป็นค่าใช้จ่ายจริงทุกเดือน แม้รายได้จากการเทรดควอนตัมของ幻方 จะร่ำรวยเพียงใด ก็ยากที่จะเติมเต็มช่องโหว่ของการให้บริการ AI ระดับโลกที่ดำเนินงานฟรีอย่างไม่จำกัดเวลาได้ด้วยรายได้ API เพียงอย่างเดียว DeepSeek กระตุ้นวงการ AI ทั้งหมด แต่ความเป็นจริงก็จะกระตุ้น DeepSeek ในที่สุด


⚠️ หมายเหตุ: เนื้อหาได้รับการแปลโดย AI และตรวจสอบโดยมนุษย์ หากมีข้อผิดพลาดโปรดแจ้ง

☕ สนับสนุนค่ากาแฟทีมงาน

หากคุณชอบบทความนี้ สามารถสนับสนุนเราได้ผ่าน PromptPay

PromptPay QR
SCAN TO PAY WITH ANY BANK

本文来自网络搜集,不代表คลื่นสร้างอนาคต立场,如有侵权,联系删除。转载请注明出处:https://www.itsolotime.com/th/archives/29099

Like (0)
Previous 15 hours ago
Next 13 hours ago

相关推荐