DeepSeek V4 กลายเป็นโมเดลเริ่มต้นของ OpenClaw กรอบงานเอเจนต์โอเพนซอร์สที่ได้รับความนิยมสูงสุดในโลกผลักดัน AI จีนขึ้นสู่จุดสูงสุด

DeepSeek V4 กลายเป็นโมเดลเริ่มต้นของ OpenClaw กรอบงานโอเพนซอร์ส Agent ที่ได้รับความนิยมสูงสุดในโลกสนับสนุน AI จีนขึ้นสู่จุดสูงสุด

วันนี้ OpenClaw ประกาศเชื่อมต่อ DeepSeek V4 อย่างเป็นทางการ! ในเวอร์ชัน OpenClaw 2026.4.24 ที่เพิ่งเปิดตัว โมเดลสองเวอร์ชันของ DeepSeek V4 ได้ถูกรวมเข้าด้วยกันอย่างสมบูรณ์ โดย V4 Flash ถูกตั้งเป็นโมเดลเริ่มต้น และ V4 Pro ก็ได้อัปโหลดไปยังคลังโมเดลแล้ว ซึ่งหมายความว่า จากนี้ไป ผู้ใช้ทุกคนทั่วโลกที่อัปเดต OpenClaw เมื่อเปิดแอปพลิเคชันในวินาทีแรก “สมอง” ที่สนทนากับพวกเขาคือ DeepSeek V4 Flash

อาจกล่าวได้ว่าการเชื่อมต่อของ DeepSeek V4 กลายเป็นจุดเด่นที่น่าสนใจที่สุดในการอัปเดต OpenClaw ครั้งนี้ ทันทีที่ข่าวออกมา ผู้ใช้ทั่วทั้งเครือข่ายต่างก็อยากลองและตื่นเต้นกันมาก

นอกจากนี้ OpenClaw ยังเชื่อมต่อกับ Google Meet ฟังก์ชันการโทรด้วยเสียงแบบเรียลไทม์ทำให้ทั้งอุตสาหกรรมต้องตะลึง

DeepSeek V4 กลายเป็นโมเดลเริ่มต้นของ OpenClaw

เมื่อสองวันก่อน DeepSeek V4 ระเบิดขึ้นราวกับฟ้าผ่า ผู้เล่นโอเพนซอร์สคนใหม่ที่วงการ AI ทั่วโลกรอคอยก็ได้ข้อสรุปในที่สุด OpenClaw เชื่อมต่อ “สองเวอร์ชัน” ของ DeepSeek V4 ทันที และตั้ง V4 Flash เป็นโมเดลเริ่มต้น กรอบงานที่ถูกเรียกเล่นๆ ว่า “กุ้งมังกร” นี้ ได้ผลักดัน AI จีนขึ้นสู่ศูนย์กลางของเวทีด้วยมือของมันเอง

สำหรับผู้ใช้ทั่วไป การเปลี่ยนแปลงที่ชัดเจนที่สุดคือ: เมื่อเริ่มใช้ OpenClaw เส้นทางเริ่มต้นที่เข้าไปคือ DeepSeek V4 Flash มาสัมผัสคุณค่าของ V4 กัน:

  • DeepSeek V4 Pro: พารามิเตอร์รวมสูงถึง 1.6 ล้านล้าน พารามิเตอร์ที่เปิดใช้งาน 49B ใช้สถาปัตยกรรม MoE เป็นโมเดลโอเพนซอร์สที่ใหญ่ที่สุดในโลก
  • DeepSeek V4 Flash: พารามิเตอร์รวม 284B พารามิเตอร์ที่เปิดใช้งานเพียง 13B ใช้สถาปัตยกรรม MoE เช่นกัน มีขนาดเล็กกว่า เร็วกว่า และถูกกว่า แต่ในโหมด Max ความสามารถในการอนุมานเกือบจะเทียบเท่าเวอร์ชัน Pro

โมเดลทั้งสองรองรับความยาวบริบท 1 ล้านโทเค็น และใช้โปรโตคอล MIT เปิดเผยซอร์สโค้ดอย่างสมบูรณ์

การอัปเดตครั้งนี้ยังแก้ไขพฤติกรรม thinking และ replay ของ DeepSeek ในการเรียกใช้เครื่องมือหลายรอบ ก่อนหน้านี้ เมื่อ Agent เรียกใช้เครื่องมืออย่างต่อเนื่องหรือสลับโมเดลการสนทนา มักจะเกิดข้อผิดพลาดในการตรวจสอบ provider replay เนื่องจากขาด reasoning_content เวอร์ชันใหม่ได้เพิ่มตรรกะ placeholder ที่เกี่ยวข้อง ทำให้ DeepSeek V4 Flash และ DeepSeek V4 Pro ทำงานได้เสถียรยิ่งขึ้นในงานที่มีลิงก์ยาว

การแก้ไขประเภทนี้ดูเหมือนจะเน้นไปที่รายละเอียดทางวิศวกรรม แต่มีความสำคัญอย่างยิ่งต่อผลิตภัณฑ์ Agent สถานการณ์หลักของ OpenClaw ไม่ได้จำกัดอยู่แค่การแชทอีกต่อไป แต่ส่วนใหญ่แล้วคือการให้โมเดลเรียกใช้เบราว์เซอร์ การประชุม เสียง ไฟล์ และปลั๊กอินอย่างต่อเนื่อง หากการเชื่อมต่อโมเดลหยุดอยู่แค่ระดับการตอบกลับข้อความ คุณค่าของมันก็มีจำกัดมาก สิ่งที่ส่งผลต่อประสบการณ์ผู้ใช้จริงๆ คือความสามารถในการรองรับลิงก์งานที่ซับซ้อน

“กุ้งมังกร” โทรศัพท์: Google Meet กลายเป็นปลั๊กอินในตัว

ในการอัปเดตครั้งนี้ Google Meet ถูกเพิ่มเข้าไปใน OpenClaw อย่างเป็นทางการในฐานะ bundled participant plugin เวอร์ชันใหม่รองรับการอนุญาตบัญชี Google ส่วนตัว การเข้าร่วมด้วย URL การประชุมที่ชัดเจน การสตรีมแบบเรียลไทม์ของ Chrome และ Twilio รวมถึงรองรับ paired-node Chrome สำหรับสภาพแวดล้อมแบบผสมผสานของเสียงในเครื่องและเบราว์เซอร์ เช่น Parallels, BlackHole, SoX

การเปลี่ยนแปลงที่สำคัญยิ่งขึ้นเกิดขึ้นหลังจากสิ้นสุดการประชุม OpenClaw สามารถจัดการบันทึกการประชุม การบันทึกเสียง การถอดความ โน้ตอัจฉริยะ และการสนทนาของผู้เข้าร่วม และสามารถส่งออกผลลัพธ์เป็น Markdown หรือไฟล์ประเภทอื่นๆ ระบบยังรองรับการค้นหาบันทึกการประชุมล่าสุด และการสแกนประวัติ conference records

สิ่งนี้ทำให้บทบาทของ OpenClaw ในสถานการณ์การประชุมก้าวหน้ายิ่งขึ้น มันไม่เพียงรับผิดชอบงานถอดความ แต่รวมถึงการเข้าร่วมประชุม การมีส่วนร่วมแบบเรียลไทม์ การรวบรวมเนื้อหา และการตรวจสอบผลลัพธ์ย้อนหลัง ผู้ช่วย AI การประชุมแบบดั้งเดิมส่วนใหญ่จะวนเวียนอยู่กับ “การบันทึก” แต่ OpenClaw ครั้งนี้ได้เปลี่ยนการประชุมให้เป็นโหนดงานที่ Agent สามารถเรียกใช้และจัดการได้

การเชื่อมต่อเสียงแบบเรียลไทม์กับ Agent ที่สมบูรณ์

Talk, Voice Call และ Google Meet ตอนนี้สามารถใช้ลูปเสียงแบบเรียลไทม์ได้แล้ว จุดเน้นของการอัปเดตส่วนนี้คือ เสียงแบบเรียลไทม์สามารถเรียกใช้ OpenClaw Agent ที่สมบูรณ์ได้ ผ่าน openclaw_agent_consult ปัญหาในโทรศัพท์หรือการประชุมสามารถส่งให้ Agent ฝั่งหลังจัดการได้ จากนั้น Agent จะเรียกใช้เครื่องมือ ค้นหาบริบท จัดระเบียบคำตอบ และส่งกลับด้วยเสียง

ปลั๊กอิน Voice Call เพิ่มคำสั่ง smoke สำหรับ setup และ dry-run เริ่มต้น เพื่อตรวจสอบว่า Twilio หรือ provider อื่นพร้อมก่อนการโทรจริง ฝั่ง Google provider เพิ่มความสามารถเสียงแบบเรียลไทม์ Gemini Live รองรับเสียงสองทางและการเรียกใช้ฟังก์ชัน Gateway/VoiceClaw ยังเพิ่ม realtime brain WebSocket endpoint ที่ใช้ Gemini Live และจำกัดสิทธิ์ผ่าน owner-auth

สิ่งนี้บ่งชี้ว่า OpenClaw กำลังทำให้เสียงเป็นช่องทางหลัก นอกเหนือจากกล่องข้อความ โทรศัพท์และการประชุมกำลังกลายเป็นสภาพแวดล้อมการทำงานของ Agent

ระบบอัตโนมัติของเบราว์เซอร์: ยังคงเสริมจุดอ่อนทางวิศวกรรม

ระบบอัตโนมัติของเบราว์เซอร์เป็นอีกจุดเน้นของการอัปเดตครั้งนี้ เวอร์ชันใหม่เพิ่ม viewport coordinate clicks รองรับ managed automation และ existing-session automation ฝั่ง CLI ยังเพิ่มคำสั่ง openclaw browser click-coords เมื่อไม่สามารถระบุส่วนควบคุมของหน้าเว็บได้อย่างเสถียร การคลิกพิกัดจะให้ทางเลือกสำรอง

ค่าเริ่มต้น action budget ถูกขยายเป็น 60 วินาที เพื่อลดกรณีที่การรอนานถูกตัดสินว่าล้มเหลว โปรไฟล์เบราว์เซอร์ยังรองรับการตั้งค่าโหมด headless แยกต่างหาก โดยโปรไฟล์หนึ่งสามารถทำงานแบบไม่มีหัวได้ ในขณะที่โปรไฟล์อื่นไม่ได้รับผลกระทบ

การแก้ไขที่เกี่ยวข้องกับ Google Meet ยังเน้นที่ความเสถียรของเบราว์เซอร์ เวอร์ชันใหม่สามารถใช้แท็บ Meet ที่เปิดอยู่แล้วซ้ำได้ พยายามกู้คืนเมื่อเบราว์เซอร์หมดเวลา และสามารถระบุจุดขัดขวางของมนุษย์ เช่น การเข้าสู่ระบบ สิทธิ์ และการเลือกไมโครโฟน การเปลี่ยนแปลงเหล่านี้อาจไม่ใช่ประเด็นร้อนที่แพร่หลาย แต่ส่งผลโดยตรงต่อว่า Agent สามารถทำงานได้อย่างต่อเนื่องหรือไม่ ปัญหาของ Browser Agent มักเกิดจากแท็บ สิทธิ์ เวลารอ และกลไกการกู้คืน

ปลั๊กอินและสถาปัตยกรรมโมเดลเบาลง

OpenClaw ยังลดภาระในการเริ่มต้นระบบด้วย รายการโมเดลใช้ไดเรกทอรีแบบคงที่ ลดการแจงนับ registry เมื่อแสดงรายการโมเดลเริ่มต้น ไดเรกทอรีโมเดลเพิ่ม model rows ที่มาจาก manifest ทำให้ provider index, cache, onboarding และ listing สามารถทำงานได้โดยไม่ต้องโหลด provider runtime

ฝั่งปลั๊กอินก็มีการปรับเปลี่ยนที่คล้ายกัน: ข้อมูลเช่น modelCatalog, channelConfigs, setup.providers ถูกเปิดเผยจาก manifest มากขึ้น และ descriptor-only setup contract ก็ชัดเจนยิ่งขึ้น เมื่อความสามารถต่างๆ เช่น Google Meet, Voice Call, PDF, Anthropic Vertex, Bonjour ค่อยๆ กลายเป็นปลั๊กอิน การโหลด runtime ทั้งหมดในตอนเริ่มต้นจะทำให้ระบบช้าลง เวอร์ชันใหม่นำข้อมูลคำอธิบายไปไว้ข้างหน้า และเลื่อนการพึ่งพา runtime ไปไว้ข้างหลัง

นี่คือการแลกเปลี่ยนทางวิศวกรรมทั่วไป: เสียสละความสะดวกในการทำงานร่วมกันในระยะแรกเล็กน้อย เพื่อให้ได้เส้นทางการเริ่มต้นที่เบากว่าและขอบเขตปลั๊กอินที่ชัดเจนยิ่งขึ้น

SDK มีการเปลี่ยนแปลงที่ทำลายความเข้ากันได้

การอัปเดตครั้งนี้ยังรวมถึงการเปลี่ยนแปลงที่ทำลายความเข้ากันได้: OpenClaw ลบเส้นทางความเข้ากันได้ api.registerEmbeddedExtensionFactory(...) ที่ใช้เฉพาะ Pi หลังจากนี้ bundled tool-result rewrites ต้องใช้ api.registerAgentToolResultMiddleware(...) และประกาศ target harness ใน contracts.agentToolResultMiddleware

สิ่งนี้จะส่งผลต่อนักพัฒนาปลั๊กอิน ทางการต้องการให้การแปลงผลลัพธ์เครื่องมือสอดคล้องกันใน Pi และ Codex app-server dynamic tools อินเทอร์เฟซเก่าต้องย้ายข้อมูล ตามนั้น OpenClaw ได้เพิ่ม registry ความเข้ากันได้ของปลั๊กอินและบันทึกการย้ายข้อมูล เพื่อจัดการเส้นทางที่เลิกใช้ของ SDK, การกำหนดค่า, setup และ runtime เบื้องหลังนี้คือ OpenClaw กำลังจัดระเบียบหนี้สินอินเทอร์เฟซที่สะสมมาจากการขยายตัวอย่างรวดเร็วในระยะแรก

ทิศทางของ OpenClaw ชัดเจนยิ่งขึ้น

การอัปเดตครั้งนี้ครอบคลุมหลายโมดูล เช่น โมเดล การประชุม เสียง เบราว์เซอร์ ปลั๊กอิน การวินิจฉัย TTS Slack Telegram และ MCP

การรวม DeepSeek V4 เข้าไปในเส้นทางโมเดลเริ่มต้น มีเป้าหมายหลักเพื่อเพิ่มความสามารถพื้นฐานของโมเดล

การเสริมฟังก์ชัน Google Meet และการโทรด้วยเสียง มุ่งเน้นไปที่การปรับปรุงประสบการณ์การโต้ตอบของจุดเริ่มต้นการทำงานร่วมกัน

ระบบอัตโนมัติของเบราว์เซอร์ กลไกการโหลดปลั๊กอินแบบขี้เกียจ และงานย้าย SDK ร่วมกันเสริมสร้างรากฐานทางวิศวกรรมสำหรับสภาพแวดล้อมรันไทม์ของงานที่ซับซ้อน

OpenClaw กำลังพัฒนาจากผลิตภัณฑ์แชทธรรมดาๆ ค่อยๆ กลายเป็นระบบเวิร์กโฟลว์ที่สมบูรณ์

ข้อมูลอ้างอิง:
https://github.com/openclaw/openclaw/releases/tag/v2026.4.24


⚠️ หมายเหตุ: เนื้อหาได้รับการแปลโดย AI และตรวจสอบโดยมนุษย์ หากมีข้อผิดพลาดโปรดแจ้ง

☕ สนับสนุนค่ากาแฟทีมงาน

หากคุณชอบบทความนี้ สามารถสนับสนุนเราได้ผ่าน PromptPay

PromptPay QR
SCAN TO PAY WITH ANY BANK

本文来自网络搜集,不代表คลื่นสร้างอนาคต立场,如有侵权,联系删除。转载请注明出处:https://www.itsolotime.com/th/archives/32156

Like (0)
Previous 3 days ago
Next 2 days ago

相关推荐