โมเดลโลก
-
อดีตผู้บริหาร Tesla เปิดตัวธุรกิจครั้งแรก: โมเดล DiT4DiT ช่วยให้หุ่นยนต์เรียนรู้การเคลื่อนไหวจากวิดีโอ หุ่นยนต์ฮิวแมนนอยด์นำร่องโมเดลโลกเป็นครั้งแรก
อดีตผู้บริหาร Tesla เปิดตัวผลงานแรกหลังออกมาทำธุรกิจ: โมเดล DiT4DiT ให้หุ่นยนต์เรียนรู้การเคลื่อนไหวจากวิดีโอ เป็นครั้งแรกที่ World Model ถูกนำไปใช้กับหุ่นยนต์ฮิวแมนนอยด์ หลังจากออ…
-
RISE 突破คอขวด VLA: โมเดลโลกแบบผสมผสานช่วยให้หุ่นยนต์เรียนรู้แบบเสริมกำลังในพื้นที่จินตนาการ อัตราความสำเร็จของภารกิจเพิ่มขึ้นกว่า 45%
ในการพัฒนาปัญญาที่มีตัวตน (Embodied AI) โมเดลวิสัยทัศน์-ภาษา-การกระทำ (Vision-Language-Action: VLA) ได้กลายเป็นกรอบหลักสำหรับงานการจัดการทั่วไป อย่างไรก็ตาม เมื่อเผชิญกับสถานการณ์ท…
-
ก้าวข้ามการสร้างแบบจำลองภาษา: Meta และ NYU สำรวจการฝึกฝนล่วงหน้าแบบหลายรูปแบบที่เป็นหนึ่งเดียว เพื่อให้ AI เข้าใจโลกแห่งความเป็นจริงโดยตรง
ความสามารถที่พุ่งพรวดของโมเดลพื้นฐาน เกิดจากการฝึกฝนล่วงหน้าด้วยข้อความปริมาณมหาศาล อย่างไรก็ตาม ข้อความเป็นเพียงการแสดงเชิงนามธรรมของมนุษย์ต่อโลกแห่งความเป็นจริง เป็นการบีบอัดข้อม…
-
ทีมจีนทำลายกำแพงเทคโนโลยีหลักของปัญญาประดิษฐ์เชิงพื้นที่: InSpatio-WorldFM เปิดตัวโมเดลโลก 3 มิติแบบเรียลไทม์แบบโอเพนซอร์ส เปิดศักราชใหม่แห่งการปฏิสัมพันธ์ทางกายภาพของ AI
ทิศทางล้ำสมัยที่สุดในวงการ AI “โมเดลโลก” กำลังประสบกับการเปลี่ยนแปลงอย่างลึกซึ้ง บนอินเทอร์เน็ต เอเจนต์อัจฉริยะเสมือนสามารถเคลื่อนไหวไปมาในโลกดิจิทัลได้อย่างคล่องแคล่ว …
-
NVIDIA DreamZero ขึ้นอันดับหนึ่งในการทดสอบมาตรฐานหุ่นยนต์: โมเดลโลก-แอ็กชันทำลายขีดจำกัดประสิทธิภาพได้อย่างไร?
เมื่อเร็วๆ นี้ โมเดลโลก-แอคชัน DreamZero ที่ NVIDIA เปิดตัว ได้ทำคะแนนนำในการทดสอบมาตรฐานหุ่นยนต์สองรายการคือ RoboArena และ MolmoSpaces แนวคิดการออกแบบหลักของ DreamZero คือ: ภายในโ…
-
มหาวิทยาลัยชิงหวาและสแตนฟอร์ดร่วมกันพัฒนา Ctrl-World World Model ประสิทธิภาพการประเมินอัจฉริยะเชิงรูปธรรมติดอันดับต้นของโลก ความสามารถในการสร้างวิดีโอเหนือกว่า Google และ NVIDIA
ในการจัดอันดับ WorldArena ซึ่งเป็นเกณฑ์การประเมินที่เป็นที่ยอมรับในระดับโลกสำหรับสาขาปัญญาประดิษฐ์แบบฝังตัว (Embodied AI) โมเดลโลก Ctrl-World ที่พัฒนาโดยทีมของศาสตราจารย์ Chen Jian…
-
WorldArena: ปฏิวัติการประเมินโมเดลโลก จาก “การแข่งขันภายในด้านการมองเห็น” สู่ความก้าวหน้าทาง “ความฉลาดเชิงฟังก์ชัน”
เมื่อวิดีโอที่สร้างโดยโมเดลโลกสามารถ “หลอกตา” ได้ ทำไมหุ่นยนต์ถึงยังคง “มีตาแต่ไม่มีสมอง”? 13 กุมภาพันธ์ 2026 ข่าวสำคัญจากแนวหน้าของปัญญาประดิษฐ์เชิงกายภาพ …
-
NVIDIA DreamZero: 140,000 ล้านพารามิเตอร์โมเดลโลกแห่งการกระทำ เปิดศักราชใหม่ของการปรับตัวทั่วไปแบบศูนย์ช็อตสำหรับหุ่นยนต์
อะไรคือความท้าทายหลักในการขับเคลื่อนปัญญาประดิษฐ์เชิงรูปธรรมไปสู่ขอบเขตสากล? เราคิดว่าปัจจัยสำคัญอยู่ที่การทำให้เกิด “การถ่ายโอนข้ามรูปธรรม” โมเดลโลกที่สมบูรณ์เป็นพื้นฐ…
-
การสร้างวิดีโอก้าวสู่การจำลองโลกแบบสากล: การพัฒนาทางเทคโนโลยีจากความเที่ยงตรงทางภาพสู่การให้เหตุผลเชิงเหตุผล
ในปีที่ผ่านมา การสร้างวิดีโอ (Video Generation) และโมเดลโลก (World Models) ได้กลายเป็นหนึ่งในทิศทางการวิจัยที่ได้รับความสนใจมากที่สุดในสาขาปัญญาประดิษฐ์ ตั้งแต่ Sora ไปจนถึง Kling …
-
ทีม Tsinghua เปิดตัว Motus: โลกแบบจำลองแรกที่รวมห้าพาราไดม์หลัก ประสิทธิภาพเหนือกว่า Pi-0.5 ถึง 40%
ทีมจากมหาวิทยาลัยชิงหวาเปิดตัว Motus: แบบจำลองโลกเชิงกายภาพแบบรวมแรกที่รวมห้าแนวทางหลัก ประสิทธิภาพเหนือกว่า Pi-0.5 ถึง 40% Motus ซึ่งเป็นแบบจำลองโลกแบบรวมที่เปิดตัวโดย Shengshu Te…