IEEE สัมภาษณ์เชิงลึก: ปรมาจารย์ด้านหุ่นยนต์ หวังยวี่ ยืนยันสถาปัตยกรรม VLA ยากต่อการนำไปใช้จริง ข้อมูลสัมผัสคือกุญแจสำคัญในการพลิกเกมของปัญญาประดิษฐ์ที่มีกายภาพ

6 days ago • ข่าวสารอุตสาหกรรม AI • 62 views

ในปี 2026 “ข้อมูล” กำลังกลายเป็นจุดสนใจใหม่ในการแข่งขันด้านหุ่นยนต์ที่มีกายภาพ (Embodied Intelligence) โดยยักษ์ใหญ่ด้านเทคโนโลยีอย่าง Jingdong (JD.com) และ Baidu ต่างก็เข้าร่วมการแข่งขันนี้ อย่างไรก็ตาม เบื้องหลังความคึกคักนี้ ยังคงมีคำถามพื้นฐานที่ยังไม่มีคำตอบ: ข้อมูลแบบใดกันแน่ที่หุ่นยนต์ที่มีกายภาพต้องการอย่างแท้จริง?

เมื่อไม่นานมานี้ IEEE Spectrum ซึ่งเป็นสิ่งพิมพ์หลักของ IEEE (Institute of Electrical and Electronics Engineers) องค์กรวิชาชีพด้านวิศวกรรมประยุกต์และวิทยาศาสตร์ที่ใหญ่ที่สุดในโลก ได้ทำการสัมภาษณ์เชิงลึกกับศาสตราจารย์ Wang Yu นักวิทยาศาสตร์ด้านหุ่นยนต์

นักวิชาการผู้คร่ำหวอดในวงการหุ่นยนต์มากว่าเกือบ 40 ปีผู้นี้ได้ให้ความเห็นของเขาว่า: สถาปัตยกรรม VLA (Vision-Language-Action) ที่เป็นกระแสหลักในปัจจุบันนั้น ไม่เพียงพอที่จะสนับสนุนให้หุ่นยนต์สามารถนำไปใช้งานจริงได้อย่างแท้จริง ข้อมูลที่ประกอบด้วยข้อมูลปฏิสัมพันธ์ทางกายภาพต่างหากที่เป็นกุญแจสำคัญในการทำให้หุ่นยนต์เข้าใจโลกแห่งความจริงและดำเนินการได้อย่างมั่นคง

IEEE สัมภาษณ์เชิงลึก: ปรมาจารย์ด้านหุ่นยนต์ หวังยวี่ ยืนยันสถาปัตยกรรม VLA ยากต่อการนำไปใช้จริง ข้อมูลสัมผัสคือกุญแจสำคัญในการพลิกเกมของปัญญาประดิษฐ์ที่มีกายภาพ

ในช่วงทศวรรษ 1980 ในฐานะหนึ่งในนักเรียนทุนรัฐบาลจีนรุ่นแรกที่ไปศึกษาต่อต่างประเทศ Wang Yu เข้าศึกษาที่สถาบันหุ่นยนต์แห่งมหาวิทยาลัย Carnegie Mellon และกลายเป็นนักศึกษาปริญญาเอกคนแรกของศาสตราจารย์ Matt Mason ผู้อำนวยการสถาบันในขณะนั้น โดยเชี่ยวชาญด้านกลศาสตร์การหยิบจับและการวางแผนการทำงานของหุ่นยนต์ ซึ่งเป็นต้นกำเนิดทางวิชาการของความสามารถในการปฏิบัติการของหุ่นยนต์ที่มีกายภาพในปัจจุบัน เขาเคยสอนในหลายสถาบัน และร่วมกับศาสตราจารย์ Li Zexiang ก่อตั้งสถาบันวิจัยหุ่นยนต์แห่งมหาวิทยาลัยวิทยาศาสตร์และเทคโนโลยีฮ่องกง (HKUST) ซึ่งผลิตบุคลากรที่มีความสามารถจำนวนมากที่ทำงานอยู่ในแนวหน้าของอุตสาหกรรมในปัจจุบัน

Wang Yu ได้รับการจัดอันดับจากมหาวิทยาลัย Stanford ให้เป็นหนึ่งในนักวิทยาศาสตร์ชั้นนำ 2% ของโลก และในฐานะนักวิชาการเพียงคนเดียวจากองค์กรจีนในคณะกรรมการบริหารของ IEEE Robotics and Automation Society เขายังคงส่งเสียงของจีนในวงการหุ่นยนต์ที่มีกายภาพระดับโลกอย่างต่อเนื่อง

จากระบบไฮดรอลิกสู่ระบบไฟฟ้า จากอุตสาหกรรมสู่ชีวิตประจำวัน และจนถึงยุคปัญญาประดิษฐ์ในปัจจุบัน Wang Yu ได้สัมผัสกับการเปลี่ยนแปลงกระบวนทัศน์ทุกครั้งของวิทยาการหุ่นยนต์สมัยใหม่ ดังนั้น ความคิดของเขาท่ามกลางความคลั่งไคล้ในปัจจุบันจึงควรค่าแก่การรับฟังเป็นอย่างยิ่ง

ในมุมมองของ Wang Yu ความสามารถต่อไปที่หุ่นยนต์จำเป็นต้องปลดล็อกคือ “การปฏิบัติการ” (manipulation) และเวลานั้นก็ใกล้จะสุกงอมแล้ว

ปัจจุบันหุ่นยนต์สามารถสาธิตสิ่งที่น่าทึ่งได้ แต่ก็ยังยากที่จะรับรู้ ตัดสินใจ และดำเนินการอย่างมั่นคงในสภาพแวดล้อมจริง สาเหตุหลักมาจากการพึ่งพาการมองเห็นมากเกินไป เมื่อหุ่นยนต์พยายามหยิบแก้วน้ำ เก็บสตรอว์เบอร์รี หรือเสียบปลั๊กสายไฟ การมองเห็นสามารถบอกได้เพียงว่า “วัตถุอยู่ที่ไหน” แต่ไม่สามารถบอกได้ว่าแรงที่ใช้นั้นเหมาะสมหรือไม่ มุมถูกต้องหรือไม่ หรือการดำเนินการเสร็จสมบูรณ์หรือไม่

ข้อมูลป้อนกลับทางกายภาพ เช่น เนื้อสัมผัส แรงเสียดทาน แรงสัมผัส และการเปลี่ยนรูป ซึ่งเป็นตัวกำหนดความสำเร็จหรือความล้มเหลวของการปฏิบัติการ ล้วนเป็นจุดบอดของการมองเห็น และเป็นส่วนที่ขาดหายไปในการปฏิบัติการของหุ่นยนต์มาเป็นเวลานาน

Wang Yu เชื่อว่าการสัมผัส (Touch/Haptics) คือกุญแจสำคัญในการเปิดประตูบานนี้ การสัมผัสประกอบด้วยข้อมูลต่างๆ เช่น แรงสัมผัส สถานะการสัมผัส การเปลี่ยนรูป พื้นผิวและเนื้อวัสดุ ซึ่งสามารถเติมเต็มจุดบอดและภาพลวงตาของการมองเห็น ทำให้หุ่นยนต์ก้าวจาก “การระบุวัตถุ” ไปสู่ “การเข้าใจวัตถุและควบคุมวัตถุ”

จากความเชื่อนี้ เขาและทีมงานได้เสนอกรอบงาน VTLA (Vision-Tactile-Language-Action) โดยนำการสัมผัสเข้ามาในสถาปัตยกรรม VLA กระแสหลัก และถือว่ามันเป็นรูปแบบการรับรู้ที่สำคัญเท่าเทียมกับการมองเห็น

ศาสตราจารย์ Wang Yu

ข้อเสนอเหล่านี้ไม่ได้หยุดอยู่แค่ในบทความวิชาการ เมื่อไม่กี่ปีที่ผ่านมา Wang Yu ร่วมกับ Dr. Duan Jianghua (博士后) ก่อตั้ง “Daimon Robotics” เพื่อนำงานวิจัยด้านการรับรู้ด้วยการสัมผัสที่สะสมมานานหลายปีไปสู่การใช้งานจริงในเชิงวิศวกรรม บริษัทนี้ซึ่งก่อนหน้านี้มีชื่อเสียงด้านการพัฒนาฮาร์ดแวร์ที่มีการรับรู้ด้วยการสัมผัส มีรายได้ในไตรมาสแรกของปี 2026 มากกว่าทั้งปีที่แล้ว

เดือนที่แล้ว Daimon ได้เปิดตัวชุดข้อมูลโลกกายภาพที่มีกายภาพพร้อมรูปแบบการสัมผัสอย่างเป็นทางการในชื่อ Daimon Infinity และเปิดเผยข้อมูลจำนวน 10,000 ชั่วโมงเป็นโอเพนซอร์ส ซึ่งถือเป็นการเข้าสู่เส้นทางข้อมูลหุ่นยนต์ที่มีกายภาพที่กำลังร้อนแรงที่สุดในขณะนี้อย่างเป็นทางการ

เหตุใดนักวิชาการที่มุ่งเน้นการวิจัยเรื่อง “การปฏิบัติการ” จึงเลือกเข้าร่วมการแข่งขันด้านข้อมูลในเวลานี้? การตัดสินใจเบื้องหลังนี้อาจทำให้เรามองเห็นทิศทางของหุ่นยนต์ที่มีกายภาพในอีกไม่กี่ปีข้างหน้า

ในการสัมภาษณ์ครั้งนี้ Wang Yu ได้อธิบายอย่างเป็นระบบถึงความคิดของเขาเกี่ยวกับการปฏิบัติการของหุ่นยนต์ การรับรู้ด้วยการสัมผัส ข้อมูลหุ่นยนต์ที่มีกายภาพ และปัญญาประดิษฐ์ทางกายภาพ (Physical AI): เหตุใดสถาปัตยกรรม VLA จึงพบกับอุปสรรค? เหตุใดข้อมูลสัมผัสจึงถูกละเลยมาเป็นเวลานาน และเหตุใดจึงขาดไม่ได้? “ปัญญาประดิษฐ์ทางกายภาพ” ที่ว่านี้หมายถึงอะไรกันแน่? ในฐานะนักวิจัยที่ได้เห็นการพัฒนาของวิทยาการหุ่นยนต์มาครึ่งศตวรรษ เขามองเห็นความเป็นไปได้และขอบเขตของหุ่นยนต์ฮิวแมนนอยด์ในอนาคตอย่างไร?

ต่อไปนี้เป็นคำแปลของการสัมภาษณ์พิเศษของ IEEE Spectrum กับ Wang Yu ซึ่งมีการตัดทอนบางส่วนเพื่อความกระชับ:

คำถาม: ในเดือนเมษายนปีนี้ Daimon Robotics ร่วมกับสถาบันวิชาการและองค์กรชั้นนำหลายแห่ง เปิดตัวชุดข้อมูลการปฏิบัติการหุ่นยนต์ที่มีกายภาพที่ใหญ่และครอบคลุมที่สุด เหตุใดจึงเลือกที่จะเปิดตัวชุดข้อมูลในตอนนี้ แทนที่จะมุ่งเน้นการพัฒนาฮาร์ดแวร์ต่อไป?

Wang Yu: ด้วยการพัฒนาของหุ่นยนต์ที่มีกายภาพ ผู้คนจำนวนมากขึ้นเรื่อยๆ ตระหนักถึงความสำคัญของข้อมูล: การขาดแคลนข้อมูลเป็นอุปสรรคต่อการพัฒนาหุ่นยนต์ที่มีกายภาพในปัจจุบัน โดยเฉพาะข้อมูลที่มีข้อมูลปฏิสัมพันธ์ทางกายภาพ ซึ่งจะเป็นกุญแจสำคัญในการยกระดับความสามารถในการปฏิบัติการของหุ่นยนต์ในโลกแห่งความจริง คุณภาพ ความน่าเชื่อถือ และต้นทุนของข้อมูล ได้กลายเป็นประเด็นที่ต้องให้ความสำคัญเป็นพิเศษทั้งในการวิจัยพัฒนาและการนำไปใช้ในเชิงพาณิชย์

นี่คือสิ่งที่ Daimon ถนัดพอดี ด้วยเทคโนโลยีการมองเห็น-สัมผัส (Visuotactile) ที่เป็นผู้นำ เราสามารถให้ข้อมูลคุณภาพสูงที่มีการสัมผัสหลายรูปแบบ (Multimodal Tactile) ซึ่งไม่เพียงแต่รวมถึงแรงสัมผัสเท่านั้น แต่ยังรวมถึงการเปลี่ยนรูปจากการสัมผัส สถานะการสัมผัส การเลื่อนไถลและแรงเสียดทาน เนื้อวัสดุและพื้นผิวของวัตถุ ฯลฯ ซึ่งสามารถสร้างกระบวนการปฏิสัมพันธ์ทางกายภาพขึ้นมาใหม่ได้อย่างสมบูรณ์ จากพื้นฐานทางเทคนิคที่ผ่านมา เรายังได้พัฒนาไปป์ไลน์การประมวลผลข้อมูล เพื่อรวมการสัมผัสเข้ากับรูปแบบต่างๆ เช่น การมองเห็น เส้นทางการเคลื่อนไหว ข้อความเสียงพูด ฯลฯ อย่างแม่นยำ และแปลงเป็นข้อมูลที่สามารถใช้ฝึกโมเดลได้ เมื่อเผชิญกับการขาดแคลนข้อมูลในอุตสาหกรรม ฉันคิดว่าการเก็บรวบรวมข้อมูลเป็นสิ่งที่ Daimon ของเราทำได้ดีและควรทำ

ในเดือนเมษายนปีนี้ Daimon เปิดตัวชุดข้อมูลโลกกายภาพแบบเต็มรูปแบบพร้อมการสัมผัส Daimon-Infinity

คำถาม: Daimon อ้างว่าชุดข้อมูลจะมีขนาดถึงหลักล้านชั่วโมงภายในสิ้นปีนี้ พวกคุณทำได้อย่างไร?

Wang Yu: เราสร้างเครือข่ายการเก็บรวบรวมข้อมูลหุ่นยนต์ที่มีกายภาพแบบกระจายศูนย์ (Decentralized) ที่ใหญ่ที่สุดในโลก โดยอาศัยอุปกรณ์ที่มีน้ำหนักเบา การเก็บรวบรวมข้อมูลจึงไม่ได้จำกัดอยู่แค่ในสถานที่เก็บข้อมูลเฉพาะอีกต่อไป แต่สามารถเข้าไปในสถานการณ์จริงต่างๆ ได้ โดยไม่มีข้อจำกัดด้านพื้นที่ ทำให้สามารถเก็บรวบรวมข้อมูลที่มีต้นทุนต่ำ ครอบคลุมหลายสถานการณ์ และมีความสมจริงสูง ส่งผลให้มีความสามารถในการผลิตข้อมูลได้หลายล้านชั่วโมงต่อปี

คำถาม: Daimon-Infinity เปิดตัวโดยความร่วมมือของหลายสถาบัน พวกเขามีส่วนร่วมอย่างไร?

Wang Yu: สำหรับชุดข้อมูลนี้ เราได้ร่วมมือกับสถาบันหลายสิบแห่งทั่วโลกในการสร้าง รวมถึงมหาวิทยาลัยชั้นนำของจีน เช่น มหาวิทยาลัยปักกิ่ง มหาวิทยาลัยชิงหัว มหาวิทยาลัยวิทยาศาสตร์และเทคโนโลยีฮ่องกง รวมถึงทีมวิจัยชั้นนำระดับโลก เช่น DeepMind, Northwestern University สหรัฐอเมริกา, National University of Singapore และภาคอุตสาหกรรมอย่าง China Mobile, Inovance Technology, Sonavox Electronics เป็นต้น พวกเขาเลือกที่จะร่วมมือกับ Daimon เพราะเป็นการยอมรับในแนวทางของเราที่จะเพิ่มการสัมผัสเข้าไปในข้อมูลหุ่นยนต์ที่มีกายภาพ โดยการเก็บรวบรวมในสถานการณ์จริง เช่น การวิจัยทางวิทยาศาสตร์และการผลิต คู่ความร่วมมือเหล่านี้ช่วยให้เรารวบรวมข้อมูลที่มีความสมจริงสูงและขับเคลื่อนด้วยสถานการณ์จริง ในทางกลับกัน พวกเขาก็นำข้อมูลเหล่านี้ไปใช้ในการฝึกโมเดลของตนเอง นอกจากนี้ เรายังเปิดเผยข้อมูล 10,000 ชั่วโมงเป็นโอเพนซอร์ส โดยหวังว่าข้อมูลที่มีการสัมผัสจะสามารถขับเคลื่อนวิวัฒนาการของโมเดลหุ่นยนต์ที่มีกายภาพได้มากขึ้น

คำถาม: ปัจจุบันกระบวนทัศน์หลักในวงการหุ่นยนต์คือโมเดล VLA แต่ทีม Daimon เสนอกรอบงาน VTLA เหตุใดจึงเพิ่มการสัมผัส?

Wang Yu: ข้อมูลสัมผัสมีความสำคัญอย่างยิ่งต่อความสามารถในการปฏิบัติการของหุ่นยนต์ โดยให้ข้อมูลป้อนกลับทางกายภาพเมื่อสัมผัสกับวัตถุ และนำทางมือหุ่นยนต์ให้ดำเนินการได้อย่างน่าเชื่อถือ หากไม่มีการสัมผัส หุ่นยนต์อาจไม่สามารถระบุตำแหน่งของวัตถุในที่มืด อาจทำแก้วน้ำหล่นเนื่องจากไม่สามารถรับรู้สถานะการเลื่อนไถล และยิ่งไปกว่านั้น อาจทำให้ภารกิจล้มเหลวหรือเกิดความเสียหายเนื่องจากไม่สามารถควบคุมแรงได้ VLA ไม่เพียงพอต่อความต้องการในการปฏิบัติการของหุ่นยนต์อีกต่อไป ดังนั้นเราจึงขยายกรอบงานเพื่อรวมข้อมูลสัมผัสและสร้าง VTLA สิ่งสำคัญคือ เทคโนโลยีการรับรู้ด้วยการมองเห็น-สัมผัสที่เราใช้เข้ากันได้ดีกับกรอบงานภาพที่ VLA ใช้อยู่ โดยจะจับภาพการเปลี่ยนรูปของพื้นผิวปลายนิ้ว แปลงข้อมูลสัมผัสเป็นภาพ และอนุมานแรงและสถานะการสัมผัสอื่นๆ จากภาพนั้น ซึ่งข้อมูลภาพนั้นเหมาะที่จะรวมเข้ากับ VLA โดยธรรมชาติ ซึ่งช่วยลดอุปสรรคในการขยายกรอบงาน

กริปเปอร์ที่ติดตั้งเซ็นเซอร์การมองเห็น-สัมผัส ช่วยให้การปฏิบัติการที่ละเอียดอ่อนเป็นไปได้ด้วยการรับรู้การสัมผัสที่แม่นยำ

คำถาม: คุณและทีมงานได้พัฒนาเทคโนโลยีการมองเห็น-สัมผัสด้วยแสงสีเดียว (Monochrome Light Visuotactile) เป็นรายแรกของโลก ทำไมถึงเลือกเส้นทางเทคนิคนี้?

Wang Yu: ตั้งแต่เริ่มต้นศึกษาการรับรู้ด้วยการสัมผัส เราก็ระบุความต้องการของเราเองชัดเจน: เราต้องการเซ็นเซอร์ที่สามารถเลียนแบบการสัมผัสของผิวหนังปลายนิ้วมนุษย์ได้อย่างแม่นยำสูง การวิจัยทางสรีรวิทยาได้ยืนยันถึงความสามารถของปลายนิ้วมนุษย์อย่างเต็มที่แล้ว เช่น การรู้ว่าเราสัมผัสอะไร วัสดุอะไร แรงกระจายตัวอย่างไร และเมื่อสมองควบคุมมือ มันเคลื่อนที่ไปยังตำแหน่งที่ถูกต้องหรือไม่ เรารู้ว่าการทำซ้ำความสามารถเหล่านี้บนมือหุ่นยนต์จะมีประโยชน์อย่างมาก ในการสำรวจเทคโนโลยีที่มีอยู่ เราพบเทคโนโลยีการรับรู้ด้วยการสัมผัสหลายประเภท รวมถึงเซ็นเซอร์การมองเห็น-สัมผัสแบบสามสีและการออกแบบที่เรียบง่ายอื่นๆ เรารวมข้อดีของเทคโนโลยีเหล่านี้เข้าไว้ในโซลูชันเดียว ทำให้มีประสิทธิภาพดีโดยไม่ซับซ้อนเกินไป และควบคุมต้นทุน ความน่าเชื่อถือ และความไวให้อยู่ในระดับที่น่าพอใจ ในที่สุดก็พัฒนาเทคโนโลยีการมองเห็น-สัมผัสด้วยแสงสีเดียวขึ้นมา เมื่อผู้คนมีความเข้าใจเกี่ยวกับการสัมผัสมากขึ้นเรื่อยๆ เทคโนโลยีเหล่านี้ก็จะก้าวหน้าไปพร้อมกัน

ข้อมูลสัมผัสแบบเต็มรูปแบบ ประกอบด้วยสี่มิติหลัก: แรง/แรงบิด, รูปร่าง, วัสดุ, และข้อมูลการสัมผัส

คำถาม: เซ็นเซอร์การมองเห็น-สัมผัสของคุณใช้เทคโนโลยีนี้ เมื่อเทียบกับเซ็นเซอร์สัมผัสแบบดั้งเดิมแล้ว มีข้อได้เปรียบหลักอะไรบ้าง?

Wang Yu: ปีที่แล้ว เราเปิดตัวเซ็นเซอร์การมองเห็น-สัมผัสระดับโลกตัวแรกที่มีคุณสมบัติหลายมิติ ความละเอียดสูง และความถี่สูง ในโมดูลขนาดเท่าปลายนิ้ว ได้รวมหน่วยรับรู้มากถึง 110,000 หน่วย ซึ่งเป็นความหนาแน่นสูงที่สุดในอุตสาหกรรมในขณะนี้

ข้อได้เปรียบหลักอีกประการหนึ่งคือความถี่และแบนด์วิธ ซึ่งก็คือความเร็วในการตรวจจับการเปลี่ยนแปลงของการสัมผัส การส่งข้อมูล และการประมวลผลสัญญาณแบบเรียลไทม์ ข้อดีอื่นๆ ส่วนใหญ่เกี่ยวข้องกับวิศวกรรม เช่น ความน่าเชื่อถือ การควบคุมการเลื่อนไหล (Drift Control) ความทนทานของพื้นผิวซิลิโคน และความสามารถในการต้านทานการรบกวนจากแม่เหล็กไฟฟ้า แสง และปัจจัยแวดล้อมอื่นๆ

ความสำคัญของการสัมผัสกำลังเป็นที่รับรู้ของคนจำนวนมากขึ้นเรื่อยๆ และเซ็นเซอร์การมองเห็น-สัมผัสของเราก็ได้รับการใช้งานที่กว้างขวางมากขึ้น ฉันเชื่อว่าสิ่งนี้จะผลักดันให้อุตสาหกรรมทั้งหมดก้าวไปสู่อีกระดับหนึ่ง

เรามีลูกค้าที่มีศักยภาพรายหนึ่ง ซึ่งกำลังติดตั้งหุ่นยนต์ฮิวแมนนอยด์ภายในร้านสะดวกซื้อ ในสภาพแวดล้อมที่มีชั้นวางของหนาแน่น หุ่นยนต์จำเป็นต้องยื่นมือเข้าไปในพื้นที่แคบมากเพื่อหยิบสินค้า มนุษย์อย่างน้อยต้องใช้นิ้วที่เรียวเล็กสามนิ้วจึงจะทำงานหยิบจับประเภทนี้ได้สำเร็จ สถานการณ์เช่นนี้ทำให้เราเห็นถึงความต้องการฟังก์ชันการสัมผัสอย่างเร่งด่วน

เซ็นเซอร์การมองเห็น-สัมผัสของ Daimon มีความหนาแน่นของหน่วยรับรู้สูง

คำถาม: โมเดลธุรกิจและจุดเน้นเชิงกลยุทธ์ของ Daimon ในปัจจุบันคืออะไร? ชุดข้อมูลมีบทบาทอย่างไรในนั้น?

Wang Yu: ในตอนแรกเรามุ่งเน้นไปที่การผลิตอุปกรณ์รับรู้ด้วยการสัมผัสประสิทธิภาพสูง โดยเฉพาะเซ็นเซอร์ที่ติดตั้งบนมือหุ่นยนต์ แต่ด้วยการพัฒนาของหุ่นยนต์ที่มีกายภาพ ผู้คนเริ่มตระหนักว่าอุตสาหกรรมต้องการมากกว่าแค่ส่วนประกอบ แต่ต้องการห่วงโซ่เทคโนโลยีที่สมบูรณ์ ซึ่งรวมถึงอุปกรณ์ ข้อมูลคุณภาพสูงขนาดใหญ่ และท้ายที่สุดคือกรอบงานสำหรับสร้าง ฝึกฝน และปรับใช้โมเดลหุ่นยนต์ในสภาพแวดล้อมการใช้งานจริง

ปัจจุบัน เราวางตำแหน่งกลยุทธ์ทางธุรกิจของเราเป็น “3D”: อุปกรณ์ (Devices), ข้อมูล (Data) และการปรับใช้ (Deployment) เราพัฒนาอุปกรณ์สำหรับการเก็บรวบรวมข้อมูลและการสร้างระบบนิเวศการสัมผัส และผ่านการปรับใช้ในสถานการณ์การใช้งานของพันธมิตร ทำให้เกิดการนำข้อมูลสัมผัสไปใช้จริงและการตรวจสอบแบบวงปิด (Closed-loop Validation) ในโมเดลนี้ ทุกส่วนล้วนขาดไม่ได้

คำถาม: ก่อนหน้านี้คุณได้เสนอแนวคิด “ทักษะที่มีกายภาพ” (Embodied Skills) โดยมองว่านี่คือกุญแจสำคัญที่ทำให้หุ่นยนต์ฮิวแมนนอยด์ก้าวข้ามการ “มีเพียงสมอง AI ขั้นสูง” เหตุใดคุณจึงเสนอ观点นี้? ในช่วงสองปีที่ผ่านมาอุตสาหกรรมพัฒนาไปอย่างรวดเร็ว คำจำกัดความของทักษะที่มีกายภาพของคุณเปลี่ยนไปหรือไม่?

Wang Yu: ในประวัติศาสตร์การพัฒนาหุ่นยนต์ ปัจจุบันได้เข้าสู่ขั้นตอนของการหลอมรวมเทคโนโลยีฮาร์ดแวร์ทางไฟฟ้า อิเล็กทรอนิกส์ และระบบเครื่องกลไฟฟ้า ซึ่งเป็นความก้าวหน้าครั้งใหญ่ในช่วง 20 ปีที่ผ่านมา เนื่องจากการพัฒนาอย่างรวดเร็วของฮาร์ดแวร์ หุ่นยนต์ในปัจจุบันจึงขับเคลื่อนด้วยระบบไฟฟ้าทั้งหมด ไม่จำเป็นต้องใช้ระบบไฮดรอลิกอีกต่อไป เทคโนโลยีอิเล็กทรอนิกส์สมัยใหม่ให้แบนด์วิธสูงและแรงบิดสูง หากเราสามารถผสานความฉลาดเข้ากับระบบกลไกเหล่านี้ เราก็จะสามารถสร้างหุ่นยนต์ฮิวแมนนอยด์ที่แท้จริงได้ ซึ่งสามารถทำงานในสภาพแวดล้อมที่ไม่มีโครงสร้าง ตัดสินใจ และดำเนินการได้อย่างมั่นคงด้วยตนเอง

การเกิดขึ้นของปัญญาประดิษฐ์นั้นมาถูกจังหวะ มีทรัพยากรจำนวนมากถูกทุ่มเทให้กับมัน โดยเฉพาะโมเดลภาษาขนาดใหญ่ (LLMs) ปัจจุบันพวกมันถูกนำไปใช้ใน World Models เพื่อเสริมพลังให้กับ Physical AI เราหวังว่าความสามารถเหล่านี้จะถูกนำไปใช้ในโลกแห่งความจริงได้ในที่สุด ปัจจุบันจุดเน้นการวิจัยมีความชัดเจนมากขึ้น เช่น ในสภาพแวดล้อมภายในบ้าน ผู้คนมักนิยมใช้หุ่นยนต์ฮิวแมนนอยด์ นี่เป็นสาขาที่น่าตื่นเต้น หากในที่สุดเราสามารถผลิตหุ่นยนต์ที่ปลอดภัย เชื่อถือได้ และคุ้มค่าทางเศรษฐกิจ มันจะนำประโยชน์มหาศาลมาสู่สังคม

หุ่นยนต์ที่ติดตั้งเทคโนโลยีการรับรู้ด้วยการสัมผัสของ Daimon กำลังถูกปรับใช้ในสายการผลิตของโรงงาน

คำถาม: ปัจจุบันหุ่นยนต์สามารถสาธิตสิ่งที่น่าประทับใจได้ แต่ก็ยังมีช่องว่างในการนำไปใช้จริง ปัจจัยใดที่อาจเป็นตัวกระตุ้นให้เกิดการปรับใช้จริง? สถานการณ์ใดบ้างที่มีแนวโน้มจะถูกปรับใช้ในวงกว้างเป็นอันดับแรก?

Wang Yu: ฉันคิดว่าเส้นทางสู่การปรับใช้หุ่นยนต์อเนกประสงค์ในวงกว้างยังอีกยาวไกล แต่เราได้เห็นความเป็นไปได้ในบางสาขาเฉพาะแล้ว

ซึ่งคล้ายกับรถยนต์ขับเคลื่อนอัตโนมัติมาก: รถแท็กซี่ไร้คนขับยังไม่ได้ถูกปรับใช้อย่างเต็มรูปแบบ แต่หุ่นยนต์เคลื่อนที่ (Mobile Robots) ได้ถูกนำมาใช้อย่างแพร่หลายในอุตสาหกรรมโรงแรมแล้ว ในจีน โรงแรมขนาดใหญ่เกือบทุกแห่งมีหุ่นยนต์ส่งอาหาร ซึ่งไม่มีแขนกล เป็นเพียงหุ่นยนต์ขนาดเล็กที่รับอาหารจากล็อบบี้ของโรงแรม พนักงานส่งอาหารเพียงแค่วางอาหารและเลือกหมายเลขห้อง หุ่นยนต์จะนำทางเอง ใช้ลิฟต์เอง และส่งอาหารไปยังห้องพักในที่สุด

หุ่นยนต์ในโรงแรมและร้านอาหารเป็นแบบอย่างสำหรับการประยุกต์ใช้ในสถานการณ์อื่นๆ เช่น ร้านขายยากลางคืนและร้านสะดวกซื้อ ฉันคาดการณ์ว่าในระยะเวลาอันสั้น สถานที่เหล่านี้จะมีการติดตั้งหุ่นยนต์ฮิวแมนนอยด์อย่างเต็มรูปแบบ และหลังจากนั้นจะขยายไปยังสาขาอื่นๆ เราสามารถคาดหวังได้ว่าในอนาคต หุ่นยนต์อัตโนมัติ รวมถึงหุ่นยนต์ฮิวแมนนอยด์ จะค่อยๆ แทรกซึมเข้าไปในอุตสาหกรรมเฉพาะ สร้างคุณค่าให้กับอุตสาหกรรมเหล่านั้น

วิสัยทัศน์ของเราคือการทำให้หุ่นยนต์มีความสามารถในการควบคุมที่ทรงพลัง และพัฒนาเป็นพันธมิตรที่เชื่อถือได้ของมนุษย์ ในอนาคต หุ่นยนต์อาจผสานรวมเข้ากับชีวิตประจำวันของเราได้อย่างราบรื่น และเป็นประโยชน์และให้บริการแก่มนุษยชาติอย่างแท้จริง

⚠️ หมายเหตุ: เนื้อหาได้รับการแปลโดย AI และตรวจสอบโดยมนุษย์ หากมีข้อผิดพลาดโปรดแจ้ง

☕ สนับสนุนค่ากาแฟทีมงาน

หากคุณชอบบทความนี้ สามารถสนับสนุนเราได้ผ่าน PromptPay

SCAN TO PAY WITH ANY BANK

本文来自网络搜集，不代表คลื่นสร้างอนาคต立场，如有侵权，联系删除。转载请注明出处：https://www.itsolotime.com/th/archives/33459

Like (0)

0 0

ChatGPT อัปเกรดโมเดลเริ่มต้นครั้งใหญ่: GPT-5.5 Instant ลดภาพหลอนลง 52.5% ผู้ใช้ฟรีสามารถใช้งานได้

Previous 6 days ago

ทีมงาน 15 คนสร้างโมเดลภาพอันดับสามของโลก: Luma Uni-1.1 API เปิดตัว ลดต้นทุนครึ่งหนึ่ง ยักษ์ใหญ่โฆษณาเซ็นสัญญาแล้ว

Next 6 days ago

ข่าวสารอุตสาหกรรม AI

เปิดศึกดึกดื่น! ChatGPT รวมร่างกับ OpenClaw, Codex ใส่ระบบสัตว์เลี้ยงดิจิทัล, สายฟ้าแลบของ OpenAI ทำ Anthropic ถึงกับสะดุ้ง

รายงานโดย XinZhiYuan บรรณาธิการ: Taozi Haokun 【XinZhiYuan Guide】ระเบิดกลางดึก! Altman ประกาศอย่างเป็นทางการว่า ChatGPT และ OpenClaw ผสานรวมอย่างสมบูรณ์ รองรับการเข้าสู่ระบบด้วยคลิก…

2026年5月2日
88000
ข่าวสารอุตสาหกรรม AI

Claude Opus 4.6 ตกอันดับรวดเร็วสู่อันดับ 10 ในการประเมิน แต่ Anthropic กลับเปิดตัวไพ่ตาย: ระบบสร้างแอปพลิเคชันแบบเต็มสแต็กอาจทำลายการเขียนโปรแกรม

ล่าสุด ผลงานของโมเดล Claude Opus 4.6 ในการประเมินมาตรฐานโดยบุคคลที่สามได้รับความสนใจอย่างกว้างขวาง ตามรายงานล่าสุดจาก BridgeBench อันดับโลกของโมเดลดังกล่าวลดลงอย่างเห็นได้ชัด ข้อมู…

2026年4月14日
100000
ข่าวสารอุตสาหกรรม AI

VLA ไม้เท้าถูกทิ้งแล้ว แบบจำลองโลกจะสนับสนุนการนำปัญญาประดิษฐ์แบบมีตัวตนไปใช้จริงได้อย่างไร?

เดือนเมษายนปีนี้ มีเหตุการณ์หนึ่งในสาขา Embodied AI ที่ดูเหมือนไม่ใหญ่โตแต่มีความหมายลึกซึ้ง บริษัทดาวเด่นที่ก่อตั้งโดยผู้มีส่วนร่วมหลักของโมเดลอย่าง PaLM-E และ RT-2 ได้เปิดตัวโมเด…

2026年4月21日
75000
ข่าวสารอุตสาหกรรม AI

ฟังก์ชั่นโฆษณาของ ChatGPT เปิดตัว: วิเคราะห์กลยุทธ์การค้าใหม่ของ OpenAI และกลไกการปกป้องความเป็นส่วนตัว

OpenAI เริ่มทดสอบฟีเจอร์โฆษณาใน ChatGPT ในสหรัฐอเมริกาวันนี้ การทดสอบจำกัดเฉพาะผู้ใช้ที่เป็นผู้ใหญ่ที่เข้าสู่ระบบแล้ว และมุ่งเป้าไปที่ระดับสมาชิก Free และ Go เท่านั้น ผู้ใช้ระดับ P…

2026年2月10日
268000
ข่าวสารอุตสาหกรรม AI

เจฟฟ์ ดีน ทำนายการปฏิวัติวิศวกรในยุค AI: จัดการฝึกงานอัจฉริยะ 50 ตัว ทักษะหลักเปลี่ยนจากการเขียนโค้ดเป็น ‘การกำหนดปัญหา’

คำสำคัญ: เอเจนต์, Jeff Dean, การทำงานร่วมกันแบบเต็มสแต็ก, มัลติโมดัล, การนิยามปัญหา “ในอนาคต วิศวกรแต่ละคนอาจจะต้องบริหารจัดการ ‘เด็กฝึกงาน’ เอเจนต์ 50 ตัว เพื่อท…

2026年3月14日
239000

☕ สนับสนุนค่ากาแฟทีมงาน

相关推荐

เปิดศึกดึกดื่น! ChatGPT รวมร่างกับ OpenClaw, Codex ใส่ระบบสัตว์เลี้ยงดิจิทัล, สายฟ้าแลบของ OpenAI ทำ Anthropic ถึงกับสะดุ้ง

VLA ไม้เท้าถูกทิ้งแล้ว แบบจำลองโลกจะสนับสนุนการนำปัญญาประดิษฐ์แบบมีตัวตนไปใช้จริงได้อย่างไร?

ฟังก์ชั่นโฆษณาของ ChatGPT เปิดตัว: วิเคราะห์กลยุทธ์การค้าใหม่ของ OpenAI และกลไกการปกป้องความเป็นส่วนตัว