LibTV: แพลตฟอร์มสร้างวิดีโอ AI แบบมุมมองคู่ คน + Agent แรกของโลก
เครื่องมือสร้างวิดีโอ AI แบบดั้งเดิมมักจะมุ่งเน้นเฉพาะที่การสร้างเนื้อหาเอง ในขณะที่ LibTV เสนอแนวคิดการออกแบบใหม่: วางผู้สร้างที่เป็นมนุษย์และเอเจนต์ AI (Agent) ในตำแหน่งที่เท่าเทียมกัน โดยให้รูปแบบการสร้างสรรค์สองแบบที่ทำงานคู่ขนานกันคือ “มือ” และ “อัตโนมัติ”

การออกแบบนี้ได้จุดประกายความสนใจอย่างกว้างขวางในชุมชนสร้างสรรค์ AI ใจความสำคัญคือ มันไม่ใช่แค่เครื่องมือสร้างสรรค์เดี่ยวๆ แต่เป็นสภาพแวดล้อมการสร้างสรรค์แบบครบวงจรที่ผสานผ้าใบไร้ขอบเขต (Infinite Canvas) เวิร์กโฟลว์แบบโหนด และฟังก์ชันมืออาชีพที่หลากหลาย
ผ้าใบไร้ขอบเขต: เวิร์กสเตชันแบบครบวงจรตั้งแต่การวางแผนจนถึงผลงานสำเร็จ
สำหรับผู้สร้างสรรค์ที่ต้องการการควบคุมอย่างละเอียด LibTV มอบพื้นที่สร้างสรรค์แบบภาพที่เน้น “ผ้าใบไร้ขอบเขต” เป็นแกนกลาง

ตรรกะการสร้างสรรค์จะหมุนรอบโหนดพื้นฐาน ผู้ใช้สามารถวางโหนดพื้นฐานห้าประเภทได้อย่างอิสระบนผ้าใบ ได้แก่ ข้อความ รูปภาพ วิดีโอ เสียง และสคริปต์ โหนดต่างๆ สามารถเชื่อมต่อกันได้ โดยผลลัพธ์จากโต้นน้ำสามารถเป็นอินพุตของโหนดปลายน้ำได้โดยตรง สร้างเป็นไลน์การผลิตงานสร้างสรรค์เฉพาะบุคคล

ยกตัวอย่างการสร้างโฆษณาน้ำหอมกลิ่นไม้ ขั้นแรก สร้างการออกแบบบรรจุภัณฑ์ขวดน้ำหอมผ่านโหนดรูปภาพ โหนดนี้รองรับการอัปโหลดรูปอ้างอิงหรือป้อนคำสั่ง (Prompt) เพื่อสร้างโดยตรง พร้อมการตั้งค่าพารามิเตอร์ที่หลากหลาย รวมถึงสไตล์อ้างอิง ความละเอียด อัตราส่วน จำนวนที่สร้าง และสามารถเลือกใช้โมเดลสร้างภาพหลักหลายรุ่น


ที่น่าสนใจคือ เครื่องสร้างภาพมีฟังก์ชันควบคุมกล้องระดับมืออาชีพในตัว ช่วยให้ผู้ใช้เลือกประเภทกล้อง เลนส์ ปรับโฟกัสและรูรับแสงได้

หลังจากได้แนวทางเบื้องต้นแล้ว สามารถใช้เครื่องมือในตัวบนผ้าใบเดียวกันเพื่อประมวลผลอย่างละเอียด เช่น การเพิ่มความละเอียดภาพ การขยายภาพอัจฉริยะ การวาดใหม่เฉพาะส่วน การลบ การตัดพื้นหลัง เป็นต้น

ฟังก์ชันขั้นสูงยิ่งขึ้นยังรวมถึงการสร้างหลายมุมและการปรับแสง

การดำเนินการแก้ไขทั้งหมดจะปรากฏในรูปแบบของโหนดใหม่ที่แตกออกมา ไม่ทับซ้อนเนื้อหาดั้งเดิม รับประกันว่ากระบวนการสร้างสรรค์จะไม่ทำลายและสามารถย้อนกลับได้

นอกจากนี้ ฟังก์ชัน “Mark and Merge” อนุญาตให้ผู้ใช้เลือกองค์ประกอบจากรูปภาพต่างๆ มาผสมผสานสร้างใหม่ได้อย่างแม่นยำ เช่น การรวมมือคนจากรูป A กับขวดน้ำหอมจากรูป B

LibTV รวบรวมฟังก์ชันมืออาชีพกว่า 20 รายการ ซึ่งมีเครื่องมือพิเศษมากมาย ใช้ปุ่มลัด “/” เพื่อเรียกแผงฟังก์ชัน เช่น Storyboard Grid (สี่ช่อง) ซึ่งสามารถวางแผนและสร้างสตอรี่บอร์ดฉากที่ต่อเนื่องกันโดยอัตโนมัติจากเนื้อหาก่อนหน้า


สตอรี่บอร์ดภาพนิ่งที่สร้างขึ้นสามารถแยกเป็นรูปภาพเดี่ยวได้ด้วยคลิกเดียว และเชื่อมต่อกับโหนดวิดีโอโดยตรงเพื่อแปลงเป็นคลิปวิดีโอเคลื่อนไหว
สำหรับการสร้างภาพยนตร์สั้น “โหนดสคริปต์” เฉพาะทางรองรับสามโหมดในการสร้างสคริปต์สตอรี่บอร์ด: สร้างจากบทภาพยนตร์ สร้างจากวิดีโออ้างอิง และสร้างจากตัวละคร หลังจากสร้างสคริปต์แล้ว สามารถสร้างภาพสตอรี่บอร์ดที่สอดคล้องกันเป็นชุดได้ และแปลงเป็นสตอรี่บอร์ดวิดีโอเคลื่อนไหวด้วยคลิกเดียว



กระบวนการสร้างสรรค์ทั้งหมด—ตั้งแต่การกำหนดตัวละคร (โหนดข้อความ) การสร้างฉาก (โหนดรูปภาพ) ไปจนถึงการตัดต่อวิดีโอ (โหนดวิดีโอ) และเพลงพื้นหลัง (โหนดเสียง)—สามารถวางราบบนผ้าใบไร้ขอบเขตเดียวกันได้หมด หลีกเลี่ยงความยุ่งยากในการสลับระหว่างซอฟต์แวร์ต่างๆ และการย้ายไฟล์งาน

เวิร์กโฟลว์ที่เสร็จสมบูรณ์สามารถ “จัดกลุ่ม” และบันทึกเป็นเทมเพลต เพิ่มลงในชุดเครื่องมือส่วนตัวได้ เมื่อทำงานโครงการที่คล้ายกันในอนาคต เพียงแค่เปลี่ยนเนื้อหาหลัก ก็สามารถนำเวิร์กโฟลว์การสร้างสรรค์ทั้งหมดกลับมาใช้ใหม่ได้อย่างรวดเร็ว เพิ่มประสิทธิภาพได้อย่างมาก

การทำงานร่วมกับ Agent: สร้างวิดีโออัตโนมัติด้วย “ประโยคเดียว”
นอกจากโหมดการสร้างสรรค์ด้วยมือที่ทรงพลังแล้ว จุดเด่นอีกประการของ LibTV คือการผสานรวมความสามารถในการทำงานร่วมกับเอเจนต์ AI (Agent) อย่างลึกซึ้ง ผู้ใช้เพียงแค่ให้คำสั่งข้อความง่ายๆ แก่เอเจนต์ที่เชื่อมต่อกับ LibTV Skill (เช่น ผู้ช่วย AI ต่างๆ) ก็สามารถเริ่มกระบวนการสร้างวิดีโออัตโนมัติเต็มรูปแบบได้

ตัวอย่างเช่น คำสั่ง “สร้างภาพยนตร์สั้นเรื่องเต่ากับกระต่าย” เอเจนต์จะเรียกใช้ความสามารถต่างๆ ของ LibTV โดยอัตโนมัติ เพื่อทำงานทั้งหมดให้เสร็จสิ้น รวมถึงการทำความเข้าใจโครงเรื่อง การกำหนดสไตล์ การออกแบบสตอรี่บอร์ด การสร้างเนื้อหา และการรวมเข้าด้วยกัน ในที่สุดจะส่งกลับลิงก์วิดีโอผลงานสำเร็จพร้อมกับลิงก์ไปยังผ้าใบโปรเจกต์ที่สมบูรณ์ให้กับผู้ใช้
วิดีโอที่สร้างขึ้นอัตโนมัติแสดงผลงานที่ดีในด้านความสมบูรณ์ของโครงเรื่องและจังหวะ ที่สำคัญกว่านั้น ผู้ใช้สามารถดูเวิร์กโฟลว์โหนดทั้งหมดที่เอเจนต์ AI สร้างขึ้นในแบ็กเอนด์โดยละเอียดผ่านลิงก์ผ้าใบโปรเจกต์ที่ส่งคืน ทำให้กระบวนการสร้างสรรค์โปร่งใสและสามารถติดตามได้
การออกแบบ “มุมมองคู่” นี้ ตอบสนองทั้งความต้องการด้านการควบคุมและความลึกซึ้งของผู้สร้างสรรค์มืออาชีพ และยังมอบตัวเลือกที่เบาและรวดเร็วแบบ “คลิกเดียวได้ผลงานสำเร็จ” สำหรับผู้ใช้ที่ต้องการประสิทธิภาพ นิยามขอบเขตการทำงานร่วมกันของการสร้างวิดีโอ AI ใหม่
ก่อนหน้านี้ เมื่อเราออกแบบเวิร์กโฟลว์การสร้างวิดีโอด้วยตัวเอง เราต้องครอบคลุมหลายขั้นตอน เช่น บทภาพยนตร์ มุมมองตัวละคร สตอรี่บอร์ด และดนตรีประกอบ ตอนนี้ กระบวนการทั้งหมดนี้ได้ถูกนำไปใช้บนแพลตฟอร์มแล้ว

เมื่อเทียบกับการดำเนินการด้วยมือทั้งหมด การจัดวางผ้าใบที่สร้างขึ้นโดย AI ในตอนแรกอาจดูค่อนข้างยุ่งเหยิง เราสามารถจัดเรียงและจัดรูปแบบใหม่ได้ก่อน

หลังจากแพลตฟอร์มรับงานแล้ว ขั้นแรกจะสร้างบทภาพยนตร์ และสร้างมุมมองหลัก มุมมองด้านข้างของตัวละครแอนิเมชันสองตัวคือ “กระต่าย” และ “เต่า” พร้อมกับสตอรี่บอร์ดหกฉาก ตามบทภาพยนตร์

มุมมองตัวละครและสตอรี่บอร์ดเหล่านี้ถูกรวมเป็นวิดีโอยาว จากนั้นตัดต่อกับดนตรีประกอบที่สร้างขึ้นอัตโนมัติ และสุดท้ายรวมเป็นผลงานสำเร็จ

นอกจากนี้ การออกแบบแพลตฟอร์มเป็นมิตรกับผู้ใช้มาก หากไม่พอใจกับผลลัพธ์วิดีโอที่ AI สร้าง ผู้ใช้สามารถแก้ไขโหนดใดๆ ในเวิร์กโฟลว์ด้วยตนเอง แล้วสร้างใหม่ได้

กระบวนการสร้างวิดีโอที่มีระบบอัตโนมัติสูงนี้ ช่วยเพิ่มประสิทธิภาพการสร้างสรรค์ได้อย่างมาก
หลังจากเข้าใจผลลัพธ์แล้ว ต่อไปจะแนะนำวิธีมอบความสามารถในการสร้างวิดีโอแบบเดียวกันให้กับเอเจนต์ (Agent) ของคุณ
การดำเนินการง่ายมาก เพียงสองขั้นตอน: ติดตั้ง LibTV Skill และกำหนดค่าคีย์การเข้าถึง
ขั้นตอนที่ 1: ติดตั้ง LibTV Skill
มีสองวิธีในการติดตั้ง:
1. ติดตั้งผ่านคำสั่งเทอร์มินัล:
รันคำสั่งต่อไปนี้เพื่อติดตั้งด้วยคลิกเดียว:
bash
npx skills add libtv-labs/libtv-skills —skill libtv-skill

หลังการติดตั้งเสร็จสิ้น สามารถตรวจสอบด้วยคำสั่ง openclaw skills list หาก LibTV ปรากฏในรายการ Skill แสดงว่าการติดตั้งสำเร็จ

- ติดตั้งผ่านไฟล์:
เข้าถึงหน้า LibTV API Skills บนแพลตฟอร์ม ClawHub ดาวน์โหลดไฟล์ Skill แล้วแตกไฟล์ไปยังไดเรกทอรีที่เกี่ยวข้อง จากนั้นจึงสามารถเรียกใช้ได้

ขั้นตอนที่ 2: กำหนดค่าคีย์การเข้าถึง
หลังจากติดตั้ง Skill แล้ว ต้องไปที่เว็บไซต์ LibTV เพื่อรับ Access Key
หลังจากได้รับคีย์แล้ว สามารถกำหนดค่าได้ด้วยวิธีต่อไปนี้:
* ตั้งค่าตัวแปรสภาพแวดล้อม:
bash
export LIBTV_ACCESS_KEY="your-access-key"
* หรือกรอกโดยตรงใน OpenClaw Gateway

เพื่อความสะดวก คุณยังสามารถให้ Access Key แก่เอเจนต์โดยตรง และให้มันกำหนดค่าด้วยตัวเอง
ถึงตอนนี้ เอเจนต์ของคุณมีความสามารถในการกำกับและสร้างวิดีโอแล้ว และสามารถเริ่มสร้างสรรค์ได้
นอกจากสร้างตอนแอนิเมชันจากประโยคเดียวแล้ว คุณยังสามารถให้รูปภาพอ้างอิงได้ เช่น ให้เอเจนต์สร้างวิดีโอโฆษณาสำหรับเค้กในภาพ
รอประมาณ 5 นาที: ผลงานสำเร็จและผ้าใบที่สามารถดำเนินการได้ก็พร้อมแล้ว
ความสามารถของเอเจนต์ในฐานะ “ผู้กำกับและผู้สร้าง” พร้อมแล้ว
ภูมิหลังทางเทคนิคและข้อได้เปรียบ
คำถามที่ตามมาคือ: ทำไม LibTV ถึงสามารถนำร่องสร้างรูปแบบผลิตภัณฑ์ที่ผสาน “การดำเนินการของมนุษย์” และ “การทำงานร่วมกับเอเจนต์” เป็นทางเข้าคู่ และรวมฟังก์ชันเฉพาะหลายอย่างได้ก่อนใคร?
เบื้องหลังคือผลลัพธ์ของการสะสมประสบการณ์ของทีมในด้านการสร้างสรรค์ภาพแบบมัลติโมดอลเป็นเวลานาน
การสะสมประสบการณ์ในระบบนิเวศผู้สร้างสรรค์อย่าง
⚠️ หมายเหตุ: เนื้อหาได้รับการแปลโดย AI และตรวจสอบโดยมนุษย์ หากมีข้อผิดพลาดโปรดแจ้ง
本文来自网络搜集,不代表คลื่นสร้างอนาคต立场,如有侵权,联系删除。转载请注明出处:http://www.itsolotime.com/th/archives/26674
