เปิดตัวความคิด
คุณค่าของ Claude Skills ยังคงถูกประเมินต่ำเกินไปอย่างรุนแรง
Skill ที่ออกแบบมาอย่างดี สามารถมอบความสามารถทางปัญญาที่เทียบเคียงหรืออาจเหนือกว่าผลิตภัณฑ์ AI ที่สมบูรณ์ได้ สิ่งที่สำคัญที่สุดคือ: ใครก็สามารถพัฒนา Skill ของตัวเองได้ โดยไม่จำเป็นต้องมีพื้นฐานทางเทคนิคใดๆ
ยกตัวอย่างเช่น Article-Copilot ที่ผมพัฒนา ด้วย Skill เพียงตัวเดียว ผมก็สามารถสร้าง Agent Application ที่สามารถจัดการกระบวนการทั้งหมดตั้งแต่การจัดระเบียบเนื้อหาไปจนถึงการเขียนจริงได้
หลังจากศึกษาบล็อกทางเทคนิคอย่างลึกซึ้งของ Anthropic และทำการทดลองเชิงระบบกับ Agent Skills แล้ว ผมได้รวบรวมคู่มือ Skill ที่คิดว่าครอบคลุมที่สุดนี้ เนื้อหาประกอบด้วย:

- คำอธิบายแนวคิดและหลักการทำงานของ Skills ที่เข้าใจง่ายที่สุด
- การวิเคราะห์เชิงลึกเกี่ยวกับคุณค่าที่แท้จริง ข้อได้เปรียบทางเทคนิค และผลกระทบต่อการออกแบบผลิตภัณฑ์ AI ของ Skills
- บทเรียนแบบสมบูรณ์เกี่ยวกับการใช้และพัฒนา Skills
- วิธีการระบุสถานการณ์เฉพาะที่เหมาะกับการใช้ Skills
ตั้งแต่การชี้แจงแนวคิดไปจนถึงกลไกการทำงาน ตั้งแต่การลงมือปฏิบัติไปจนถึงการประยุกต์ใช้จริง ผมจะพาคุณเรียนรู้ทีละขั้น
ส่วนที่หนึ่ง: Skills คืออะไร? จากจุดกำเนิดถึงหลักการทำงาน
กลางเดือนตุลาคม 2025 Anthropic ได้เปิดตัว Claude Skills อย่างเป็นทางการ
สองเดือนต่อมา Agent Skills ได้รับการเปิดตัวเพิ่มเติมในฐานะมาตรฐานเปิด โดยมีเป้าหมายเพื่อสร้างระบบนิเวศการพัฒนา AI Agent แบบใหม่

หลังจากนั้น แพลตฟอร์มต่างๆ เช่น OpenAI, GitHub, VS Code และ Cursor ก็ได้ติดตามมาสนับสนุน

เพื่อให้เข้าใจได้ดีขึ้น คุณสามารถมองว่า Skills เป็น “แพ็คเกจขยายความสามารถสำหรับ Agent ทั่วไป”:
Agent หนึ่งตัวสามารถโหลดแพ็คเกจ Skills ที่แตกต่างกัน เพื่อรับความรู้เฉพาะทาง ความสามารถในการใช้เครื่องมือที่แตกต่างกัน และทำงานเฉพาะด้านได้อย่างน่าเชื่อถือ

คำถามที่พบบ่อยที่สุดคือ: Skills กับ MCP แตกต่างกันอย่างไร?
- MCP เป็นโปรโตคอลมาตรฐานเปิด หลักการสำคัญคือกำหนดวิธีที่ AI จะเรียกใช้เครื่องมือภายนอก ข้อมูล และบริการในรูปแบบที่เป็นมาตรฐานเดียวกัน โดยตัวมันเองไม่ได้กำหนดตรรกะงานหรือขั้นตอนการดำเนินงานที่เฉพาะเจาะจง
- Skills คือการสอน Agent วิธีทำงานเฉพาะด้านตั้งแต่ต้นจนจบ โดยรวมวิธีการดำเนินงาน รูปแบบการเรียกใช้เครื่องมือ และวัสดุความรู้ที่เกี่ยวข้องเข้าด้วยกันเป็น “แพ็คเกจขยายความสามารถ” ที่สมบูรณ์ ทำให้ Agent มีเส้นทางการทำงานที่เสถียรและนำกลับมาใช้ใหม่ได้
ต่อไปนี้คือตัวอย่าง Skill ที่ Anthropic ให้มา:
- PDF: ประกอบด้วยสคริปต์โค้ดสำหรับการรวม แยก และดึงข้อความจาก PDF สอน Agent วิธีจัดการไฟล์ PDF ดึงข้อความ สร้าง PDF ใหม่ รวมหรือแยกเอกสาร
- Brand-guidelines: ประกอบด้วยข้อกำหนดการออกแบบแบรนด์และทรัพยากรโลโก้ เมื่อ Agent ออกแบบเว็บไซต์หรือโปสเตอร์ จะสามารถอ้างอิงทรัพยากรเหล่านี้และปฏิบัติตามมาตรฐานการออกแบบขององค์กรโดยอัตโนมัติ
- Skill-Creator: บรรจุวิธีการสร้าง Skills เองให้เป็น “เมตา Skill” ทำให้ AI สามารถริเริ่มกระบวนการสร้าง Skill นำผู้ใช้ไปสู่การสร้าง Skills ที่มีคุณภาพสูงและตรงตามความต้องการ
แต่คุณค่าของ Skills ไปไกลกว่านั้น
เราสามารถมองว่าเป็นรูปแบบทั่วไปจากการพัฒนา Agent เฉพาะทางไปสู่การพัฒนา AI Product: คุณสามารถใช้ความสามารถหลักของ Agent ทั่วไป สร้าง Agent Application เฉพาะทางที่มีขีดจำกัดความฉลาดทั่วไปได้ โดยแทบไม่มีอุปสรรค
เริ่มจากวิธีการทำงานของ Skills ก่อน
จะเข้าใจ Skills อย่างไร?
คำจำกัดความของ Anthropic คือ:
Skills เป็นความสามารถแบบโมดูลาร์สำหรับขยายฟังก์ชันการทำงานของ Agent แต่ละ Skill บรรจุคำสั่ง LLM เมตาดาต้า และทรัพยากรเสริม (สคริปต์ เทมเพลต ฯลฯ) ซึ่ง Agent จะเรียกใช้โดยอัตโนมัติเมื่อจำเป็น
ผมมีคำเปรียบเทียบที่เข้าใจง่ายกว่า: Skills เหมือนกับ “ชุดมอบหมายงาน” ที่เตรียมให้กับ Agent
ลองนึกภาพว่าคุณต้องมอบหมายงานให้กับเพื่อนร่วมงานใหม่ หากไม่สามารถสอนตัวต่อตัวได้ และต้องพึ่งพาเอกสารเท่านั้น (และคุณต้องการมอบหมายให้เสร็จในครั้งเดียว โดยไม่ต้องการให้รบกวนอีกในภายหลัง) คุณจะเตรียมอะไรบ้าง?
- SOP การทำงานและความรู้พื้นฐานที่จำเป็น (อธิบาย “ควรทำอย่างไรโดยประมาณ”)
- คู่มือการใช้เครื่องมือ (ใช้ซอฟต์แวร์อะไร ใช้งานอย่างไร)
- เทมเพลตและวัสดุที่ต้องการ (กรณีศึกษาย้อนหลัง มาตรฐานรูปแบบ)
- ปัญหาที่อาจเกิดขึ้น ข้อกำหนด และแนวทางแก้ไข (รายละเอียดเพิ่มเติมและคำแนะนำ)
สถาปัตยกรรมการออกแบบ Skill โดยพื้นฐานแล้วคือเวอร์ชันดิจิทัลของชุดมอบหมายงานนี้:

ตัวอย่างโครงสร้าง Skill ที่ค่อนข้างเป็นมาตรฐาน ในการใช้งานจริง มีเพียง SKILL.md เท่านั้นที่จำเป็น โครงสร้างอื่นๆ เป็นตัวเลือกทั้งหมด
ในหนึ่ง Skill เอกสารคำสั่งให้คำแนะนำที่ยืดหยุ่น โค้ดรับผิดชอบการเรียกใช้ที่เชื่อถือได้ ทรัพยากรใช้สำหรับการค้นหาข้อเท็จจริงและการอ้างอิง
เมื่อ Agent เรียกใช้ Skill มันจะ:
- ใช้
SKILL.mdเป็นแนวทางการดำเนินงานหลัก - ตัดสินใจตามสถานการณ์งานว่าเมื่อใดควรเรียกใช้สคริปต์โค้ด อ้างอิงเอกสาร หรือใช้ไฟล์ทรัพยากร
- ทำเป้าหมายงานสุดท้ายให้สำเร็จผ่านวงจรตอบรับสลับกันของ “วางแผน-ดำเนินการ-สังเกต”
แน่นอน Skills ยังสามารถขยายขอบเขตการใช้เครื่องมือและบริการ MCP ของ Agent ได้ ผ่านเอกสารและสคริปต์ คุณสามารถสอน Agent ให้เชื่อมต่อและใช้เครื่องมือภายนอกและบริการ MCP เฉพาะเจาะจงได้
นี่คือตัวอย่างไดเรกทอรีไฟล์ของ Skill PPTX:

- โฟลเดอร์ทั้งหมดนี้คือชุดความสามารถสมบูรณ์ที่รองรับการสร้าง แก้ไข วิเคราะห์งานนำเสนอ PowerPoint โดย AI
- ไฟล์หลักคือ
SKILL.mdประกอบด้วยเมตาดาต้าและคำแนะนำงานของ Skill บอก Agent ว่าเมื่อใดควรใช้ Skill นี้และจะประมวลผลงานเป็นขั้นตอนอย่างไร - สิ่งที่ควรทราบคือ มักจะแยกทักษะย่อยที่ค่อนข้างเป็นอิสระออกเป็นเอกสารย่อย (เช่น
html2pptx.mdสอน AI วิธีส่งออก HTML เป็น PPTX) เพื่อหลีกเลี่ยงการโหลดเอกสาร Skill ที่ยาวเกินไปในครั้งเดียว ซึ่งจะช่วยประหยัดพื้นที่หน้าต่างบริบท - ไดเรกทอรี
scripts/ประกอบด้วยสคริปต์โปรแกรมที่เขียนไว้ล่วงหน้าต่างๆ ที่ Agent สามารถเรียกใช้ได้ เช่น สคริปต์แปลง HTML เป็น PPTX ด้วยคลิกเดียว ดังนั้น Agent ไม่จำเป็นต้องพัฒนาเครื่องมือชั่วคราวขณะทำงาน สามารถเรียกใช้โดยตรงได้ ประหยัดโทเค็น หลีกเลี่ยงข้อผิดพลาด และเพิ่มความเร็ว - นอกจากนี้ยังมีเอกสารอ้างอิง (วิธีการบรรจุภัณฑ์ของโปรเจกต์นี้ไม่ได้มาตรฐานสมบูรณ์ แต่จาก
SKILL.mdAgent ยังสามารถเข้าใจได้ว่าเอกสารใดสามารถอ้างอิงได้) เช่นooxml.mdซึ่งเป็นคู่มือการวิเคราะห์ไฟล์รูปแบบ OOXML
Skill ทั้งหมดรวมเอกสารคำแนะนำความสามารถ สคริปต์โค้ด เอกสารอ้างอิง และทรัพยากรที่ใช้ได้เข้าด้วยกันในรูปแบบที่กระชับ ขยายความสามารถการทำงานของ Agent ในด้านการสร้าง PPTX อย่างมีทิศทาง
คุณค่าที่แท้จริงของ Skills: รูปร่างอนาคตของ Agent เฉพาะทาง
เหตุผลที่ผมมองเห็นคุณค่าและระบบนิเวศในอนาคตของ Skills เพราะกลไกพื้นฐานของ Skills แตกต่างจากวิธีการพัฒนา AI Application อื่นๆ อย่างสิ้นเชิง:
มนุษย์ให้ความรู้เฉพาะทางและวิธีการใช้เครื่องมือ; Agent ทั่วไปให้ความฉลาด ความเข้าใจอิสระ และการดำเนินการเชิงรุก
พูดตรงๆ คือ: มนุษย์รับผิดชอบให้คำแนะนำ สุดท้าย Agent ใช้ความฉลาดของมันในการดำเนินการ
และรูปร่าง “Agent + ไฟล์” นี้เป็นรูปแบบทั่วไปเพียงพอ
สิ่งนี้สร้างข้อได้เปรียบที่สำคัญสามประการเมื่อเทียบกับรุ่นก่อนหน้า (เวิร์กโฟลว์และ AI Application แบบโค้ด):
- ผู้ที่ไม่ใช่เทคนิคสามารถเขียนได้โดยไม่ต้องใช้โค้ด ใช้ภาษาธรรมชาติ
- สามารถก้าวข้ามข้อจำกัดที่กำหนดไว้ล่วงหน้า ตอบสนองต่ออินพุตผู้ใช้อย่างยืดหยุ่น จัดการกรณีขอบเขต
- หลาย Skills ยังสามารถรวมกันได้อย่างอิสระ วิธีการประยุกต์ใช้มีความยืดหยุ่นสูง
การอภิปรายในส่วนนี้อาจลึกซึ้งเล็กน้อย แต่เมื่อรวมกับตัวอย่างที่สมบูรณ์แล้วก็เข้าใจได้ไม่ยาก แม้ว่าจะรวมการตัดสินใจส่วนตัวของผม แต่ควรช่วยให้คุณเข้าใจคุณค่าหลักของ Skill และแนวโน้มการพัฒนา Agent
1. สร้าง Agents ที่ฉลาดจริงๆ โดยไม่ต้องใช้โค้ด ใช้ภาษาธรรมชาติ
ย้อนดูวิธีการพัฒนา AI Application ก่อนหน้านี้:
- ไม่ต้องพูดถึงการพัฒนาแบบโค้ด ต้องเข้าใจตรรกะโปรแกรมและการนำทางเทคนิค
- แม้แต่แพลตฟอร์มเวิร์กโฟลว์ที่ได้รับความนิยมเมื่อเร็วๆ นี้ (เช่น Coze, Dify, N8N) คุณยังต้องเข้าใจการกำหนดค่าจุดเชื่อมต่อ สาขาเงื่อนไข ซึ่งโดยพื้นฐานแล้วยังคงเป็นการ “เขียนโปรแกรม” เพียงแต่อินเทอร์เฟซเป็นมิตรมากขึ้น
แต่เกณฑ์การสร้างของ Skills แตกต่างออกไป: เกณฑ์การเริ่มต้นต่ำมาก ขีดจำกัดความฉลาดสูงมาก
ยกตัวอย่าง Skill ที่ง่ายที่สุดของ Anthropic: brand-guidelines
ต้องการเพียงไฟล์ SKILL.md ไฟล์เดียว และเขียนด้วยภาษาธรรมชาติทั้งหมด

- เมตาดาต้า: กำหนดเมื่อใดควรใช้ Skill นี้
- เนื้อหา: อธิบายข้อกำหนดเช่นสีแบรนด์ ฟอนต์ ฯลฯ ด้วยข้อความ
เพียงเท่านี้ ก็เพียงพอที่จะนำ Agent ไปสู่การเป็น Agent เฉพาะทางที่ปฏิบัติตามข้อกำหนดการออกแบบแบรนด์ของ Anthropic สามารถใช้สำหรับการออกแบบเว็บไซต์แบรนด์ โปสเตอร์ PPT
เมื่อต้องการออกแบบเว็บไซต์ค้นหา AI ที่ปฏิบัติตามมาตรฐานการออกแบบของ Anthropic Agent จะเรียกใช้ Skill นี้โดยอัตโนมัติ
Skills มีโหมดการโหลดสองแบบ: แบบชัดแจ้งและแบบโดยนัย
การโหลดแบบชัดแจ้งผู้ใช้ระบุโดยตรงในคำถาม การโหลดแบบโดยนัย LLM จะจับคู่และเรียกใช้โดยอัตโนมัติตามความเกี่ยวข้องระหว่างงานและคำอธิบายเมตาดาต้าของทักษะ
ตัวอย่างเช่น เว็บไซต์ที่แสดงในภาพด้านล่างนี้พัฒนาโดย Agent ที่มีทักษะที่เกี่ยวข้องในครั้งเดียว การออกแบบสไตล์ใกล้เคียงกับเว็บไซต์อย่างเป็นทางการของ Claude:

สำหรับกรณีศึกษาที่ซับซ้อนมากขึ้น สามารถอ้างอิงตัวอย่างทางการ เช่น การสร้าง PPT
กรณีศึกษาเหล่านี้ยืนยันข้อเท็จจริง: Agent เฉพาะทางที่สร้างขึ้นโดยใช้เพียง Skill + Agent ผลลัพธ์ความฉลาดที่ได้สามารถเทียบเท่าหรือแม้แต่เหนือกว่า AI Product ประเภทเดียวกัน
และกระบวนการสร้าง Agent เฉพาะทางเหล่านี้ ไม่จำเป็นต้องเขียนโค้ดโปรแกรมใดๆ
นี่หมายความว่า ผู้เชี่ยวชาญเฉพาะทางที่ไม่ใช่เทคนิค อยู่ห่างจากการสร้าง Agent มืออาชีพของตัวเองเพียงก้าวเดียว เพียงแค่จัดทำเอกสารประสบการณ์มืออาชีพและขั้นตอนการทำงานให้ชัดเจน Agent ก็สามารถทำงานตามนั้นได้
2. ก้าวข้ามข้อจำกัดที่กำหนดไว้ล่วงหน้า จัดการสถานการณ์จริงอย่างยืดหยุ่น
ข้อได้เปรียบนี้มักถูกละเลย
ปัญหาหลักของเวิร์กโฟลว์หรือโปรแกรมแบบดั้งเดิมคือ: สันนิษฐานว่าสามารถกำหนดสถานการณ์ทั้งหมดล่วงหน้าได้
ตัวอย่างเช่น ผู้ช่วย AI ส่วนบุคคลที่ใช้ความจำของผู้ใช้ มักต้องการกำหนดล่วงหน้าว่า:
* จุดเข้าสำหรับผู้ใช้ในการนำเข้าไฟล์ความจำ
* รูปแบบไฟล์ที่รองรับการอัปโหลด
* ฟิลด์ข้อมูลที่ควรมี
* สถานการณ์พิเศษที่อาจเกิดขึ้นและวิธีการจัดการ
แต่สถานการณ์จริงมักเป็น:
* คุณต้องแนะนำผู้ใช้ว่าคลิกปุ่ม “นำเข้า” ที่ตำแหน่งใด
* ผู้ใช้มีเฉพาะรูปแบบไฟล์ที่คาดไม่ถึง: คุณรองรับเฉพาะ Markdown แต่เขามีเฉพาะเอกสาร Word
* ฟิลด์ข้อมูลไม่ตรงกัน: คุณคาดหวังให้ทุกไฟล์มีหัวข้อ แต่ไฟล์ของผู้ใช้ไม่มี
* หรือมีสถานการณ์ขอบเขตที่ไม่ได้กำหนดไว้ล่วงหน้า

ในเวลานั้น เวิร์กโฟลว์หรือโปรแกรมแบบดั้งเดิมจะหยุดชะงัก พวกมันสามารถดำเนินการตามเส้นทางที่กำหนดไว้ล่วงหน้าเท่านั้น เมื่อพบสิ่งที่ไม่คาดคิดก็จะรายงานข้อผิดพลาด หรือขอให้ผู้ใช้แก้ไขปัญหาด้วยตัวเอง
อย่างไรก็ตาม การประยุกต์ใช้ร่วมกันของ Agent ทั่วไปและ Skill แตกต่างอย่างสิ้นเชิง:
* สามารถรับข้อมูลผู้ใช้ต่างๆ (ข้อความ ไฟล์ รูปภาพ) ในกล่องโต้ตอบเดียวกัน
* สามารถเรียกใช้ Skills อื่นๆ โดยอิสระ หรือเขียนสคริปต์แปลงเอกสารชั่วคราว ประมวลผลรูปแบบที่ผู้ใช้ให้มาโดยอัตโนมัติ
*
⚠️ หมายเหตุ: เนื้อหาได้รับการแปลโดย AI และตรวจสอบโดยมนุษย์ หากมีข้อผิดพลาดโปรดแจ้ง
本文来自网络搜集,不代表คลื่นสร้างอนาคต立场,如有侵权,联系删除。转载请注明出处:https://www.itsolotime.com/th/archives/23045
