01 เครื่องมือสกัดข้อมูลจากเอกสารโอเพนซอร์สจากกูเกิล
กูเกิลได้เปิดตัวไลบรารี Python ชื่อ LangExtract ซึ่งเป็นโครงการโอเพนซอร์สที่มีดาวสะสมเกือบ 30,000 ดาว ไลบรารีนี้ถูกออกแบบมาเพื่อใช้โมเดลภาษาขนาดใหญ่ (LLM) ในการดึงข้อมูลที่มีโครงสร้างจากข้อความที่ไม่มีโครงสร้าง เช่น การระบุและจัดระเบียบข้อมูลสำคัญจากเอกสารเวชระเบียนทางคลินิก รายงานต่างๆ โดยอัตโนมัติ และสามารถระบุตำแหน่งที่มาของข้อมูลแต่ละรายการในต้นฉบับได้อย่างแม่นยำ

คุณสมบัติหลักของไลบรารีนี้ ได้แก่ การระบุแหล่งที่มาอย่างแม่นยำ การปรับให้เหมาะสมกับเอกสารยาว และการรองรับการแสดงผลแบบโต้ตอบ มันสามารถสร้างไฟล์ HTML แยกออกมาได้ เพื่อให้ผู้ใช้สามารถดูและตรวจสอบผลลัพธ์การสกัดข้อมูลนับพันรายการในบริบทต้นฉบับได้อย่างสะดวก

ไลบรารีนี้รองรับการเลือกใช้โมเดลได้อย่างยืดหยุ่น ตั้งแต่ Gemini บนคลาวด์ไปจนถึง Ollama ที่รันในเครื่อง การติดตั้งทำได้ง่ายมาก: pip install langextract
- ที่อยู่โอเพนซอร์ส: https://github.com/google/langextract
02 เฟรมเวิร์กเวิร์กโฟลว์ AI อย่างเป็นทางการจาก GitHub
GitHub ได้เปิดตัวโครงการชื่อ Agentic Workflows ซึ่งอนุญาตให้ผู้ใช้เขียน Markdown ด้วยภาษาธรรมชาติเพื่อกำหนดและรันเวิร์กโฟลว์ AI แกนหลักคือ: อธิบายงานในไฟล์ Markdown จากนั้นดำเนินการอัตโนมัติผ่าน GitHub Actions

โครงการนี้คำนึงถึงความปลอดภัยอย่างรอบคอบ โดยใช้สิทธิ์อ่านอย่างเดียวเป็นค่าเริ่มต้น การดำเนินการเขียนต้องทำผ่านกลไก safe-outputs นอกจากนี้ยังรวมกลไกการป้องกันหลายชั้น เช่น การรันในแซนด์บ็อกซ์ การทำความสะอาดอินพุต การแยกเน็ตเวิร์ก การตรึง SHA ของดีเพนเดนซี และไวต์ลิสต์ของเครื่องมือ สำหรับนักพัฒนาที่ต้องการใช้ AI เพื่อทำงานในรีโพซิทอรีอัตโนมัติ แต่กังวลเรื่องความปลอดภัย นี่เป็นตัวเลือกที่น่าสนใจ

- ที่อยู่โอเพนซอร์ส: https://github.com/github/gh-aw
03 ชุดเครื่องมือ AI Agent
pi-mono เป็นชุดเครื่องมือ AI Agent โดยจุดเด่นอย่างหนึ่งคือ coding agent CLI ที่สามารถรันบน Raspberry Pi หรือเซิร์ฟเวอร์ในเครื่องได้

โครงการนี้ประกอบด้วยหลายส่วน: API มาตรฐานสำหรับ LLM, ไลบรารีสำหรับ TUI และ Web UI, Slack bot, vLLM pods เป็นต้น รองรับผู้ให้บริการโมเดลหลากหลาย รวมถึง Claude, ChatGPT, GitHub Copilot และ Google Gemini CLI
ในด้านการจัดการคอนเท็กซ์ มันรองรับการบีบอัดและกู้คืนอัตโนมัติ และสามารถจัดการได้เมื่อใกล้ถึงขีดจำกัดความยาวคอนเท็กซ์ ช่วยหลีกเลี่ยงปัญหาคอนเท็กซ์ล้นได้อย่างมีประสิทธิภาพ

- ที่อยู่โอเพนซอร์ส: https://github.com/badlogic/pi-mono
04 รวมตัวอย่างแอปพลิเคชัน LLM กว่า 100 รายการ
awesome-llm-apps เป็นรีโพซิทอรีที่รวบรวมตัวอย่างแอปพลิเคชันโมเดลภาษาขนาดใหญ่ (LLM) กว่า 100 รายการ ครอบคลุมรูปแบบการใช้งานหลากหลาย เช่น RAG, AI Agent, ทีมเอเจนต์หลายตัว, MCP, เอเจนต์เสียง เป็นต้น

โมเดลที่รองรับครอบคลุมมาก ตั้งแต่ OpenAI, Anthropic, Gemini, xAI ไปจนถึงโมเดลโอเพนซอร์สอย่าง Qwen, Llama โครงการในรีโพซิทอรีถูกจัดหมวดหมู่อย่างละเอียด ตั้งแต่ AI Agent ระดับเริ่มต้นไปจนถึงเอเจนต์เกมอัตโนมัติขั้นสูง จากแอปพลิเคชัน RAG ไปจนถึงแอปพลิเคชัน LLM ที่มีความจำ มีครบครัน
โครงการนี้เหมาะมากสำหรับนักพัฒนาที่ต้องการเรียนรู้การพัฒนาแอปพลิเคชัน LLM แต่ละโครงการมาพร้อมเอกสารประกอบอย่างละเอียด สามารถโคลนและรันได้ทันที

- ที่อยู่โอเพนซอร์ส: https://github.com/Shubhamsaboo/awesome-llm-apps
05 ให้ AI ควบคุมเบราว์เซอร์ Chrome
chrome-devtools-mcp เป็นเซิร์ฟเวอร์โปรโตคอลคอนเท็กซ์โมเดล (MCP) ที่ช่วยให้ผู้ช่วยเขียนโค้ด AI ของคุณสามารถควบคุมและตรวจสอบเบราว์เซอร์ Chrome ได้โดยตรง

มันรองรับชุดเครื่องมือที่หลากหลาย เช่น การคลิก ลากและวาง กรอกฟอร์ม จัดการกับไดอะล็อก กดปุ่ม อัปโหลดไฟล์ เป็นต้น นอกจากนี้ยังสามารถวิเคราะห์คำขอเครือข่าย ถ่ายภาพหน้าจอ ตรวจสอบข้อความในคอนโซล บันทึกการติดตามประสิทธิภาพ และรับข้อมูลเชิงลึกเกี่ยวกับประสิทธิภาพได้
นี่เท่ากับมอบความสามารถของ Chrome DevTools แบบเต็มรูปแบบให้กับผู้ช่วย AI เหมาะอย่างยิ่งสำหรับการทดสอบอัตโนมัติ การวิเคราะห์ประสิทธิภาพ และการดีบั๊กเว็บ โครงการนี้รองรับเครื่องมือเขียนโค้ด AI หลักๆ เช่น Claude Code, Cursor, Copilot, Gemini CLI
- ที่อยู่โอเพนซอร์ส: https://github.com/ChromeDevTools/chrome-devtools-mcp
06 เครื่องมือค้นหาฐานความรู้ในเครื่อง
qmd เป็นเครื่องมือค้นหา Markdown ในเครื่องแบบโอเพนซอร์สที่พัฒนาโดย Tobi Lutke CEO ของ Shopify มันผสมผสานการค้นหาข้อความเต็มรูปแบบแบบ BM25 การค้นหาเชิงความหมายด้วยเวกเตอร์ และเทคโนโลยีการจัดลำดับใหม่ด้วย LLM โดยรันทั้งหมดผ่าน Ollama ในเครื่องโดยไม่ต้องเชื่อมต่ออินเทอร์เน็ต

จุดเด่นทางเทคนิค ได้แก่ การขยายคำค้น (ใช้ LLM สร้างรูปแบบคำค้นที่หลากหลาย และเพิ่มน้ำหนักให้กับคำค้นเดิม) การค้นหาแบบผสมผสาน (ใช้ทั้ง FTS5 และการค้นหาเวกเตอร์พร้อมกัน) และการผสาน RRF พร้อมการผสมผสานที่คำนึงถึงตำแหน่ง (ปรับสัดส่วนน้ำหนักระหว่างการค้นหาและการจัดลำดับใหม่ตามตำแหน่งในการจัดอันดับ)
นอกจากนี้ยังรองรับโหมด MCP ซึ่งสามารถผสานรวมกับเครื่องมือ AI เช่น Claude Code ได้อย่างราบรื่น เหมาะอย่างยิ่งสำหรับการนำไปใช้ในเวิร์กโฟลว์ของเอเจนต์

- ที่อยู่โอเพนซอร์ส: https://github.com/tobi/qmd
ติดตาม “Whale Habitat” Mini Program เพื่อรับข่าวสาร AI ล่าสุด
⚠️ หมายเหตุ: เนื้อหาได้รับการแปลโดย AI และตรวจสอบโดยมนุษย์ หากมีข้อผิดพลาดโปรดแจ้ง
☕ สนับสนุนค่ากาแฟทีมงาน
หากคุณชอบบทความนี้ สามารถสนับสนุนเราได้ผ่าน PromptPay
本文来自网络搜集,不代表คลื่นสร้างอนาคต立场,如有侵权,联系删除。转载请注明出处:https://www.itsolotime.com/th/archives/22901
