01 การสร้างภาพประกอบงานวิจัยอัตโนมัติ: AutoFigure-Edit
อะไรคือสิ่งที่ปวดหัวที่สุดในการเขียนวิทยานิพนธ์? การวาดรูป โดยเฉพาะแผนภาพลำดับงานและแผนภาพโครงสร้าง มักใช้เวลามาก AutoFigure-Edit เป็นเครื่องมือวิชาการโอเพ่นซอร์สบน GitHub ที่ได้รับการคัดเลือกให้เข้าร่วม ICLR 2026 มีเป้าหมายเพื่อแก้ไขปัญหาการสร้างภาพประกอบในงานวิจัย

ฟังก์ชันหลักของเครื่องมือนี้คือ เมื่อป้อนคำอธิบายที่เป็นข้อความจากส่วนวิธีการของงานวิจัย มันจะสามารถสร้างภาพประกอบระดับมืออาชีพในรูปแบบ SVG ที่สามารถแก้ไขได้โดยอัตโนมัติ กระบวนการทำงานมีดังนี้: ขั้นแรกใช้โมเดลภาษาขนาดใหญ่ (LLM) เพื่อสร้างภาพร่างจากข้อความ จากนั้นใช้ SAM3 ในการแบ่งส่วนภาพเพื่อระบุพื้นที่ไอคอน ต่อมาใช้ RMBG-2.0 เพื่อลบพื้นหลัง และสุดท้ายประกอบองค์ประกอบทั้งหมดเข้าด้วยกันเป็นภาพเวกเตอร์ที่สมบูรณ์

จุดเด่นอย่างหนึ่งของ AutoFigure-Edit คือการรองรับฟังก์ชันการถ่ายโอนสไตล์ ผู้ใช้สามารถอัปโหลดรูปภาพอ้างอิง และเครื่องมือจะลอกเลียนแบบสไตล์ของรูปนั้นเพื่อวาดภาพใหม่ ซึ่งมีประโยชน์อย่างมากสำหรับการทำให้สไตล์ของภาพประกอบตลอดทั้งวิทยานิพนธ์เป็นเอกภาพ โครงการนี้ยังมีอินเทอร์เฟซเว็บในตัว ภาพที่สร้างขึ้นสามารถแก้ไขและปรับเปลี่ยนได้โดยตรงในเบราว์เซอร์ผ่านการลากและวาง ทำให้ใช้งานได้สะดวก

ที่อยู่โอเพ่นซอร์ส: https://github.com/ResearAI/AutoFigure-Edit
02 การทำงานอัตโนมัติบนเว็บแบบไม่ต้องเขียนโค้ด: WebRPA
เมื่อพูดถึงการทำงานอัตโนมัติบนเว็บ ผู้คนมักนึกถึงการเขียนสคริปต์ Python สำหรับครอว์เลอร์ แต่สำหรับผู้ที่ไม่ใช่โปรแกรมเมอร์แล้ว นี่เป็นอุปสรรคอยู่บ้าง WebRPA เป็นเครื่องมือทำงานอัตโนมัติบนเว็บแบบมองเห็นได้ ผู้ใช้สามารถสร้างเวิร์กโฟลว์อัตโนมัติได้โดยการลากและวางโมดูลฟังก์ชัน โดยไม่ต้องเขียนโค้ดใดๆ เลย
โครงการนี้มีโมดูลฟังก์ชันมากถึง 260 โมดูล ครอบคลุมสถานการณ์ต่างๆ เช่น การดำเนินการบนเว็บ การรวบรวมข้อมูล การประมวลผลไฟล์ การแปลงสื่อ การสนทนา AI เป็นต้น โครงการนี้มีสภาพแวดล้อมรันไทม์ Python 3.13 และ Node.js ในตัว แค่แตกไฟล์ก็ใช้งานได้ทันที
ฟังก์ชันของมันครอบคลุมมาก: การทำงานอัตโนมัติของเบราว์เซอร์ใช้พื้นฐานจาก Playwright รองรับวิธีการระบุตำแหน่งหลายแบบ เช่น CSS selector และ XPath การประมวลผลข้อมูลรองรับการอ่านเขียน JSON, Regular Expression และ Excel การประมวลผลสื่อใช้พื้นฐานจาก FFmpeg สามารถจัดการการแปลงรูปแบบเสียงและวิดีโอได้มากกว่า 50 รูปแบบ ความสามารถด้าน AI รองรับผู้ให้บริการหลายราย เช่น OpenAI, Zhipu, Tongyi Qianwen เป็นต้น



สิ่งที่ควรกล่าวถึงเป็นพิเศษคือระบบทริกเกอร์ของมัน ซึ่งรองรับวิธีการทริกเกอร์ 10 แบบ เช่น Webhook, งานตามกำหนดเวลา, การตรวจสอบไฟล์, การรับฟังคีย์ลัด เป็นต้น สามารถสร้างกระบวนการอัตโนมัติที่ซับซ้อนได้ โครงการนี้พัฒนาขึ้นโดยนักศึกษาปีหนึ่งคนหนึ่ง ซึ่งความสมบูรณ์ของโครงการน่าประทับใจมาก
ที่อยู่โอเพ่นซอร์ส: https://github.com/pmh1314520/WebRPA
03 เครื่องมือเพิ่มประสิทธิภาพ Claude Code: Trellis
หากคุณใช้เครื่องมือช่วยเขียนโค้ด AI อย่าง Claude Code เป็นประจำ Trellis เป็นโครงการที่น่าจับตามอง มันเป็นชุดเครื่องมือเฟรมเวิร์ก AI ที่ออกแบบมาโดยเฉพาะสำหรับเครื่องมือต่างๆ เช่น Claude Code, Cursor, Codex โดยมีเป้าหมายหลักคือทำให้ AI สามารถจดจำข้อกำหนดโครงการและแนวปฏิบัติที่ดีที่สุดของคุณได้อย่างยั่งยืน

ปัญหาของผู้ใช้หลายคนคือ ทุกครั้งที่สนทนากับ AI ต้องอธิบายข้อกำหนดโค้ด สไตล์คอมโพเนนต์ และโครงสร้างไฟล์ใหม่อีกครั้ง Trellis แก้ไขปัญหานี้ผ่านกลไกการฉีดอัตโนมัติ: ผู้ใช้เพียงกำหนดข้อกำหนดครั้งเดียว มันจะโหลดข้อกำหนดเหล่านั้นโดยอัตโนมัติทุกครั้งที่เริ่มการสนทนา
นอกจากนี้ยังรองรับฟังก์ชันการสนทนาคู่ขนาน สามารถรันงาน AI หลายงานพร้อมกันในต้นไม้การทำงานที่แตกต่างกัน โดยไม่รบกวนซึ่งกันและกัน ซึ่งมีประโยชน์อย่างยิ่งสำหรับสถานการณ์ที่ต้องพัฒนาหลายฟังก์ชันพร้อมกัน

การออกแบบโครงสร้างโครงการมีความชัดเจน: ไดเรกทอรี spec ใช้เก็บเอกสารข้อกำหนด ไดเรกทอรี workspace เป็นพื้นที่ทำงานส่วนบุคคล ซึ่งสะดวกสำหรับการทำงานร่วมกันเป็นทีม อีกฟังก์ชันที่มีประโยชน์คือการใช้คำสั่ง /trellis:record-session เพื่อบันทึกบันทึกการทำงาน AI สามารถอ่านบริบทก่อนหน้าได้โดยอัตโนมัติเมื่อเริ่มครั้งต่อไป


เมื่อเทียบกับไฟล์ CLAUDE.md ทั่วไป สถาปัตยกรรมแบบหลายชั้นของ Trellis มีความยืดหยุ่นมากกว่า โดยจะโหลดเฉพาะข้อกำหนดที่เกี่ยวข้องกับงานปัจจุบันเท่านั้น เพื่อหลีกเลี่ยงการป้อนข้อมูลทั้งหมดให้ AI ในครั้งเดียว
ที่อยู่โอเพ่นซอร์ส: https://github.com/mindfold-ai/Trellis
04 การเชื่อมต่อบอท QQ: qqbot
ต้องการเชื่อมต่อความสามารถ AI เข้ากับ QQ หรือไม่? โครงการ qqbot ที่ sliverp เปิดเผยแหล่งที่มาสามารถช่วยได้ มันเป็นปลั๊กอินหนึ่งของเฟรมเวิร์ก OpenClaw ผ่านกลไกการสมัครสมาชิกเหตุการณ์การเชื่อมต่อยาวของแพลตฟอร์มเปิด QQ เพื่อจัดการการเรียกกลับของข้อความและเหตุการณ์
ขั้นตอนการกำหนดค่าทั้งหมดค่อนข้างชัดเจน: ขั้นแรกต้องลงทะเบียนบัญชี สร้างบอทบนแพลตฟอร์มเปิด QQ เพื่อรับ AppID และ AppSecret จากนั้นติดตั้งปลั๊กอินด้วยคำสั่ง openclaw plugins install @sliverp/qqbot@latest กำหนดค่าใบรับรองให้เรียบร้อยก็สามารถใช้งานได้

เอกสารโครงการมีความละเอียดมาก ทุกขั้นตอนตั้งแต่การลงทะเบียนบัญชี การยืนยันตัวตน จนถึงการสร้างบอท มีคำอธิบายพร้อมภาพหน้าจอ ซึ่งเป็นมิตรกับผู้เริ่มต้น

สิ่งที่ควรทราบคือ ขณะนี้บอทบนแพลตฟอร์มเปิด QQ รองรับเฉพาะการแชทส่วนตัวเท่านั้น ยังไม่รองรับการแชทกลุ่ม แต่สำหรับสถานการณ์การใช้งานส่วนบุคคล ฟังก์ชันการแชทส่วนตัวก็เพียงพอแล้ว
ที่อยู่โอเพ่นซอร์ส: https://github.com/sliverp/qqbot
05 เฟรมเวิร์ก AI Agent ระดับการผลิต: CountBot
CountBot เป็นเฟรมเวิร์ก AI Agent ระดับการผลิตที่ใช้โค้ด 21K บรรทัดในการพัฒนา เปิดเผยแหล่งที่มาในเดือนกุมภาพันธ์ปีนี้ แม้ว่าโครงการนี้จะกำหนดตำแหน่งเป็นเครื่องมือนับจำนวนคำ แต่การออกแบบสถาปัตยกรรมของมันมีความเป็นสากลสูง โดยใช้แนวคิดเครื่องมือคือเอเจนต์ ซึ่งได้เตรียมพื้นที่ไว้สำหรับการขยายความสามารถในอนาคต เช่น การวิเคราะห์ข้อความ AI การช่วยเหลือการเขียน เป็นต้น
ด้านสแต็กเทคโนโลยี พัฒนาบนพื้นฐานของ Flutter รองรับแพลตฟอร์มเดสก์ท็อปสามระบบหลัก ได้แก่ Windows, macOS, Linux และปรับให้เข้ากับ HarmonyOS 6.0 ของ Huawei สำหรับนักพัฒนาที่ต้องการเรียนรู้การพัฒนาข้ามแพลตฟอร์ม นี่เป็นโครงการอ้างอิงที่ดี
ในฐานะเฟรมเวิร์กระดับการผลิต การจัดระเบียบโค้ด การแบ่งโมดูล และการจัดการข้อผิดพลาดค่อนข้างเป็นมาตรฐาน สามารถใช้เป็นกรณีศึกษาในการออกแบบสถาปัตยกรรม AI Agent ได้
ที่อยู่โอเพ่นซอร์ส: https://github.com/countbot-ai/CountBot
06 เทมเพลตโครงของ OpenClaw: ai-openclaw-skeletons
โครงการนี้เป็นส่วนหนึ่งของระบบนิเวศ OpenClaw ให้เทมเพลตโครงสำหรับการพัฒนา AI Agent OpenClaw เป็นเฟรมเวิร์กผู้ช่วย AI อเนกประสงค์โอเพ่นซอร์ส ที่มีดาวบน GitHub มากกว่า 160,000 ดวง แนวคิดหลักคือทำให้ AI สามารถทำงานจริงได้ ไม่ใช่แค่การสนทนา

ที่เก็บ ai-openclaw-skeletons ให้ชุดเทมเพลตโครงการต่างๆ ซึ่งสามารถช่วยนักพัฒนาในการสร้างแอปพลิเคชัน AI ที่ใช้พื้นฐานจาก OpenClaw ได้อย่างรวดเร็ว หากคุณต้องการพัฒนาต่อยอดในระบบนิเวศ OpenClaw โครงการโครงนี้สามารถประหยัดงานเริ่มต้นได้เป็นจำนวนมาก
ที่อยู่โอเพ่นซอร์ส: https://github.com/1596941391qq/ai-openclaw-skeletons
ติดตาม “Whale Habitat” Mini Program เพื่อรับข่าวสาร AI ล่าสุด
⚠️ หมายเหตุ: เนื้อหาได้รับการแปลโดย AI และตรวจสอบโดยมนุษย์ หากมีข้อผิดพลาดโปรดแจ้ง
本文来自网络搜集,不代表คลื่นสร้างอนาคต立场,如有侵权,联系删除。转载请注明出处:https://www.itsolotime.com/th/archives/22837
