Karpathy เข้าร่วม Anthropic เปิดตัว 5 โปรเจกต์สุดเจ๋ง: จากฝึก ChatGPT ด้วยเงิน 100 ดอลลาร์ สู่ AI ที่ทำวิจัยได้เอง

Karpathy เข้าร่วม Anthropic อย่างเป็นทางการ

เมื่อวานนี้ Karpathy โพสต์ข้อความบน X ประกาศว่าเขาได้เข้าร่วม Anthropic อย่างเป็นทางการแล้ว

Karpathy เข้าร่วม Anthropic เปิดตัว 5 โปรเจกต์สุดเจ๋ง: จากฝึก ChatGPT ด้วยเงิน 100 ดอลลาร์ สู่ AI ที่ทำวิจัยได้เอง

ผู้ร่วมก่อตั้ง OpenAI, อดีตผู้อำนวยการฝ่าย AI ของ Tesla, อาจารย์ผู้สอนวิชา CS231n ของ Stanford, ผู้ก่อตั้ง Eureka Labs หลังจากวนเวียนไปมา ในที่สุดก็เลือก Anthropic

ครั้งนี้เขาเข้าร่วมทีม Pre-training ของ Claude จะทำงานเคียงบ่าเคียงไหล่กับ Nick Joseph และสร้างทีมใหม่ทั้งหมด โดยมุ่งเน้นการใช้ Claude ในการเขียนโปรแกรม AI

ทันทีที่ข่าวประกาศออกไป แพลตฟอร์ม X ก็เดือดพล่านทันที

อิทธิพลของ Karpathy บน GitHub ก็ยิ่งใหญ่เช่นกัน เขาเปิดโอเพนซอร์สโปรเจกต์ที่มีผลกระทบ深远มากมาย

Karpathy เข้าร่วม Anthropic เปิดตัว 5 โปรเจกต์สุดเจ๋ง: จากฝึก ChatGPT ด้วยเงิน 100 ดอลลาร์ สู่ AI ที่ทำวิจัยได้เอง

สไตล์ของเขาชัดเจนมาก: ใช้โค้ดที่简洁ที่สุด อธิบายหลักการที่ลึกซึ้งที่สุด

ไม่มีสถาปัตยกรรมที่ซับซ้อน ไม่มีการพึ่งพาที่ยุ่งยาก ตรรกะหลักมักมีเพียงไม่กี่ร้อยบรรทัด แต่ทุกอันก็คุ้มค่าที่จะอ่านซ้ำแล้วซ้ำเล่า

ด้านล่างนี้คือ 5 โปรเจกต์ที่เป็นตัวแทนมากที่สุดที่คัดสรรมาแนะนำให้ทุกคน

01. ใช้เงิน 100 ดอลลาร์เทรน ChatGPT ของคุณเอง

Karpathy อ้างว่า ใช้เงินเพียง 100 ดอลลาร์ ก็สามารถเทรน ChatGPT ของตัวเองตั้งแต่เริ่มต้นได้

nanochat ถูกสร้างขึ้นมาเพื่อสิ่งนี้โดยเฉพาะ

Karpathy เข้าร่วม Anthropic เปิดตัว 5 โปรเจกต์สุดเจ๋ง: จากฝึก ChatGPT ด้วยเงิน 100 ดอลลาร์ สู่ AI ที่ทำวิจัยได้เอง

ตำแหน่งของมันชัดเจนมาก: The best ChatGPT that $100 can buy. (ChatGPT ที่ดีที่สุดที่ 100 ดอลลาร์ซื้อได้)

คุณ只需เช่าเซิร์ฟเวอร์ GPU บนคลาวด์ รันสคริปต์หนึ่งตัว หลังจาก 4 ชั่วโมง คุณก็สามารถสนทนากับโมเดลที่คุณเทรนเองได้ในอินเทอร์เฟซเว็บที่คล้ายกับ ChatGPT

Karpathy เข้าร่วม Anthropic เปิดตัว 5 โปรเจกต์สุดเจ๋ง: จากฝึก ChatGPT ด้วยเงิน 100 ดอลลาร์ สู่ AI ที่ทำวิจัยได้เอง

ตั้งแต่ tokenizer แบบ Rust ที่กำหนดเอง ไปจนถึงการเทรนแบบกระจาย และบริการ推理บนเว็บ ห่วงโซ่ทั้งหมดถูกรวมไว้อย่างสมบูรณ์ใน repository เดียว

โค้ดถูกออกแบบให้มีความสามารถในการแก้ไข (hackable) สูง ซึ่งหมายความว่าคุณสามารถเปลี่ยนแปลงและทดลองได้ตามอำเภอใจ มันไม่ใช่เฟรมเวิร์กที่พึ่งพามากมายจนไม่กล้าแตะต้อง แต่เป็นโปรเจกต์ที่เมื่อคุณเปิดดูครั้งเดียวก็เข้าใจกระบวนการทั้งหมด

โปรเจกต์นี้ยังเป็นโปรเจกต์จบการศึกษาของหลักสูตร LLM101n ที่ Karpathy เปิดในบริษัทการศึกษาด้าน AI ของเขา Eureka Labs

หลักสูตรนี้สอนวิธีสร้าง LLM ตั้งแต่เริ่มต้น และ nanochat ก็คือผลลัพธ์สุดท้าย

พูดง่ายๆ โปรเจกต์นี้มีไว้สำหรับคนที่ต้องการเข้าใจห่วงโซ่สมบูรณ์ของ ChatGPT อย่างถ่องแท้ มันมีประโยชน์มากกว่าการอ่าน论文 100 เท่า เพราะคุณสามารถรันมันได้จริง

เมื่อเร็วๆ นี้ ในพอดแคสต์ของ Zhang Xiaojun ดูเหมือนว่า Yao Shunyu จะศึกษาโปรเจกต์นี้อย่างลึกซึ้งก่อนสัมภาษณ์ที่ Anthropic

  • ที่อยู่โอเพนซอร์ส: https://github.com/karpathy/nanochat

02. ให้ AI Agents ทำการวิจัยให้คุณโดยอัตโนมัติ

โปรเจกต์นี้มีจำนวน Stars มากที่สุดในบรรดา repositories ทั้งหมดของ Karpathy

มันเป็นเครื่องมือที่ให้ AI สามารถรันการทดลองได้โดยอัตโนมัติ

สิ่งที่ autoresearch ทำนั้นเรียบง่าย แต่มีพลิกโฉมอย่างยิ่ง: บน GPU ตัวเดียว ให้ AI agents ทำการทดลองเทรนและวิจัยทางวิทยาศาสตร์โดยอัตโนมัติโดยใช้ nanochat เป็นฐาน

Karpathy เข้าร่วม Anthropic เปิดตัว 5 โปรเจกต์สุดเจ๋ง: จากฝึก ChatGPT ด้วยเงิน 100 ดอลลาร์ สู่ AI ที่ทำวิจัยได้เอง

ในการเทรน LLM นักวิจัยมนุษย์มักต้องปรับค่าไฮเปอร์พารามิเตอร์ด้วยตนเอง รันการทดลอง ดูผลลัพธ์ วิเคราะห์ล็อก จากนั้นปรับพารามิเตอร์อีกครั้งเพื่อทำการทดลองรอบต่อไป

autoresearch ทำให้กระบวนการวนซ้ำนี้เป็นอัตโนมัติอย่างสมบูรณ์

AI สามารถปรับพารามิเตอร์เอง รันการทดลองเอง วิเคราะห์ผลลัพธ์เอง และตัดสินใจขั้นตอนต่อไป

门槛ของมันต่ำมาก แค่ GPU ตัวเดียวก็รันได้ แต่แนวคิดที่มันเป็นตัวแทนนั้นสำคัญยิ่ง: AI ไม่ใช่แค่เป้าหมายของการวิจัย แต่ยังสามารถเป็นผู้ดำเนินการวิจัยได้อีกด้วย

Karpathy เข้าร่วม Anthropic เปิดตัว 5 โปรเจกต์สุดเจ๋ง: จากฝึก ChatGPT ด้วยเงิน 100 ดอลลาร์ สู่ AI ที่ทำวิจัยได้เอง

นี่คือการสำรวจของ Karpathy ในทิศทางการวิจัยทางวิทยาศาสตร์ที่ใช้ AI ช่วยเหลือ

ปัจจุบันสาขานี้ยังอยู่ในช่วงเริ่มต้น แต่ลองคิดดูว่าถ้า AI สามารถทำวิจัยได้อย่างอิสระ ความเร็วของความก้าวหน้าจะไม่เป็นเส้นตรงอีกต่อไป

  • ที่อยู่โอเพนซอร์ส: https://github.com/karpathy/autoresearch

03. ให้โมเดลใหญ่หลายตัวประชุมโต้วาที แล้วให้คำตอบสุดท้ายแก่คุณ

ตั้งคำถามหนึ่งข้อ ให้ Claude เขียนคำตอบ ให้ GPT เขียนคำตอบ ให้ Gemini เขียนคำตอบด้วย

จากนั้นให้พวกมันให้คะแนน评论กันเอง สุดท้ายให้ประธานโมเดลสรุปคำตอบสุดท้าย

นี่คือวิธีการเล่นของ llm-council

Karpathy เข้าร่วม Anthropic เปิดตัว 5 โปรเจกต์สุดเจ๋ง: จากฝึก ChatGPT ด้วยเงิน 100 ดอลลาร์ สู่ AI ที่ทำวิจัยได้เอง

มันเป็นเว็บแอปพลิเคชัน本地 อินเทอร์เฟซดูเหมือน ChatGPT แต่กลไกเบื้องหลังแตกต่างอย่างสิ้นเชิง

เมื่อคุณป้อนคำถาม มันจะส่งคำถามไปยัง LLM หลายตัวพร้อมกันผ่าน OpenRouter แต่ละโมเดลตอบอย่างอิสระ จากนั้น评论และจัดอันดับกันเอง สุดท้าย Chairman LLM จะ综合得出คำตอบที่ดีที่สุด

Karpathy คิดว่าศักยภาพของการรวม LLM ถูกประเมินต่ำเกินไป

ลองคิดดู มันก็มีเหตุผล

โมเดลเดี่ยวมีอคติ จุดบอด และภาพหลอน แต่ถ้าคุณให้โมเดลหลายตัวตรวจสอบข้ามกัน ติติงกันเอง สุดท้ายคุณภาพของคำตอบที่综合ออกมาจะสูงกว่ามาก

แนวคิดนี้ไม่เพียง適用กับ问答เท่านั้น ทุกสถานการณ์ที่ต้องการการตัดสินใจ เช่น การทบทวนแผน การตรวจสอบโค้ด การวิเคราะห์การลงทุน ก็สามารถใช้วิธีการโต้วาทีของหลายโมเดลได้

การ配置ก็ง่ายมาก ผ่าน OpenRouter คุณสามารถ组合โมเดลได้ตามต้องการ อยากเพิ่มตัวไหนก็เพิ่ม มีคน fork โปรเจกต์นี้แล้ว เพิ่มการรองรับโมเดล本地ของ Ollama และบางคนก็สร้าง UI ที่ทันสมัยกว่า

  • ที่อยู่โอเพนซอร์ส: https://github.com/karpathy/llm-council

04. ให้คะแนนอาชีพ 342 อาชีพทั่วสหรัฐอเมริกา

โปรเจกต์นี้ Stars ไม่มาก แต่อาจเป็นโปรเจกต์ที่คนทั่วไปควรสนใจมากที่สุด

งานของคุณมีโอกาสถูก AI ส่งผลกระทบมากแค่ไหน?

Karpathy คำนวณอาชีพทั่วสหรัฐอเมริกาโดยตรง

Karpathy เข้าร่วม Anthropic เปิดตัว 5 โปรเจกต์สุดเจ๋ง: จากฝึก ChatGPT ด้วยเงิน 100 ดอลลาร์ สู่ AI ที่ทำวิจัยได้เอง

เขาดึงข้อมูลอาชีพ 342 อาชีพจากสำนักงานสถิติแรงงานสหรัฐ ครอบคลุมตำแหน่งงาน 143 ล้านตำแหน่งทั่วประเทศ

จากนั้น ให้ LLM ให้คะแนนการเปิดรับ AI (AI exposure score) 0-10 คะแนนสำหรับแต่ละอาชีพ — ยิ่งคะแนนสูง ความเสี่ยงที่จะถูก AI ส่งผลกระทบยิ่งมาก

สุดท้าย เขานำข้อมูลนี้มาสร้างเป็นแผนภาพ treemap แบบโต้ตอบ

Karpathy เข้าร่วม Anthropic เปิดตัว 5 โปรเจกต์สุดเจ๋ง: จากฝึก ChatGPT ด้วยเงิน 100 ดอลลาร์ สู่ AI ที่ทำวิจัยได้เอง

คลิกเข้าไป จะเห็นข้อมูลรายละเอียดของแต่ละอาชีพ: ค่าจ้างมัธยฐาน จำนวนผู้ทำงาน อัตราการเติบโตที่คาดการณ์ และคะแนนความเสี่ยงจากการถูก AI แทนที่

ข้อมูล一目了然

หลังจากโปรเจกต์นี้ถูกเผยแพร่ ก็มีเรื่องเล็กน้อย ตอนแรกถูกลบ แล้วกลับมาออนไลน์อีกครั้ง

การ讨论บน X ร้อนแรงมาก หลายคนใช้职业ของตัวเอง查询 ดูว่าตัวเองควรเรียนรู้ทักษะใหม่หรือยัง

จริงๆ แล้วยังมีเวอร์ชันจีน: madeye.github.io/jobs

  • ที่อยู่โอเพนซอร์ส: https://github.com/karpathy/jobs
  • ประสบการณ์ออนไลน์: https://karpathy.ai/jobs/

05. ฐานความรู้ส่วนตัวที่ยิ่งใช้ยิ่งฉลาด

นี่คือ Gist ที่ Karpathy เผยแพร่ในเดือนเมษายน 2026 แต่สร้าง反响อย่างมาก ได้รับ Stars กว่า 5000 ดวง ในส่วนความคิดเห็นมีโอเพนซอร์ส implementation ต่างๆ มากมาย

ฉันเคยเขียนบทความที่เกี่ยวข้องมาก่อน ลองดูได้

Karpathy เข้าร่วม Anthropic เปิดตัว 5 โปรเจกต์สุดเจ๋ง: จากฝึก ChatGPT ด้วยเงิน 100 ดอลลาร์ สู่ AI ที่ทำวิจัยได้เอง

สิ่งที่เขาต้องการสื่อคือ: วิธีที่คนส่วนใหญ่ใช้ AI โต้ตอบกับเอกสารคือ RAG (Retrieval-Augmented Generation) คืออัปโหลดไฟล์一堆 AI ค้นหาส่วนที่เกี่ยวข้องแล้วสร้างคำตอบ

ปัญหาคือ ทุกครั้งที่ถาม AI ต้องเริ่มค้นหาและประกอบกันใหม่ตั้งแต่ต้น

ไม่มีการสะสมใดๆ เมื่อถามคำถามซับซ้อนที่ต้อง综合เอกสารห้าฉบับ AI ต้องหา片段ที่เกี่ยวข้องและประกอบกันใหม่ทุกครั้ง ผลลัพธ์ของครั้งก่อนหายไปหมด

แนวคิดของ Karpathy คือ ให้ LLM สร้างและบำรุงรักษา Wiki แบบถาวรแบบ增量

เมื่อคุณเพิ่มแหล่งข้อมูลใหม่ (บทความ 论文 บันทึกพอดแคสต์) LLM ไม่เพียงแค่索引มัน แต่หลังจากอ่านแล้ว จะรวมข้อมูลสำคัญเข้าไปใน Wiki ที่มีอยู่

อัปเดตหน้า entity แก้ไขสรุปหัวข้อ ทำเครื่องหมายจุดขัดแย้งระหว่างข้อมูลเก่าและใหม่ เสริมหรือท้าทายข้อสรุป综合ที่มีอยู่

ความรู้ถูก编译一次 จากนั้นอัปเดตอย่างต่อเนื่อง ไม่ใช่เริ่มต้นใหม่ทุกครั้งที่ถาม

ทั้งระบบแบ่งออกเป็นสามชั้น:

  • Raw sources: เอกสารต้นฉบับของคุณ LLM อ่านอย่างเดียว ไม่เขียน
  • The wiki: ไฟล์ Markdown ที่ LLM สร้างและบำรุงรักษา รวมถึงหน้า entity หน้า concept การวิเคราะห์เปรียบเทียบ ภาพรวม
  • The schema: ไฟล์配置 (เช่น CLAUDE.md) บอก LLM วิธีจัดระเบียบ Wiki วิธีจัดการกับแหล่งข้อมูลใหม่

สามการดำเนินการหลัก: Ingest (รับแหล่งข้อมูลใหม่), Query (ถามคำถาม), Lint (ตรวจสอบสุขภาพเป็นระยะ หาจุดขัดแย้ง ข้อมูลล้าสมัย หน้าที่โดดเดี่ยว)

วิธีการใช้งานของ Karpathy เองคือ ด้านซ้ายเปิด Claude Code ด้านขวาเปิด Obsidian

Claude แก้ไข Wiki เขาเรียกดูผลลัพธ์แบบเรียลไทม์ใน Obsidian พูดในแบบของเขา: Obsidian คือ IDE, LLM คือโปรแกรมเมอร์, Wiki คือ codebase

หลังจาก Gist นี้ถูกเผยแพร่ ชุมชน涌现了大量的โอเพนซอร์ส implementation: มีคนทำแอปเดสก์ท็อป มีคนทำปลั๊กอิน VS Code มีคนเพิ่ม knowledge graph มีคนทำ workflow การวิจัยที่สมบูรณ์

ส่วนความคิดเห็นเป็นเหมือนศูนย์บ่มเพาะระบบนิเวศของเครื่องมือจัดการความรู้ AI

  • ที่อยู่โอเพนซอร์ส: https://gist.github.com/karpathy/…

ลิงก์โค้ดโอเพนซอร์ส: https://gist.github.com/karpathy/442a6bf555914893e9891c11519de94f

06

ติดตามบัญชี公众号「逛逛 GitHub」

บัญชี公众号นี้เคย推出โปรเจกต์โอเพนซอร์สที่ยอดเยี่ยมมากมาย หากคุณไม่อยากเปิดดูบทความเก่าทีละบทความ คุณสามารถติดตามบัญชี WeChat Official Account 「逛逛 GitHub」 แล้วสนทนาโดยตรงใน后台เพื่อรับเนื้อหาที่แนะนำ:


⚠️ หมายเหตุ: เนื้อหาได้รับการแปลโดย AI และตรวจสอบโดยมนุษย์ หากมีข้อผิดพลาดโปรดแจ้ง

☕ สนับสนุนค่ากาแฟทีมงาน

หากคุณชอบบทความนี้ สามารถสนับสนุนเราได้ผ่าน PromptPay

PromptPay QR
SCAN TO PAY WITH ANY BANK

本文来自网络搜集,不代表คลื่นสร้างอนาคต立场,如有侵权,联系删除。转载请注明出处:https://www.itsolotime.com/th/archives/35649

Like (0)
Previous 1 day ago
Next 1 day ago

相关推荐