
**รายงานจากซินจื้อหยวน

【บทนำจากซินจื้อหยวน】 เมื่อเร็วๆ นี้ Cohere ได้เปิดตัวโมเดลใหญ่ MoE Command A+ ที่มีพารามิเตอร์ 218 พันล้านพารามิเตอร์อย่างเป็นทางการ ซึ่งสามารถทำงานได้บน B200 เพียงตัวเดียว รองรับ 48 ภาษา และมีความสามารถในการอ้างอิงแบบดั้งเดิม อย่างไรก็ตาม สิ่งที่โดดเด่นที่สุดในการเปิดตัวครั้งนี้ไม่ใช่ตารางพารามิเตอร์ แต่เป็นใบอนุญาตที่ใช้: Apache 2.0
บทความสำคัญเรื่อง “Attention Is All You Need” ได้ก่อให้เกิดโมเดลใหญ่ทั้งหมดในปัจจุบัน
เมื่อวันที่ 20 พฤษภาคม Aidan Gomez หนึ่งในผู้ร่วมเขียนบทความดังกล่าว ได้ประกาศบนแพลตฟอร์ม X ว่าได้เปิดตัวโมเดลที่ได้รับอนุญาตภายใต้ Apache 2.0 แบบโอเพนซอร์สเต็มรูปแบบเป็นครั้งแรก: Cohere Command A+

Gomez เคยเป็นนักวิจัยของ Google และปัจจุบันเป็นผู้ร่วมก่อตั้งและซีอีโอของ Cohere
Command A+ เป็นผลงานชิ้นสุดท้ายของซีรีส์ Command A และเป็นโมเดล MoE (Mixture of Experts) ตัวแรกของ Cohere มีพารามิเตอร์รวม 218 พันล้านพารามิเตอร์ แต่ในการอนุมานแต่ละครั้งจะเปิดใช้งานเพียง 25 พันล้านพารามิเตอร์ โดยรวมความสามารถด้านการป้อนข้อมูลภาพ การให้เหตุผล การแปล และความสามารถของ AI Agent ไว้ในครั้งเดียว
การกำหนดค่าการปรับใช้ขั้นต่ำ: NVIDIA B200 1 ตัว หรือ H100 2 ตัว ใบอนุญาต: Apache 2.0

https://cohere.com/blog/command-a-plus
ตามรายงานของ VentureBeat นี่เป็นโมเดลเรือธงโอเพนซอร์สที่สามารถใช้งานเชิงพาณิชย์ได้อย่างแท้จริงตัวแรกในประวัติศาสตร์ของ Cohere Nick Frosst ผู้ร่วมก่อตั้งกล่าวว่าเป็น “โมเดลที่ดีที่สุดที่เราเคยเปิดตัว”

218 พันล้านพารามิเตอร์ เปิดใช้งานเพียง 25 พันล้านพารามิเตอร์ในแต่ละครั้ง
218 พันล้านพารามิเตอร์ ฟังดูเหมือนหลุมดำแห่งพลังคำนวณ แต่ Command A+ ในการสร้างแต่ละครั้ง พารามิเตอร์ที่ถูกเปิดใช้งานจริงมีเพียง 25 พันล้านพารามิเตอร์เท่านั้น
นี่คือแก่นแท้ของสถาปัตยกรรม MoE
โมเดล MoE จะกำหนดเส้นทางคำถามที่ป้อนไปยัง “ผู้เชี่ยวชาญ” เครือข่ายประสาทเทียมเพียงไม่กี่ตัวที่ถนัดที่สุดในการจัดการกับคำถามนั้น ในขณะที่ส่วนที่เหลือจะอยู่ในสถานะพัก การออกแบบนี้ทำให้โมเดลยังคงรักษาคลังความรู้และความสามารถในการให้เหตุผลระดับ “ยักษ์ใหญ่” ไว้ได้ ในขณะที่พลังคำนวณและการใช้พลังงานระหว่างการทำงานกลับใกล้เคียงกับโมเดลที่มีขนาดเล็กกว่ามาก
ตามรายงานของ VentureBeat การประมาณการจากบุคคลที่สามชี้ให้เห็นว่า GPT-5.5 ของ OpenAI และ Claude Opus 4.7 ของ Anthropic มีขนาดพารามิเตอร์ในระดับล้านล้านพารามิเตอร์ ในขณะที่ Command A+ เปิดใช้งานพารามิเตอร์เพียง 25 พันล้านพารามิเตอร์ในแต่ละครั้ง
การใช้ MoE เพื่อประหยัดพลังคำนวณกลายเป็นแนวทางปฏิบัติทั่วไปของโมเดลชั้นนำส่วนใหญ่ในปัจจุบัน แต่ Cohere ได้เพิ่มการบีบอัดอีกชั้นหนึ่งเข้าไป นั่นคือ การควอนไทเซชัน (Quantization)
Command A+ มีให้เลือกสามเวอร์ชัน: BF16, FP8 และ W4A4 ที่ถูกบีบอัดสูง โดยที่ W4A4 เป็นแกนหลักทางเทคนิคของการเปิดตัวครั้งนี้
โดยปกติแล้ว เมื่อโมเดลการอนุมานถูกบีบอัด ประสิทธิภาพในปัญหาที่ซับซ้อนจะลดลงอย่างเห็นได้ชัด ซึ่งในวงการเรียกว่า “ภาษีควอนไทเซชัน” (Quantization Tax)
แนวทางของ Cohere คือการบีบอัดเฉพาะส่วนผู้เชี่ยวชาญของ MoE ให้เหลือ 4-bit ในขณะที่เส้นทางความสนใจ (Attention Pathway) ที่สำคัญจะคงความแม่นยำเต็มรูปแบบไว้ และซ้อนทับด้วยเทคนิคที่เรียกว่า Quantization-Aware Distillation
Cohere อ้างว่ารูปแบบการควอนไทเซชัน W4A4 ของตนใกล้เคียงกับการไม่สูญเสียข้อมูล ตามข้อมูลประสิทธิภาพที่ Cohere เผยแพร่ เวอร์ชัน W4A4 สามารถสร้าง 375 โทเคนต่อวินาทีภายใต้การทำงานพร้อมกันต่ำ และความหน่วงของโทเคนแรกเพียง 113 มิลลิวินาที
ด้วยแผนงานนี้เองที่ทำให้โมเดลที่มี 218 พันล้านพารามิเตอร์สามารถทำงานบน NVIDIA B200 เพียงตัวเดียวหรือ H100 สองตัว

เปรียบเทียบความเร็วและความหน่วงของ Command A+ กับ Command A Reasoning รุ่นก่อนหน้า ภายใต้การทำงานพร้อมกันและการควอนไทเซชันที่แตกต่างกัน TOPS คือจำนวนโทเคนที่สร้างต่อวินาที TTFT คือความหน่วงของโทเคนแรก ข้อมูลเผยแพร่โดย Cohere
ที่กล่าวว่า “ทำงานบนการ์ดใบเดียว” หมายถึง Blackwell B200 ระดับดาต้าเซ็นเตอร์ ไม่ใช่การ์ดจอสำหรับผู้บริโภค
ในอดีต โมเดลระดับแสนล้านพารามิเตอร์ต้องใช้คลัสเตอร์ GPU ทั้งหมดเพื่อรองรับ แต่ตอนนี้เครื่องเดียวก็สามารถจัดการได้
นี่คือเรื่องราวที่ Cohere ต้องการเล่า: พารามิเตอร์จำนวนมาก ไม่ได้หมายถึงต้นทุนที่สูงอีกต่อไป

Apache 2.0: ใบอนุญาตสู่โอเพนซอร์สอย่างแท้จริง
หากดูแค่พารามิเตอร์และความเร็ว Command A+ คือการอัปเกรดทางวิศวกรรมที่ทรงพลัง แต่สิ่งที่นักพัฒนาควรให้ความสนใจมากกว่าคือใบอนุญาต Apache 2.0 ที่ใช้
ในวงการ AI ทุกวันนี้ คำว่า “โอเพนซอร์ส” ถูกทำให้ “เสียความหมาย” ไปนานแล้ว
บริษัท AI ชั้นนำหลายแห่งแม้จะเปิดเผยน้ำหนักโมเดล แต่กลับแนบข้อจำกัดทางการค้า: องค์กรขนาดใหญ่ไม่สามารถใช้เพื่อการพาณิชย์ และไม่สามารถใช้เพื่อฝึกโมเดลคู่แข่งได้ ผู้ใช้สามารถดาวน์โหลด ศึกษา แต่หากต้องการทำกำไร ต้องกลับมาซื้อสิทธิ์การใช้งาน
ในอดีต Cohere เคยลังเลในประเด็นนี้เช่นกัน
ตามรายงานของ VentureBeat โมเดล Command R และ Command R+ ก่อนหน้านี้ใช้ใบอนุญาต CC-BY-NC 4.0 ซึ่งเป็นใบอนุญาต “Creative Commons-NonCommercial” นักวิจัยและนักพัฒนาสามารถดาวน์โหลด ใช้ ประเมินผล แต่ห้ามใช้เพื่อการพาณิชย์โดยเด็ดขาด
กล่าวคือ เปิดครึ่งหนึ่ง และปิดครึ่งหนึ่ง แต่สำหรับ Command A+ อีกครึ่งหนึ่งก็ถูกปล่อยออกมาเช่นกัน
มันใช้ Apache 2.0 ซึ่งเป็นใบอนุญาตโอเพนซอร์สที่แท้จริงที่ได้รับการรับรองจาก OSI ตั้งแต่ผู้พัฒนาอิสระไปจนถึงบริษัทใน Fortune 500 ทุกคนสามารถใช้ แก้ไข แจกจ่าย และทำให้โมเดลนี้เป็นเชิงพาณิชย์ได้ โดยไม่ต้องเสียค่าลิขสิทธิ์ และไม่มีข้อกำหนดเกี่ยวกับการแข่งขัน
นี่เป็นครั้งแรกที่ Cohere ทำเช่นนี้ โดยนำโดยผู้เขียนบทความ Transformer ซึ่งหันมาใช้โอเพนซอร์สอย่างแท้จริงอย่างเต็มรูปแบบ
ตามรายงานของ VentureBeat การตัดสินใจนี้ผลักดันโดย Nick Frosst ผู้ร่วมก่อตั้ง
Frosst เป็นหนึ่งในสามผู้ร่วมก่อตั้ง Cohere เคยเป็นนักวิจัยที่ Google Brain Toronto Lab และเป็นหนึ่งในพนักงานกลุ่มแรกๆ ของ Geoffrey Hinton บิดาแห่ง AI ที่นั่น
การที่ Cohere เปลี่ยนโมเดลเรือธงจาก CC-BY-NC 4.0 เป็น Apache 2.0 หมายความว่าองค์กรต่างๆ สามารถหลุดพ้นจากการผูกมัดกับผู้ให้บริการได้อย่างสมบูรณ์
บริษัทหนึ่งสามารถดาวน์โหลดน้ำหนักของ Command A+ ปรับแต่งด้วยข้อมูลภายในที่เป็นความลับสูง ปรับใช้บนเซิร์ฟเวอร์ส่วนตัวหรือแม้แต่เครือข่ายแบบ Air-Gapped และไม่ต้องพึ่งพาโครงสร้างพื้นฐาน การเปลี่ยนแปลงราคา หรือความเสถียรของ API ของ Cohere อีกต่อไป

Command A+: ทำให้ “การตรวจสอบย้อนกลับ” เป็นความสามารถดั้งเดิมของโมเดล
การทำงานได้และการกล้าใช้ เป็นคนละเรื่องกันโดยสิ้นเชิง
สำหรับโมเดลที่จะเข้าสู่สภาพแวดล้อมการผลิตจริง เช่น การเงิน การแพทย์ กฎหมาย อุปสรรคที่แท้จริงไม่ใช่ความสามารถของโมเดล แต่คือความน่าเชื่อถือ
Command A+ มีการออกแบบในระดับดั้งเดิมในด้านนี้: การสร้างการอ้างอิงแบบดั้งเดิม (Native Citation)
เมื่อ Command A+ ดึงข้อมูลจากเครื่องมือภายนอก มันไม่เพียงแค่สังเคราะห์คำตอบ แต่ยังสร้างสิ่งที่เรียกว่า “grounding spans (เครื่องหมาย溯源)”
โดยการฝังแท็กพิเศษในเอาต์พุต โมเดลจะเชื่อมโยงข้อเท็จจริงแต่ละข้อที่ให้ไว้โดยตรงกับเอกสารหรือบันทึกฐานข้อมูลที่อ้างอิง
ยกตัวอย่าง: คุณให้มันสร้างรายงานยอดขายประจำวัน มันจะระบุผลลัพธ์การสืบค้นฐานข้อมูลที่ให้ตัวเลขนั้นอย่างชัดเจนพร้อมกับยอดขายรวม ที่มาชัดเจน ความเสี่ยงจากภาพหลอน (Hallucination) ลดลงเหลือน้อยที่สุด
ความสามารถในการตรวจสอบย้อนกลับนี้มีความสำคัญอย่างยิ่งสำหรับอุตสาหกรรมที่อยู่ภายใต้การควบคุมอย่างเข้มงวด
ความสามารถของ Agent ก็เป็นจุดสำคัญของการเปิดตัวครั้งนี้เช่นกัน
Command A+ รองรับการเรียกใช้เครื่องมือในรูปแบบการสนทนาภายใต้ Chat Template มาตรฐาน สามารถเชื่อมต่อกับ API ภายใน เสิร์ชเอ็นจิ้น หรือฐานข้อมูล SQL ได้อย่างราบรื่น
นอกจากนี้ยังเป็นแบบมัลติโมดัลเต็มรูปแบบ สามารถประมวลผลข้อความและภาพในบริบทอินพุต 128K ได้โดยตรง เหมาะสำหรับการวิเคราะห์ใบแจ้งหนี้ที่สแกน กราฟ และคู่มือทางเทคนิค

เปรียบเทียบความสามารถมัลติโมดัลระหว่าง Command A+ กับ Command A Vision Command A+ เป็นโมเดลการให้เหตุผลแบบมัลติโมดัลตัวแรกของ Cohere ข้อมูลเผยแพร่โดย Cohere
ตามข้อมูลประสิทธิภาพที่ Cohere เผยแพร่ ในการทดสอบ ²-Bench Telecom ที่วัดการให้เหตุผลที่ซับซ้อน Command A+ เพิ่มขึ้นจาก 37% ในรุ่นก่อนหน้าเป็น 85% ในการทดสอบ Terminal-Bench Hard ที่วัดความสามารถในการเขียนโค้ดของ Agent เพิ่มขึ้นจาก 3% เป็น 25% ในการทดสอบคณิตศาสตร์ AIME 25 เพิ่มขึ้นจาก 57% เป็น 90%

เปรียบเทียบประสิทธิภาพของ Command A+ กับ Command A Reasoning รุ่นก่อนหน้าในเกณฑ์มาตรฐานโอเพนซอร์สห้ารายการ ข้อมูลเผยแพร่โดย Cohere
ข้อมูลทั้งหมดข้างต้นมาจากการเผยแพร่ของ Cohere เอง ไม่ใช่การประเมินโดยอิสระจากบุคคลที่สาม
VentureBeat เชื่อว่า Command A+ ด้วยขนาดพารามิเตอร์ที่เปิดใช้งาน 25 พันล้านพารามิเตอร์ สามารถเทียบเคียงโมเดลที่มีขนาดใหญ่กว่ามากในด้านการให้เหตุผลล้วนๆ และคณิตศาสตร์ แต่ในด้านความกว้างของการเขียนโค้ด Agent เชิงลึกและความฉลาดโดยรวม ยังคงตามหลังโมเดลโอเพนซอร์สชั้นนำของจีน เช่น DeepSeek อยู่
สิ่งที่สำคัญกว่าคะแนนทดสอบคือ Command A+ ทำให้ “การตรวจสอบย้อนกลับ” เป็นความสามารถดั้งเดิมของโมเดล

ผู้เขียน Transformer ร่วมมือกับลูกศิษย์ของ Hinton ทำให้ Cohere เปิดโอเพนซอร์สอย่างแท้จริง
สุดท้ายนี้ มาพูดถึงสองคนเบื้องหลัง Command A+ กัน

https://arxiv.org/pdf/1706.03762
ในปี 2017 ผลงานรากฐานของสถาปัตยกรรม Transformer เรื่อง “Attention Is All You Need” ถือกำเนิดขึ้นที่ Google ในบรรดาผู้เขียนแปดคนของบทความนี้ Aidan Gomez ซึ่งอายุน้อยที่สุดในขณะนั้นอายุเพียง 20 ปี เป็นนักศึกษาฝึกงานที่ Google Brain และกำลังศึกษาระดับปริญญาตรีสาขาวิทยาการคอมพิวเตอร์และคณิตศาสตร์ที่มหาวิทยาลัยโตรอนโต

Aidan Gomez
ตามรายงานของนิตยสาร Time เพื่อให้ทันกำหนดส่งบทความสำหรับการประชุม AI ที่สำคัญ เขาและเพื่อนร่วมงานถึงกับนอนในออฟฟิศ ต่อมาเขาเปิดเผยกับ Time ว่าไม่มีใครคาดคิดว่าบทความนี้จะผลักดันวงการ AI ไปสู่สถานการณ์ปัจจุบัน
Gomez เชี่ยวชาญในการเปลี่ยนสถาปัตยกรรมระดับล่างให้เป็นผลิตภัณฑ์ที่ใช้งานได้จริง ในปี 2017 เขายังได้ริเริ่มโครงการ FOR.ai ซึ่งเป็นแพลตฟอร์มความร่วมมือสำหรับนักวิจัยในการแบ่งปันความรู้ด้าน机器学习 ซึ่งต่อมาได้พัฒนาเป็น Cohere For AI
ในปี 2019 เขาลาออกจาก Google Brain และร่วมกับ Ivan Zhang และ Nick Frosst ก่อตั้ง Cohere ในโตรอนโต ผู้ก่อตั้งทั้งสามเลือกเส้นทางที่แตกต่างจาก OpenAI อย่างสิ้นเชิง: ไม่สร้างแชทบอทสำหรับมวลชน แต่มุ่งเน้นให้บริการโมเดลสำหรับองค์กร

Nick Frosst
Frosst เป็นผู้ร่วมก่อตั้ง Cohere เคยเป็นนักวิจัยที่ Google Brain Toronto Lab ซึ่งนำโดย Geoffrey Hinton บิดาแห่ง AI และเป็นหนึ่งในพนักงานกลุ่มแรกๆ ของห้องปฏิบัติการนั้น วงการมักมองว่าเขาเป็นลูกศิษย์คนสำคัญของ Hinton งานวิจัยของเขามุ่งเน้นไปที่ Capsule Network และการตีความโมเดล
คนหนึ่งคือผู้ประดิษฐ์ Transformer อีกคนคือศิษย์ของ Hinton ตั้งแต่เริ่มก่อตั้ง Cohere มีดีเอ็นเอของ “การเปลี่ยนงานวิจัย前沿ให้เป็นผลิตภัณฑ์ที่องค์กรใช้งานได้”
มาถึงช่วง Command A+ ภายใต้การผลักดันอย่างแข็งขันของ Frosst และ Gomez เป็นผู้ตัดสินใจ Cohere ปลดล็อกอย่างสมบูรณ์ โดยเปลี่ยนใบอนุญาตของโมเดลเรือธงเป็น Apache 2.0
ตามที่ Cohere เปิดเผยอย่างเป็นทางการ Command A+ เป็นโมเดลสุดท้ายของตระกูล Command A ซึ่งโดยปกติแล้วหมายความว่า ตระกูลรุ่นต่อไปกำลังจะมาในเร็วๆ นี้
เป็นเวลานานที่ความเป็นส่วนตัวของข้อมูลและการควบคุมต้นทุนได้ขัดขวางองค์กรต่างๆ ไว้ในคอขวดนี้: หากต้องการใช้ AI ระดับ前沿 ต้องพึ่งพาคลัสเตอร์พลังคำนวณขนาดใหญ่แบบรวมศูนย์
ครั้งนี้ Command A+ ได้ผูกความสามารถในการให้เหตุผลระดับ前沿 การเรียกใช้เครื่องมือ Agent ที่แข็งแกร่ง ความสามารถมัลติโมดัล เข้ากับสถาปัตยกรรมที่ออกแบบมาเพื่อประสิทธิภาพด้านฮาร์ดแวร์โดยเฉพาะ การเปลี่ยนแปลงนี้กำลังเขียนสมุดบัญชีต้นทุนการนำ AI มาใช้ขององค์กรใหม่
ประการแรก เกณฑ์การปรับใช้ลดลง ในอดีต โมเดลระดับแสนล้านพารามิเตอร์ต้องใช้คลัสเตอร์ GPU ทั้งหมด ปัจจุบัน ขั้นต่ำ只需 1 B200 หรือ 2 H100 ก็สามารถทำงานได้
ประการที่สอง ค่าใช้จ่ายในการอนุมานก็ลดลงเช่นกัน ความเร็วเอาต์พุตของเวอร์ชัน W4A4 เพิ่มขึ้นสูงสุด 63% เมื่อเทียบกับ Command A Reasoning รุ่นก่อนหน้า และความหน่วงลดลง 17% เวลาคำนวณคือเงิน ความเร็วที่เพิ่มขึ้นย่อมทำให้ต้นทุนต่อหน่วยลดลง
ประการที่สาม ต้นทุนในสถานการณ์หลายภาษาก็ลดลงเช่นกัน Tokenizer ใหม่ทำให้ภาษาที่ไม่ใช่ยุโรปใช้โทเคนน้อยลง: ภาษาอาหรับลดลง 20% ภาษาญี่ปุ่นลดลง 18% ภาษาเกาหลีลดลง 16% การอนุมานคิดค่าบริการตามโทเคน โทเคนลดลง ค่าใช้จ่ายสำหรับการปรับใช้ข้ามประเทศและหลายภาษาก็ลดลงตามไปด้วย
เมื่อเร็วๆ นี้ Cohere ยังประกาศควบรวมกิจการกับบริษัท AI สัญชาติเยอรมัน Aleph Alpha ทิศทางของทั้งสองบริษัทสอดคล้องกันอย่างมาก: ไม่เดิมพันแชทบอท แต่มุ่งเน้นการให้บริการ AI ที่สามารถปรับใช้ในห้องเซิร์ฟเวอร์ของตนเองสำหรับรัฐบาลและองค์กรขนาดใหญ่
การแข่งขันของโมเดลใหญ่โอเพนซอร์สได้เข้าสู่ครึ่งหลังแล้ว ครึ่งแรกแข่งขันกันที่ขนาดพารามิเตอร์ ครึ่งหลังแข่งขันกันที่อีกสิ่งหนึ่ง: ใครจะทำให้องค์กรสามารถย้ายโมเดลเข้าไปในห้องเซิร์ฟเวอร์ของตนเองได้อย่างแท้จริง
เอกสารอ้างอิง:
https://cohere.com/blog/command-a-plus
https://venturebeat.com/technology/cohere-cracks-lossless-quantization-and-native-citations-with-first-full-apache-2-0-licensed-open-model-command-a
⚠️ หมายเหตุ: เนื้อหาได้รับการแปลโดย AI และตรวจสอบโดยมนุษย์ หากมีข้อผิดพลาดโปรดแจ้ง
☕ สนับสนุนค่ากาแฟทีมงาน
หากคุณชอบบทความนี้ สามารถสนับสนุนเราได้ผ่าน PromptPay
本文来自网络搜集,不代表คลื่นสร้างอนาคต立场,如有侵权,联系删除。转载请注明出处:https://www.itsolotime.com/th/archives/36041
