AI Tools23 มิถุนายน 2569

ทดสอบ MiniMax M3 โมเดล AI เขียนโค้ดถูกกว่า Claude 700 เท่า

Tim Janepat

ผู้ก่อตั้ง AiCEO Academy · ผู้เชี่ยวชาญด้าน AI

ทดสอบ MiniMax M3 โมเดล AI เขียนโค้ดถูกกว่า Claude 700 เท่า

MiniMax M3 โมเดล AI open-weights จากจีนที่ถูกกว่า Claude Opus ถึง 765 เท่า ผลทดสอบ 3 งาน coding พบว่า code quality ดีกว่าและครบกว่า แลกกับเวลาที่ช้ากว่า 3–6 เท่า

เมื่อต้นเดือนมิถุนายนที่ผ่านมา มีโมเดล AI ตัวหนึ่งที่ผมเห็นชื่อผ่านตามาสักพักแล้ว — MiniMax M3 ผลิตภัณฑ์จาก MiniMax ค่าย AI สัญชาติจีนที่เลือกเปิด weights สาธารณะ แตกต่างจาก Anthropic หรือ OpenAI ที่ปิดโมเดลไม่ให้ใครนำไปปรับแต่ง Tech With Tim ได้นำโมเดลนี้ไปทดสอบเทียบกับ Claude Composer 2.5 ด้วยงาน coding 3 ประเภทใน Cursor IDE ผลที่ได้น่าสนใจพอที่ผมจะหยิบมาสรุปให้อ่าน

สิ่งที่ทำให้ MiniMax M3 โดดเด่นไม่ใช่ว่ามันเก่งกว่า Claude Opus หรือ GPT-4 เพราะมันไม่ใช่ แต่อยู่ที่ ความต่างของราคาที่เกือบจะเป็นไปไม่ได้ — งบ $20 ต่อเดือนที่ MiniMax ได้ token ประมาณ 1.7 พันล้าน token ขณะที่ Claude Opus 4.8 ราคาเดียวกันได้เพียง 2.2 ล้าน token นั่นคือ MiniMax M3 ถูกกว่าประมาณ 765 เท่าต่อ token ที่ใช้ ตัวเลขนี้เปลี่ยนสมการการเลือกโมเดลไปมาก โดยเฉพาะสำหรับงาน agentic ที่ต้องใช้ token จำนวนมากหรือ project ที่รัน agent หลายตัวพร้อมกัน ผมเองใช้ Claude API เป็นหลักในงานประจำ พอเห็นตัวเลขนี้ก็ต้องหยุดคิดว่ามีงานแบบไหนบ้างที่ไม่ต้องการ SOTA performance แต่แค่ต้องการ token มาก

บทความนี้จะสรุปผลการทดสอบทั้ง 3 งาน ได้แก่ สร้างแอปจากศูนย์ เขียน Rust code ยาก และแก้ codebase ขนาดใหญ่ เพื่อให้เห็นภาพชัดว่าราคาถูกกว่า 700 เท่านั้น คุณแลกอะไรไปบ้าง และโมเดลนี้เหมาะกับงานแบบไหน

สรุปสั้น ๆ

MiniMax M3 เป็นโมเดล open-weights จากจีน รองรับ context window สูงสุด 1 ล้าน token (รับประกันขั้นต่ำ 512K)
ราคาถูกกว่า Claude Opus 4.8 ประมาณ 765 เท่า ($20 = 1.7B tokens เทียบกับ 2.2M tokens)
ผลการทดสอบ 3 งาน: code quality ดีกว่าและครบกว่าในทุกงาน แต่ใช้เวลานานกว่า 3–6 เท่า
เหมาะกับงาน agentic ยาว, refactor codebase ใหญ่, หรืองานที่ต้องการ test coverage ครบ

MiniMax M3 คืออะไร และทำไมถึงถูกขนาดนี้

MiniMax คือ AI lab จากจีนที่ปล่อยโมเดลออกมาหลายตัวในช่วงหลัง และสิ่งที่แตกต่างจาก Anthropic หรือ OpenAI คือการเปิด weights สาธารณะ (open weights) ซึ่งหมายความว่าใครก็สามารถ download ไปรันบนเครื่องตัวเอง fine-tune หรือปรับแต่งได้ ตัวโมเดล M3 รองรับ context window สูงสุด 1 ล้าน token โดยรับประกันขั้นต่ำ 512K และมี native multimodal support ที่ถูก train มาพร้อมกันตั้งแต่ต้น ไม่ใช่ฟีเจอร์ที่ต่อเติมทีหลัง ความต่างนี้สำคัญเพราะ image และ video generation จะ integrate กับ text ได้ดีกว่าในเชิง architecture

เรื่องราคานั้นน่าสนใจมาก ค่าย MiniMax ตั้งราคาแบบ token plan คือจ่ายรายเดือนแล้วได้ token block ใหญ่ แทนที่จะคิดราคาต่อ API call แบบ pay-per-use พอเทียบกับ Anthropic แล้วความต่างชัดมาก $20 ที่ MiniMax ได้ 1.7 พันล้าน token ขณะที่ Claude Sonnet 4.6 ราคาเดียวกันได้ประมาณ 3.7 ล้าน token หรือ Opus 4.8 ได้ 2.2 ล้าน token ผมใช้ Claude API งานประจำและตัวเลขนี้ทำให้ต้องทบทวนจริงๆ ว่ามีงานบางอย่างที่ไม่จำเป็นต้องใช้ Opus แต่แค่ต้องการ token จำนวนมาก เช่น การรัน agent หลายตัว หรือ task ที่ต้อง iterate หลายรอบ ก็น่าจะใช้ตัวนี้แทนได้

โมเดลที่ถูกกว่า 700 เท่าไม่ได้หมายความว่าเก่งกว่า แต่หมายความว่าสำหรับงาน 90% ที่ไม่ต้องการ SOTA performance คุณอาจกำลังจ่ายแพงเกินความจำเป็นอยู่

ทดสอบงานแรก: สร้าง URL Shortener จากศูนย์

งานแรกคือสร้าง URL shortener web app ด้วย Node.js โดยมี API endpoint, dashboard, และ UI แบบ clean modern โดยให้ทั้ง MiniMax M3 และ Claude Composer 2.5 รันพร้อมกันใน Cursor IDE ผลคือทั้งคู่ทำงานสำเร็จ แต่วิธีการและผลลัพธ์ต่างกันพอสมควร

Claude Composer 2.5 เสร็จใน 2 นาที ได้ 7 ไฟล์ code ทำงานได้ แต่ไม่มี test ไม่มี validation ละเอียด และ code รวมอยู่ในไฟล์เดียวค่อนข้างมาก ส่วน MiniMax M3 ใช้เวลา 15 นาที ได้ 21 ไฟล์ แยก module ชัดเจน มี test coverage ครบ มี error handling และยังทดสอบผ่าน browser จริงระหว่างที่กำลังรัน นอกจากนั้น MiniMax เริ่มจากการ draft code ทั้งหมดก่อนแล้วค่อยเขียนไฟล์ ซึ่งทำให้ช้ากว่าแต่ผลลัพธ์ครบกว่าและ self-critical กว่า มีการแก้ไขตัวเองหลายรอบก่อนจะ finalize

สิ่งที่น่าสังเกตคือ MiniMax ใช้แค่ประมาณ 106,000 token จากทั้งหมด 1 ล้าน ยังเหลืออีกมากกว่า 90% สำหรับ workflow แบบ agentic ที่ต้องรัน long-form task หรือ session ยาวๆ การมี context window ขนาดนี้ช่วยได้จริงเพราะ agent ไม่ต้องตัดสินใจว่าจะ forget อะไรก่อน มันเก็บทุก context ได้ตลอด และ MiniMax ทีมเองได้ demo ว่าโมเดลนี้รัน autonomous ต่อเนื่อง 12 ชั่วโมงโดยไม่มี human intervention ซึ่งพิสูจน์ว่า context window ทำงานได้จริงในทางปฏิบัติ

ทดสอบงานที่สอง: เขียน Ray Tracer ด้วย Rust

งานที่สองตั้งใจทำให้ยากขึ้น — ให้เขียน ray tracer ใน Rust พร้อม render ฉากที่มีลูกบอล 4–5 ลูกบนพื้น checkered ออกมาเป็นไฟล์ PPM โดยไม่ใช้ dependency ภายนอก งานนี้ทดสอบว่าโมเดลรับมือกับภาษา low-level ที่ซับซ้อนกว่า JavaScript ได้แค่ไหน และยังทดสอบ visual reasoning ด้วยว่า math ของ ray tracing ถูกต้องไหม

ผลต่างชัดกว่างานแรก รูปที่ Composer 2.5 generate ออกมากลับหัว reflection ผิด checkered pattern ผิดทิศ แสดงว่า coordinate system หรือ math ในโค้ด Rust มีปัญหาบางอย่าง ส่วนรูปจาก MiniMax M3 ออกมาถูกทิศทาง มีความ dimensional ที่ดูเป็น 3D ชัดกว่า แม้ไม่ perfect แต่ใกล้เคียงกับ ray tracing ที่ถูกต้องกว่ามาก ทั้งสองโมเดล generate code ได้ปริมาณใกล้กัน แต่ MiniMax ใส่ inline comment อธิบาย logic ไว้ชัดกว่า Composer ที่แทบไม่มีเลย งานนี้ทำให้เห็นว่า MiniMax ไม่ได้เก่งแค่ web app แต่รับมือกับ domain-specific code ที่ต้องการ precision ได้ดีพอสมควร

ทดสอบงานที่สาม: เพิ่มฟีเจอร์ใน Codebase ขนาดใหญ่

งานสุดท้ายยากที่สุดเพราะต้องทำงานกับ codebase ที่มีอยู่แล้ว ไม่ใช่สร้างจากศูนย์ โปรเจกต์เป็น full-stack app ที่มีทั้ง Python backend และ TypeScript frontend ใช้จัดการ mentorship program มีหลายหมื่นบรรทัด code งานคือเพิ่มฟีเจอร์ daily streak ให้กับ student dashboard ซึ่งต้องอ่าน codebase เดิมก่อน แล้วค่อย integrate ฟีเจอร์ใหม่เข้าไปให้ถูก pattern ที่มีอยู่

Composer เสร็จเร็วกว่าและ UI มี streak component ที่ทำงานได้ แต่ทำเพียงเท่าที่ prompt ระบุ ส่วน MiniMax ใช้เวลานานกว่า จนถึงขั้นที่ยังวิเคราะห์ codebase อยู่ตอนที่ Composer เสร็จแล้ว แต่ผลลัพธ์ครบกว่า มี test ละเอียดกว่า และ UI เพิ่มฟีเจอร์ best streak ที่ไม่ได้ระบุใน prompt แต่ make sense กับฟีเจอร์หลัก ในงานประเภทนี้ถ้า deadline สั้นและต้องการ MVP เร็ว Composer ดีกว่า แต่ถ้าต้องการ code ที่ maintainable ระยะยาวและมี test คลุม MiniMax ให้ผลดีกว่า ผมเจอ trade-off แบบนี้บ่อยในงานลูกค้า ความเร็วกับ code quality มักแลกกันเสมอ ขึ้นอยู่กับ stage ของ project ว่าต้องการอะไรมากกว่ากัน

สรุป

สรุปตรงๆ คือ ได้ token มากกว่ามาก ได้ code quality ที่ดีกว่าในงาน complex และได้ autonomous agent ที่รันได้ยาวกว่าโดยไม่ติด token limit แลกกับความเร็วที่ช้าลง 3–6 เท่า MiniMax M3 ไม่ใช่โมเดลที่เก่งที่สุดในตลาด แต่เป็นโมเดลที่ให้ value ต่อเงินที่จ่ายดีมากสำหรับงาน coding ที่ต้องการ thoroughness มากกว่าความเร็ว และสำหรับการรัน agent ใน tool ที่ต้องการ token จำนวนมาก การใช้ MiniMax แทน Opus ช่วยลดค่าใช้จ่ายได้มหาศาลโดยยังได้ผลลัพธ์ที่ยอมรับได้

ขั้นตอนต่อไปถ้าอยากลอง:

เพิ่ม MiniMax M3 เข้า Cursor ผ่าน OpenAI API key override และใส่ MiniMax international base URL แทน
เริ่มที่ plan $20/เดือน — 1.7 พันล้าน token เพียงพอสำหรับงาน coding ประจำวัน
ทดสอบกับ task ที่ต้องการ reasoning ลึกก่อน เช่น refactor หรือ codebase audit
ถ้าใช้ agentic tool ที่กิน token หนัก ลองเปลี่ยน backend model มาใช้ตัวนี้แทน Opus เพื่อลดค่าใช้จ่าย

คำถามที่พบบ่อย

Q.MiniMax M3 คืออะไร

MiniMax M3 เป็นโมเดล AI open-weights จากค่าย MiniMax ประเทศจีน รองรับ context window สูงสุด 1 ล้าน token มี native multimodal support และราคาถูกกว่า Claude Opus ประมาณ 765 เท่าต่อ token ที่ใช้

Q.MiniMax M3 ถูกกว่า Claude แค่ไหน

$20 ต่อเดือนที่ MiniMax ได้ token ประมาณ 1.7 พันล้าน token ขณะที่ Claude Opus 4.8 ราคาเดียวกันได้แค่ 2.2 ล้าน token คิดเป็นถูกกว่าประมาณ 765 เท่าต่อ token

Q.จะเพิ่ม MiniMax M3 เข้า Cursor IDE ได้อย่างไร

ไปที่ Cursor Settings แล้วเลือก Models เปิดใช้ OpenAI API key override ใส่ MiniMax international base URL แทน OpenAI URL จากนั้นใส่ subscription key และเพิ่ม custom model ชื่อ minimax-M3

Q.MiniMax M3 เหมาะกับงานแบบไหน

เหมาะที่สุดสำหรับงาน autonomous agent ที่รันยาว, refactor codebase ขนาดใหญ่, งานที่ต้องการ test coverage ครบ หรืองานที่ต้องการ token จำนวนมากแต่ไม่ต้องการ SOTA performance

#MiniMax M3#AI coding#Claude#Cursor IDE#โมเดล AI#open-weights