ทำ Subtitle CapCut ด้วย Claude และ Gemini ลดเวลาได้เป็นชั่วโมง

Tim Janepat
ผู้ก่อตั้ง AiCEO Academy · ผู้เชี่ยวชาญด้าน AI

วิธีสร้างไฟล์ .srt สำหรับ CapCut ด้วย Claude และ Gemini แทน auto caption ที่ไม่แม่นยำ คลิปสั้นใช้ Gemini Gem คลิปยาวใช้สกิล srt2capcut ผลลัพธ์เป๊ะทุกคำ ลดเวลาทำ subtitle ได้เป็นชั่วโมง
การทำ subtitle ใน CapCut เป็นงานที่ content creator หลายคนรู้สึกว่าเสียเวลามากที่สุด ไม่ว่าจะเป็น auto caption ที่ออกมาเป็นก้อนยาวๆ ตัดประโยคแปลกๆ หรือการพิมพ์เองทีละคำซึ่งสำหรับคลิป 10-15 นาที อาจหมายถึงงาน 1-2 ชั่วโมงเลยทีเดียว ผมเองก็เคยผ่านจุดนั้นมาก่อน และก็ท้อใจพอสมควรกับปัญหานี้
จนกระทั่งลองใช้ Claude และ Gemini ช่วยสร้างไฟล์ .srt แทน แล้วพบว่าผลลัพธ์ดีกว่า auto caption มาก ทั้งความแม่นยำและความเร็ว โดยเฉพาะ Claude เมื่อจับคู่กับสกิล srt2capcut ที่ผมสร้างขึ้น มันจัดการคลิปยาวได้ทั้งเรื่องในรอบเดียว ตัดคำภาษาไทยถูก และไม่มีคำผิดในส่วนที่เป็นศัพท์เทคนิค
ในวิดีโอนี้ผมสอนสองแบบ คลิปสั้นใช้ Gemini ผ่าน Gem instruction ที่ผมทำไว้ให้ และคลิปยาวใช้ Claude กับสกิล srt2capcut พร้อม workflow ตั้งแต่ export audio ไปจนถึง import subtitle เข้า CapCut
สรุปสั้น ๆ
- Auto caption ใน CapCut ออกมาเป็นก้อนยาวๆ ใช้เวลานาน ไม่แม่นยำ — ทางออกคือสร้างไฟล์ .srt ด้วย AI แทน
- คลิปสั้น: ใช้ Gemini Gem รับ audio โดยตรง → ได้ .txt → แปลงเป็น .srt แล้ว import
- คลิปยาว 10+ นาที: ใช้ Claude + สกิล srt2capcut เพราะ Gemini หยุดที่ ~5 นาทีแล้วทำต่อไม่ได้
- ผลลัพธ์: subtitle เป๊ะทุกคำ ทั้งภาษาไทยและคำทับศัพท์ ตัดคำถูกด้วย pythainlp
- ไฟล์ .srt ใช้ได้ทั้งใน CapCut และ upload เป็น subtitle บน YouTube
ปัญหาของ Auto Caption และทำไมถึงต้องหาทางออกใหม่
Auto caption ที่อยู่ใน CapCut ไม่ใช่เรื่องใหม่ที่ใครไม่รู้จัก แต่ปัญหาที่เจอบ่อยคือมัน generate ออกมาเป็นก้อนยาวๆ ตัดประโยคในจุดที่ไม่เป็นธรรมชาติ และในภาษาไทยก็มักพิมพ์คำผิดหรือต่อประโยคแบบที่อ่านไม่รู้เรื่อง โดยเฉพาะคำทับศัพท์ภาษาอังกฤษ ชื่อแบรนด์ หรือศัพท์เทคนิคที่ content creator สาย AI มักพูดถึงบ่อย
นอกจากนั้น ตัว generate ยังช้ากว่าที่ควร ต้องรอนานหลังจากโหลดเสียงเสร็จ และถ้าผลลัพธ์ไม่ดีก็ต้องมานั่งแก้ทีละตัวอยู่ดี ซึ่งกินเวลาพอๆ กับพิมพ์เองตั้งแต่แรก ผมเองก็เคยรู้สึกท้อกับปัญหานี้ จนสุดท้ายตัดสินใจลองวิธีอื่น และนั่นคือที่มาของ workflow นี้ครับ
ทำไม Gemini เหมาะกับคลิปสั้น และ Claude เหมาะกับคลิปยาว
สิ่งที่ทำให้ Gemini ต่างจาก Claude ในงานนี้คือ Gemini รับไฟล์วิดีโอและเสียงโดยตรง ดูได้เหมือน YouTube เลย เหมาะกับคลิปสั้นที่ต้องการความเร็ว แค่โยนไฟล์เข้าไปแล้วสั่งให้ทำ subtitle ก็ได้ผลออกมาทันที แต่ Gemini มีข้อจำกัดสำคัญ คือเป็นแค่แชทถามตอบที่ memory จำกัด ทำได้แค่ประมาณ 5 นาทีแรกหรือประมาณ 100 บรรทัด แล้วก็หยุด ไม่สามารถต่อได้เพราะไม่ใช่ agent
Claude ทำงานต่างออกไป ไม่รับเสียงหรือวิดีโอโดยตรง ต้องถอดเสียงเป็นข้อความก่อน แต่เมื่อจับคู่กับสกิล srt2capcut มันทำงานในฐานะ agent ที่ประมวลผลทั้งคลิปได้โดยไม่หยุดกลางทาง ข้างในสกิลมี pythainlp สำหรับตัดคำภาษาไทยให้แม่น มีระบบตรวจแก้คำที่ฟังผิดอัตโนมัติ และ format ออกมาเป็น .srt ที่พร้อม import ทันที
| Gemini | Claude + srt2capcut | |
|---|---|---|
| รับไฟล์วิดีโอ/เสียงโดยตรง | ✅ | ❌ (ต้อง transcript ก่อน) |
| เหมาะกับคลิปสั้น | ✅ | ✅ |
| เหมาะกับคลิปยาว 10+ นาที | ❌ (จบแค่ ~5 นาที) | ✅ |
| ตัดคำภาษาไทยแม่นยำ | พอใช้ | ✅ (pythainlp) |
| ต้องการ coding | ❌ | ❌ (ใช้ Cowork ได้เลย) |
วิธีทำ Subtitle คลิปสั้นด้วย Gemini Gem
ขั้นตอนแรกคือ export ไฟล์ MP3 จาก CapCut จากโปรเจกต์ที่กำลังทำอยู่ ไม่ต้อง export ทั้งวิดีโอ แค่ audio พอ จากนั้นเปิด Gemini แล้วส่งไฟล์เข้าไปพร้อมคำสั่ง แต่ถ้าจะให้ทำงานสม่ำเสมอโดยไม่ต้องพิมพ์คำสั่งใหม่ทุกครั้ง ผมแนะนำให้สร้าง Gemini Gem ซึ่งก็คือ custom instruction ที่บันทึกไว้ใน Gemini ผมทำ Gem ชื่อ SD ที่มี instruction บอกว่าต้องการ subtitle แบบไหน format อย่างไร ครั้งหน้าแค่โยนไฟล์เสียงใส่ Gem แล้วกดส่ง รอผลลัพธ์เป็น .txt ออกมา
หลังจากได้ .txt แล้วให้เอาไปแปลงเป็น .srt ที่เว็บไซต์ GoTranscript หรือค้นหาใน Google ว่า "convert txt to srt" จะเจอตัวแปลงออนไลน์หลายเจ้า จากนั้นกลับมาที่ CapCut ไปที่ Text > Local Captions แล้ว import ไฟล์ .srt เข้ามา subtitle จะขึ้นมาทั้งหมดพร้อมกัน ปรับ font ขนาดและสีได้ทันที สำคัญคือให้ปิดเสียง background และ SFX ก่อน export audio เพราะเสียงรบกวนทำให้จับคำผิดมากขึ้น เอาเฉพาะเสียงพูดจริงๆ จะได้ผลดีที่สุด
วิธีทำ Subtitle คลิปยาวด้วย Claude และสกิล srt2capcut
สำหรับคลิปยาวตั้งแต่ 10 นาทีขึ้นไป ให้ export audio เหมือนกัน จากนั้นเปิด Claude แล้วไปที่ Customize > Skills อัปโหลดสกิล srt2capcut เข้ามา ตอนนี้ใช้งานได้ผ่าน Cowork โดยตรง ไม่ต้องเปิด VS Code หรือรู้เรื่อง coding เลย เลือกโฟลเดอร์ที่มีไฟล์เสียงอยู่ แล้วเรียกสกิลด้วยคำสั่ง /srt2capcut แล้วชี้ไปที่ไฟล์ หรือจะลากไฟล์เข้ามาก็ได้
Claude จะรันในเครื่องเรา ครั้งแรกอาจช้าหน่อยเพราะต้องติดตั้ง library แต่ครั้งต่อไปจะเร็วขึ้นมาก ได้เป็นไฟล์ .srt ออกมาพร้อม import ทันที ข้างในสกิลมี pythainlp สำหรับตัดคำภาษาไทยให้แม่น มีระบบตรวจแก้คำที่ฟังผิดอัตโนมัติ และ format ไว้ให้หมดแล้ว ผลลัพธ์เป๊ะทุกคำทั้งภาษาไทยและคำทับศัพท์ ไม่มีคำไหนผิด
สิ่งที่ทำให้สกิลนี้แตกต่างจากการถาม Gemini ธรรมดาคือมันทำงานเป็น agent ที่ประมวลผลทั้งคลิปได้โดยไม่หยุดกลางทาง บวกกับ pythainlp ที่ตัดคำภาษาไทยได้แม่นกว่า AI chat ทั่วไปมาก
หลังจากได้ไฟล์ .srt มาแล้ว กลับมาที่ CapCut ไปที่ Text > Local Captions แล้ว import ไฟล์เข้ามา สำคัญมากคือให้เลื่อน subtitle track ไปชิดซ้ายสุดของ timeline เพื่อให้ timing ตรงกับวิดีโอ subtitle ทั้งหมดจะขึ้นมาครบถ้วนพร้อมกัน ปรับ font สี ขนาดได้ทีเดียวทั้งหมด
นำไฟล์ SRT ไปใช้ต่อบน YouTube ได้ด้วย
ไฟล์ .srt ที่ได้จาก workflow นี้ไม่ได้ใช้ได้แค่ใน CapCut เท่านั้น เอาไปอัปโหลดเป็น subtitle บน YouTube ได้โดยตรง ไม่ต้องพิมพ์ใหม่อีกรอบ สำหรับ content creator ที่ปล่อยคลิปทั้งบน TikTok หรือ IG Reels และ YouTube ด้วย นี่คือการประหยัดเวลาสองต่อในขั้นตอนเดียว
ผมแนะนำให้ทำ subtitle เป็นขั้นตอนสุดท้ายก่อน export วิดีโอจริง เพราะถ้าแก้ตัดต่อทีหลังอาจต้องทำ subtitle ใหม่อีกรอบ และควรปิดเสียง background ทุกครั้งก่อน export audio เพราะมีผลต่อความแม่นยำของการถอดเสียงมาก ไม่ว่าจะใช้ Gemini หรือ Claude ก็ตาม
สรุป
ทำ subtitle ด้วย AI ไม่ใช่เรื่องซับซ้อน แค่รู้ว่าควรใช้เครื่องมือไหนกับงานแบบไหน Gemini เหมาะกับคลิปสั้นที่ต้องการความเร็วและความง่าย ส่วน Claude กับสกิล srt2capcut เหมาะกับคลิปยาวที่ต้องการความแม่นยำสูงและทำทั้งคลิปได้ในรอบเดียว ผลลัพธ์จากทั้งสองวิธีดีกว่า auto caption ของ CapCut มากทั้งด้านความถูกต้องและเวลาที่ใช้
ขั้นตอนต่อไป:
- Export audio จาก CapCut เป็น MP3 (ปิดเสียง background ก่อนทุกครั้ง)
- คลิปสั้น → สร้าง Gemini Gem จาก instruction → ส่งไฟล์ → แปลง .txt เป็น .srt ที่ GoTranscript
- คลิปยาว 10+ นาที → ติดตั้งสกิล srt2capcut ใน Claude → รัน
/srt2capcutบนไฟล์เสียง - Import ไฟล์ .srt เข้า CapCut ที่ Text > Local Captions เลื่อนชิดซ้ายสุด
- นำ .srt ไปใช้ต่อเป็น YouTube subtitle ได้เลยโดยไม่ต้องพิมพ์ใหม่
คำถามที่พบบ่อย
Q.ทำ subtitle ใน CapCut ด้วย AI ต้องใช้โปรแกรมอะไรบ้าง
Q.Gemini กับ Claude ต่างกันยังไงในการทำ subtitle CapCut
Q.ไฟล์ SRT ที่ได้จาก Claude ใช้กับ YouTube ได้ไหม
Q.ทำไม auto caption ของ CapCut ถึงไม่แม่นยำ
วิดีโอต้นฉบับ
วิดีโอต้นฉบับ — Tim Janepatบทความนี้สรุปและขยายความจากเนื้อหาในวิดีโอ — กดดูคลิปต้นฉบับเพื่อดูภาพและตัวอย่างเพิ่มเติม
แชร์บทความนี้:
บทความที่เกี่ยวข้อง

Claude Fable 5 ทำอะไรได้จริงบ้าง? สรุปจากการทดสอบจริง
Claude Fable 5 โมเดลใหม่จาก Anthropic ทำคะแนน SWE-bench เกิน 80% สูงกว่า GPT-5.5 และ Opus 4.8 ชัดเจน เหมาะที่สุดสำหรับงาน coding, security audit และ deep research

Local AI Model คืออะไร ติดตั้งใช้งานฟรีไม่ง้อ API ตลอดกาล
Local AI model คือโมเดล AI ที่รันบนเครื่องตัวเองได้เลย ฟรี ออฟไลน์ได้ และไม่มีทางถูกแบนหรือตัด access วิธีเริ่มต้นและเลือกโมเดลให้เหมาะกับสเปกเครื่อง

GPT-Image 2.0 ทดสอบจริง เทียบ Nano Banana ทุกด้านก่อนเลือกใช้
GPT-Image 2.0 โมเดลสร้างรูปใหม่จาก OpenAI ที่ text accuracy และ thinking mode ดีกว่าเดิมมาก ทดสอบเทียบ Nano Banana แล้วรู้ทันทีว่าควรใช้ตัวไหนกับงานแบบไหน