เปรียบเทียบ 3 ระดับการถอดเสียง
ทั้งสามเวอร์ชันไม่ได้มาจากเครื่องมือเดียวกัน โมเดลมาตรฐานและโมเดลโปรมาจากเอนจินตระกูลเดียวกัน ส่วน YouTube เป็นเอนจินคนละตัวที่อ่อนกว่ามาก ตัวเลขทั้งหมดเป็นการประเมินจากการตรวจทานเชิงระบบทีละบรรทัด โดยเทียบ subtitle ทั้งสามไฟล์เข้าหากันตาม timestamp ไม่ใช่ค่า WER ระดับ token เนื่องจากไม่มีต้นฉบับคำพูดจริง จึงใช้ฉบับที่ถูกที่สุด (โดยทั่วไปคือโมเดลโปร) เป็นฐานอ้างอิง แต่ชี้จุดผิดโดยยึดความถูกต้องตามกฎหมายและบริบทเป็นหลัก
YouTube
ไฟล์ .th
คำบรรยายอัตโนมัติแบบ YouTube — เอนจิน ASR ดิบ แบบเลื่อนสะสม (rolling) บรรทัดซ้ำ 2–3 รอบ ไม่เว้นวรรค มีแต่เครื่องหมาย >> เก็บคำพูดครบ (verbatim) แต่ศัพท์กฎหมาย ชื่อหน่วยงาน/บุคคล และตัวเลขเพี้ยนหนัก
โมเดลมาตรฐาน
ไฟล์ base
ถอดเสียงสะอาด เว้นวรรคถูกต้อง จับศัพท์กฎหมายแม่นกว่ามาก ตัดประโยคเป็นธรรมชาติ มีป้ายผู้พูดแบบรหัส (A / B / C) แต่ยังเหลือชื่อเฉพาะ เลขคดี และจุดเพี้ยนเชิงระบบบางคลิป
โมเดลโปร
ไฟล์ pro
ขัดเกลาสูงสุด แก้ชื่อบุคคล/หน่วยงานและศัพท์กฎหมายให้ถูกต้อง ระบุชื่อผู้พูดจริง จัดรูปเลขคดี/เลขมาตราเป็นมาตรฐาน และแก้จุดเพี้ยนที่มาตรฐานยังพลาด
* ในรายงานต้นฉบับ ไฟล์ทั้งสามใช้ชื่อ .th / base / pro ตามลำดับ
ความถูกต้องโดยรวมเฉลี่ยจากทั้งสามกรณีทดสอบ
คดีปกครอง — ต้นไม้ในเขตทางหลวงล้มทับรถโดยสาร
รายการ “คุยเฟื่องเรื่องคดีปกครอง” ของสำนักงานศาลปกครองนครสวรรค์ ว่าด้วยคดีต้นไม้ในเขตทางหลวงล้มทับรถยนต์โดยสาร และการเรียกค่าสินไหมทดแทน ความยาวสื่อราว 52 นาที เนื้อหาหนาแน่นด้วยศัพท์กฎหมายปกครอง ชื่อหน่วยงาน เลขคดี และจำนวนเงิน ตรวจทานทั้งสามไฟล์ทีละบรรทัด โดยใช้โมเดลโปรเป็นฉบับอ้างอิงหลักเพราะสะอาดและถูกต้องที่สุด
ข้อเท็จจริงที่สำคัญที่สุด
YouTube มีจุดที่ เปลี่ยนความหมายทางกฎหมายหรือตัวเลขผิดถึง 15 จุด และอันตรายที่สุดคือตัวเลข — 08:00 จำนวน “550,000” แทน “50,000” บาท (ผิด 11 เท่า), 20:20 ดอกเบี้ย “ร้อยละ 107.5” แทน “7.5” และ 07:50 “กรมถังหลวง” แทน “กรมทางหลวง” (ระบุหน่วยงานผู้ถูกฟ้องผิด) รวมถึง “ศาล” เพี้ยนเป็น “ทหาร / ฐาน / สาร” หลายจุด| มิติที่ประเมิน | YouTube | โมเดลมาตรฐาน | โมเดลโปร |
|---|---|---|---|
| คำภาษาไทยทั่วไป (สะกด / แยกคำ) | ~91% | ~96% | ~98% |
| ศัพท์เทคนิค / ศัพท์กฎหมาย | ~80% | ~94% | ~98% |
| ชื่อเฉพาะ / บุคคล / หน่วยงาน | ~78% | ~88% | ~97% |
| ตัวเลข / จำนวนเงิน / เลขคดี | ~85% | ~97% | ~98% |
| ป้ายผู้พูด / การจัดประโยค | ~70% | ~85% | ~97% |
| คะแนนรวมเฉลี่ย | ~84% | ~94% | ~98% |
ระดับการระบุผู้พูดต่างกันชัดเจน
YouTube เป็นคำบรรยายแบบเลื่อน บรรทัดซ้ำทุกบล็อกและมีแต่เครื่องหมาย >>, โมเดลมาตรฐานใส่ป้ายแบบรหัส (A / B / C / D) ซึ่งบางครั้งแทรกกลางประโยค ส่วนโมเดลโปรระบุเป็นชื่อจริง (วันชนะ: / โฆษก: / นักร้อง:) อนึ่ง YouTube ยังถอดเนื้อเพลงประกอบรายการที่ base/pro ตัดทิ้ง แต่เพี้ยนหนักและไม่ใช่เนื้อหากฎหมาย จึงไม่นับเป็นความผิดร้ายแรงส่วน A — YouTube เทียบกับ โมเดลมาตรฐาน
ในด้านคำไทยพื้นฐานและศัพท์กฎหมาย โมเดลมาตรฐานเหนือกว่า YouTube เกือบทุกข้อ เพราะ YouTube เป็นคำบรรยายแบบเลื่อน ทำให้คำติดกัน ตกพยัญชนะ และเดาคำผิดในศัพท์เฉพาะทางกฎหมาย รวมถึงตัวเลขและชื่อหน่วยงานสำคัญ
คำภาษาไทยทั่วไป
| เวลา | YouTube | ความหมายที่ถูกต้อง | หมายเหตุ |
|---|---|---|---|
| 00:43 | ออกบทคำสั่ง | ออกกฎคำสั่ง | บท ≠ กฎ |
| 01:10 | ยืนทางไปรษณีย์ | ยื่นทางไปรษณีย์ | ยืน (stand) ≠ ยื่น (submit) |
| 03:50 (7×) | การละเลต่อหน้าที่ | การละเลยต่อหน้าที่ | ตกพยัญชนะ (ย) |
| 10:30 | ความสูง 6 เม็ด | ความสูง 6 เมตร | เม็ด ≠ เมตร |
| 13:00 | ประเด็นที่ต้องมีนิยาย | ประเด็นที่ต้องวินิจฉัย | คำเพี้ยนทั้งคำ |
| 09:10 | ก็โรงเรียนศาลชั้นต้น | ก็ในศาลชั้นต้น | แทรกคำ “โรงเรียน” |
ศัพท์เทคนิค / ศัพท์กฎหมาย
| เวลา | YouTube | ความหมายที่ถูกต้อง | หมายเหตุ |
|---|---|---|---|
| 07:50 | กรมถังหลวง | กรมทางหลวง | หน่วยงานผู้ถูกฟ้อง |
| 07:50 (6×) | ค่าสินใหม่ / สีใหม่ | ค่าสินไหมทดแทน | หัวใจของคดี (damages) |
| 12:00 | ทหารปกครองสูงสุด | ศาลปกครองสูงสุด | ศาล → ทหาร |
| 28:20 | ไก่เกลี่ย / ไก่เกลียด | ไกล่เกลี่ยข้อพิพาท | กลไก ADR ของศาล |
| 48:40 | เพิกทอนใบอนุญาต | เพิกถอนใบอนุญาต | ผลคำพิพากษาหลัก |
| 16:50 | คปพ. | คปภ. | หน่วยงานกำกับประกันภัย |
จุดที่ YouTube กลับถอดได้ดีกว่ามาตรฐาน
เพื่อความเป็นกลาง ที่ 32:10 YouTube ถอดคำว่า “ผู้ร้องสอด” ได้ถูกต้อง ขณะที่ทั้งโมเดลมาตรฐานและโปรเพี้ยนเป็น “ผู้ร้องตลอด” เหมือนกันทั้งคู่จุดผิดที่ทำให้เข้าใจคดีผิดใน YouTube — จุดร้ายแรง
| เวลา | YouTube (ผิด) | ความจริง | ระดับ |
|---|---|---|---|
| 08:00 | จำนวน 550,000 บาท | 50,000 บาท (ผิด 11 เท่า) | วิกฤต |
| 20:20 | ร้อยละ 107.5 ต่อปี | ร้อยละ 7.5 ต่อปี | วิกฤต |
| 07:50 | กรมถังหลวง | กรมทางหลวง | วิกฤต |
| 07:50 | ค่าสินใหม่ / สีใหม่ | ค่าสินไหมทดแทน | วิกฤต |
| 12:00 | ทหารปกครองสูงสุด | ศาลปกครองสูงสุด | วิกฤต |
| 28:20 | ไก่เกลี่ย | ไกล่เกลี่ย | ปานกลาง |
| 48:40 | เพิกทอน | เพิกถอน | ปานกลาง |
ส่วน B — โมเดลมาตรฐาน เทียบกับ โมเดลโปร
ทั้งสองสะอาดและถูกต้องเชิงเนื้อหาใกล้เคียงกันมาก แต่โมเดลโปรดีกว่าชัดเจนในเรื่องชื่อเฉพาะ ป้ายผู้พูด การจัดรูปเลขคดี/เบอร์โทร และการแก้คำเพี้ยนที่มาตรฐานยังพลาด โดยมาตรฐานพบจุดสื่อความเสี่ยงเพียง 3 จุด ส่วนโปรเหลือ 1 จุด (จุดเดียวกับที่มาตรฐานก็ผิด)
คำไทย / ความหมาย / การจัดประโยค
| เวลา | โมเดลมาตรฐาน | โมเดลโปร | หมายเหตุ |
|---|---|---|---|
| 44:00 | ร้านบองสุดวินิจฉัย | ศาลปกครองสูงสุดวินิจฉัย | มาตรฐานเพี้ยนหนัก |
| 13:40 | ค่าไร่ | ค่าอะไร | มาตรฐานเพี้ยนความหมาย |
| 14:30 | หรือสลายอย่างใดๆ | หรือเสียหายอย่างใดๆ | บริบท “เสียหาย” |
| 30:30 | สำรวจตรวจตา | สำรวจตรวจตรา | คำซ้อน |
| ป้ายผู้พูด | A: / B: / C: / D: | วันชนะ: / โฆษก: / นักร้อง: | โปรระบุชื่อจริง |
ศัพท์เทคนิค / ชื่อเฉพาะ / เลขคดี
| เวลา | โมเดลมาตรฐาน | โมเดลโปร | ประเภท |
|---|---|---|---|
| 33:40 | นางสาว ส.ส.ลา / สสลา | นางสาว ส.ศาลา | ชื่อผู้ร้องสอด |
| 10:20 | ต้นกฐินเทพา | ต้นกระถินเทพา | ชื่อพันธุ์ไม้ |
| 10:30 | เส้นผ่าศูนย์กลาง | เส้นผ่านศูนย์กลาง | รูปมาตรฐาน |
| 23:40 | อ.อ่าง ผ.ผึ้ง 51/2569 | อ.ผ. 51/2569 | รหัสคดีย่อ |
| 50:40 | 056219234 | 056-219234 | จัดรูปเบอร์โทร |
จุดสื่อความเสี่ยงของมาตรฐาน และจุดที่ทั้งคู่ผิดเหมือนกัน
โมเดลมาตรฐานพบจุดที่อาจทำให้สับสน 3 จุด — 44:00 “ร้านบองสุด”, 13:40 “ค่าไร่” และชื่อ 33:40 “ส.ส.ลา” ที่อ่านไม่ออก ทั้งหมดเดาจากบริบทได้ ไม่กระทบสาระคดี ส่วนจุดเดียวที่ทั้งมาตรฐานและโปรพลาดเหมือนกันคือ 32:10 “ผู้ร้องตลอด” ที่ถูกคือ “ผู้ร้องสอด” (เป็นจุดเดียวที่ YouTube กลับถอดถูก)สรุปกรณีนี้
โมเดลโปร (~98%) ดีที่สุด สะอาด ระบุชื่อผู้พูดจริง จัดรูปเลขคดีและเบอร์โทรเป็นมาตรฐาน, โมเดลมาตรฐาน (~94%) ใช้แทนได้แต่ควรแก้ป้ายผู้พูดที่แทรกกลางประโยคและจุดเพี้ยน 3 จุด ส่วน YouTube (~84%) มีข้อผิดเชิงความหมายร้ายแรง 15 จุด โดยเฉพาะจำนวนเงิน อัตราดอกเบี้ย และ “ศาล → ทหาร/ฐาน/สาร” ไม่ควรใช้อ้างอิงคดีโดยไม่ตรวจแก้กฎหมายภาษีอากร — “ไขปัญหาภาษีเพื่อผู้ประกอบการ”
รายการ “ไขปัญหาภาษีเพื่อผู้ประกอบการ EP.82” ร่วมกับสมาคมผู้สอบบัญชีภาษีอากรแห่งประเทศไทย เนื้อหาหนาแน่นด้วยศัพท์ภาษี–บัญชี ชื่อแบบฟอร์ม และการอ้างมาตราประมวลรัษฎากร เป็นกรณีที่น่าสนใจเพราะ โมเดลมาตรฐานและโปรเกือบเท่ากัน (เหมือนกัน 99.76%)และ YouTube กลับถอดบางจุดสำคัญได้ถูกกว่า ทั้งสามไฟล์ตรวจทานทีละบรรทัด
ข้อเท็จจริงที่สำคัญที่สุด
YouTube เก็บคำพูดครบที่สุดแต่ อ่อนเรื่องศัพท์ภาษีอย่างเป็นระบบ — สะกด “สรรพากร” ผิดเป็น “สรรพกร” ราว 18 จุด, ตกชื่อแบบ “ภ.ง.ด.50” กลายเป็น “พวก50”, และที่ 57:21 “จำหน่ายหนี้สูตร” แทน “จำหน่ายหนี้สูญ” (bad debt) ทำให้ศัพท์ภาษีกลายเป็นคำไร้ความหมาย| มิติที่ประเมิน | YouTube | โมเดลมาตรฐาน | โมเดลโปร |
|---|---|---|---|
| คำภาษาไทยทั่วไป | ~91% | ~96% | ~96% |
| ศัพท์เทคนิคภาษี–บัญชี | ~82% | ~93% | ~94% |
| ชื่อเฉพาะ / ชื่อวิทยากร | ~76% | ~88% | ~88% |
| การรักษาความหมาย (ไม่พลิก) | ~95% | ~93% | ~93% |
| ความครบถ้วนของคำพูด (verbatim) | ~97% | ~90% | ~90% |
| คะแนนรวมโดยประมาณ | ~88% | ~93% | ~94% |
ความต่างส่วนหนึ่งคือ “สไตล์” ไม่ใช่ “ผิด”
YouTube เป็นแบบ verbatim เก็บคำติดปาก (เอ่อ / อ่ะ / นะครับ) และเครื่องหมายเปลี่ยนผู้พูด >> ครบที่สุด ส่วนมาตรฐานและโปรตัดให้สั้นและอ่านลื่นกว่า ตัวเลขบางจุดต่างแค่รูปแบบ (เช่น “100,000” กับ “แสน”, “8:00น.” กับ “8 โมง”) ซึ่งค่าตรงกัน ไม่นับเป็นความผิดส่วน A — YouTube เทียบกับ โมเดลมาตรฐาน
ศัพท์ภาษีหลักทั่วไป (VAT, ภาษีซื้อ–ขาย, ราคาตลาด, ค่าเสื่อม) ทั้งสามเวอร์ชันจับได้ตรงกันเป็นส่วนใหญ่ ความต่างกระจุกอยู่ที่ชื่อหน่วยงาน ชื่อแบบฟอร์ม และศัพท์เฉพาะ ซึ่ง YouTube พลาดบ่อยกว่า
คำภาษาไทยทั่วไป
| เวลา | YouTube | ความหมายที่ถูกต้อง | หมายเหตุ |
|---|---|---|---|
| 01:20 | พฤหัสสสบดี | พฤหัสบดี | ซ้ำพยางค์จากการเลื่อนคำ |
| 01:30 | พูดคุยคุยกัน | พูดคุยกัน | ซ้ำพยางค์ |
| 08:27 | สุเทพ...พิทะ | สุเทพ...พิทักษ์ | ตัดท้ายนามสกุล |
| 10:49 | ทำนุญครอบครัว | ธรรมนูญครอบครัว | คำเพี้ยน (ทั้งคู่พลาด) |
| ทั้งไฟล์ | เก็บ เอ่อ / อ่ะ / >> | ตัดทิ้งให้สั้น | verbatim vs clean |
ศัพท์เทคนิคภาษี–บัญชี
| เวลา | YouTube | ความหมายที่ถูกต้อง | หมายเหตุ |
|---|---|---|---|
| ทั้งไฟล์ (18×) | สรรพกร | สรรพากร | สะกดตก า เป็นระบบ |
| ทั้งไฟล์ | พวก50 | ภ.ง.ด.50 | ไม่จับชื่อแบบฟอร์ม |
| 57:21 | จำหน่ายหนี้สูตร | จำหน่ายหนี้สูญ | สูตร ≠ สูญ (bad debt) |
| ทั้งไฟล์ | นิพพล | นิติบุคคล | ชื่อเพี้ยน |
| 11:02 | (ตกหาย) | Holding Company | ตกศัพท์อังกฤษ |
| ทั้งไฟล์ | deซell | ดีมเซลล์ (deemed sale) | ปนสคริปต์ |
จุดที่ YouTube กลับถอดได้ถูกกว่ามาตรฐาน/โปร
ที่ 01:13 ชื่อรายการที่ถูกคือ “ไขปัญหาภาษี” (แก้ปัญหา) ซึ่ง YouTube ถอดถูก แต่ทั้งมาตรฐานและโปรกลับเพี้ยนเป็น “ขายปัญหาภาษี” (ความหมายตรงข้าม) ตั้งแต่ประโยคเปิด และที่ 48:53 YouTube ถอด “65 ทวิ (6)” ถูก ขณะที่มาตรฐาน/โปรผิดเป็น “(60)” ซึ่งเป็นอนุมาตราที่ไม่มีจริงจุดผิดเชิงความหมายของ YouTube — จุดร้ายแรง
| เวลา | YouTube (ผิด) | ความจริง | ระดับ |
|---|---|---|---|
| 57:21 | จำหน่ายหนี้สูตร | จำหน่ายหนี้สูญ (bad debt) | วิกฤต |
| ทั้งไฟล์ | พวก50 | ภ.ง.ด.50 / ภ.ง.ด. | วิกฤต |
| ทั้งไฟล์ (18×) | สรรพกร | สรรพากร | ปานกลาง |
| 21:42 | อยากตอบให้ได้ | อยากตอบไม่ได้ | ปานกลาง |
| 1:23:52 | ไม่ต้องแยกออกมา | ก็ต้องแยกออกมา | ปานกลาง |
| 11:02 | ตก Holding Company | Holding Company | ปานกลาง |
ส่วน B — โมเดลมาตรฐาน เทียบกับ โมเดลโปร
ทั้งสองเนื้อหาเหมือนกัน 99.76% ความต่างเกือบทั้งหมดเป็นเรื่องเว้นวรรคและการแบ่งช่วงประโยค ไม่ใช่คำผิด โปรจัดรูป “วงเล็บ” ในการอ้างมาตราได้อ่านง่ายกว่า แต่กลับมีจุดถดถอยเล็กน้อย 2–3 จุดที่มาตรฐานทำได้ดีกว่า
ความต่างที่พบ (สองทิศทาง)
| เวลา | โมเดลมาตรฐาน | โมเดลโปร | ผลการตัดสิน |
|---|---|---|---|
| 47:50 | 65 ทวิ วงเล็บ 1 | 65 ทวิ (1) | โปรอ่านง่ายกว่า |
| 1:19:04 | ใบหัก ณ ที่จ่าย | ใบหัก นัด ที่จ่าย | มาตรฐานถูก (โปรเพี้ยน) |
| 05:53 | เตรียมตัว | Preparing | โปรพิมพ์อังกฤษทั้งที่พูดไทย |
| 34:48 | เลิกซื้อขาย | เลิกสิ่งเป็นขาย | มาตรฐานสอดคล้องกว่า |
| 1:17:12 | ไล่ (ไม่ทัน) | ไลฟ์ (ไม่ทัน) | โปรฟังผิด (กู้ได้จากบริบท) |
จุดสื่อความผิดร้ายแรง (มาตรฐาน vs โปร) — 0 จุด
ทั้งสองเหมือนกัน 99.76% ไม่พบจุดที่พลิกความหมายจนทำให้วินิจฉัยผิด ที่ใกล้เคียงสุดคือ โปรที่ 1:19:04 เพี้ยน “ณ ที่จ่าย” เป็น “นัด ที่จ่าย” (วลีภาษีหัก ณ ที่จ่ายเสียรูป ความเสี่ยงต่ำ) และโปรพิมพ์คำอังกฤษ (“Preparing”, “it”) แทนไทยบางจุด ซึ่งความหมายไม่เปลี่ยนสรุปกรณีนี้
กรณีนี้ มาตรฐาน (~93%) และโปร (~94%) เกือบเท่ากัน โปรดีกว่าเล็กน้อยตรงการจัดรูปมาตรา แต่ทั้งคู่ควรแก้ 01:13 “ขายปัญหาภาษี” → “ไขปัญหาภาษี” และ 48:53 “(60)” → “(6)”ส่วน YouTube (~88%) เด่นที่ verbatim แต่ต้องแก้ “สรรพกร → สรรพากร” และเติม ภ.ง.ด. ก่อนใช้คดีปกครอง — เปิดกิจการตลาด ต้องมีใบอนุญาตอะไรบ้าง
รายการ “30 นาที คดีปกครอง” หัวข้อการขอใบอนุญาตประกอบกิจการตลาด ว่าด้วยนิยามตลาดตามกฎหมาย กฎกระทรวงสาธารณสุข และเลขคดีปกครอง เป็นกรณีที่ โมเดลมาตรฐานเองก็มีจุดผิดเชิงระบบ ที่มีเพียงโมเดลโปรเท่านั้นที่แก้ได้ ตรวจทานทั้งสามไฟล์ทีละบรรทัด
ข้อเท็จจริงที่สำคัญที่สุด
แม้แต่โมเดลมาตรฐานก็พลาดคำว่า “ตลาด” เป็น “ประหลาด” ถึง 3 ครั้ง (“ประกอบกิจการประหลาด”) ซึ่งเป็นแก่นของทั้งคดี ส่วน YouTube หนักที่สุด — ที่ 09:29 “สถานที่ปี่พาทย์” แทน “สถานที่พิพาท” (ปี่พาทย์ = วงดนตรีไทย), 02:00 “ท่าสมบา” แทน “เทศบาล” (หน่วยงานคู่กรณี) และชื่อบุคคลพังเกือบทั้งไฟล์ (เหลือ ~45%)| มิติที่ประเมิน (น้ำหนัก) | YouTube | โมเดลมาตรฐาน | โมเดลโปร |
|---|---|---|---|
| คำทั่วไป / การสะกด (35%) | ~86% | ~96% | ~98% |
| ศัพท์เทคนิค–กฎหมาย (30%) | ~84% | ~91% | ~96% |
| ชื่อบุคคล / ชื่อเฉพาะ (15%) | ~45% | ~70% | ~93% |
| แบ่งประโยค / ป้ายผู้พูด / อ่านง่าย (20%) | ~55% | ~92% | ~98% |
| คะแนนรวมถ่วงน้ำหนัก | ~73% | ~90% | ~97% |
ส่วน A — YouTube เทียบกับ โมเดลมาตรฐาน
YouTube เป็นแคปชันอัตโนมัติแบบเลื่อน คำติดกันเป็นพรืด ตกอักษร ชื่อคนพังเกือบทั้งหมด และไม่มีป้ายผู้พูด โมเดลมาตรฐานเรียบเรียงสะอาดและแก้ปัญหาเหล่านี้ได้เกือบหมด แม้ยังเหลือศัพท์กฎหมายและชื่อบางจุด
คำทั่วไป
| เวลา | YouTube | ความหมายที่ถูกต้อง | หมายเหตุ |
|---|---|---|---|
| 02:00 | ที่ท่าสมบาจัดให้ | ที่เทศบาลจัดให้ | “เทศบาล” พังเป็นคำมั่ว |
| 01:38 | ฟุตปาด | ฟุตบาท | สะกดผิด |
| 01:31 | ก็เาตั้งเต็นท์ลำ | ก็เขาตั้งเต็นท์ล้ำ | ตกอักษร ข / ไม้โท |
| 00:41 | แอปพลิเคชั | แอปพลิเคชัน | ตกอักษร (น) |
| 04:45 | เชื่อมั้ยคะ | เชื่อไหมคะ | รูปเขียนไม่ทางการ |
| ทั้งไฟล์ | คำติดกันเป็นพรืด | เว้นวรรค / แบ่งบรรทัด | YouTube อ่านยากกว่า |
ศัพท์เทคนิค / กฎหมาย
| เวลา | YouTube | ความหมายที่ถูกต้อง | หมายเหตุ |
|---|---|---|---|
| 09:29 | สถานที่ปี่พาทย์ | สถานที่พิพาท | ปี่พาทย์ = วงดนตรี |
| 13:51 | ชอบได้กฎหมายหรือไม่ | ชอบด้วยกฎหมายหรือไม่ | “ชอบด้วยกฎหมาย” = ถูกกฎหมาย |
| 15:30 | นายกอุทธร...ก็ดี | ยกอุทธรณ์ของผู้ฟ้องคดี | “ยกอุทธรณ์” เพี้ยน |
| 05:43 | ว่าโดยการสาธารณสุข | ว่าด้วยการสาธารณสุข | วลีอ้างชื่อกฎหมาย |
| 09:47 | พ.ศ. 252 | พ.ศ. 2522 | ตกเลขปี พ.ร.บ.ควบคุมอาคาร |
จุดที่ YouTube กลับเก็บได้ครบ/ถูกกว่ามาตรฐาน
ที่ 05:56 YouTube เก็บถ้อยคำนิยาม “หรือของเสียง่าย” ครบ และที่ 06:19 เก็บชื่อเต็ม “กฎกระทรวงว่าด้วยสุขลักษณะของตลาด พ.ศ. 2551” ขณะที่มาตรฐาน/โปรตัดทิ้งบางส่วน ส่วนที่ 02:47 YouTube ถอด “เศษอาหาร” ถูก ขณะที่มาตรฐานเพี้ยนเป็น “เศรษฐาหาร”จุดผิดที่เปลี่ยนความหมายทางกฎหมายใน YouTube — จุดร้ายแรง
| เวลา | YouTube (ผิด) | ความจริง | ระดับ |
|---|---|---|---|
| 09:29 | สถานที่ปี่พาทย์ | สถานที่พิพาท | วิกฤต |
| 02:00 | ท่าสมบา | เทศบาล (คู่กรณีหลัก) | วิกฤต |
| 13:51 | ชอบได้กฎหมาย | ชอบด้วยกฎหมาย | วิกฤต |
| 15:30 | นายกอุทธร | ยกอุทธรณ์ | วิกฤต |
| 09:47 | พ.ศ. 252 | พ.ศ. 2522 | ปานกลาง |
| 05:43 | ว่าโดยการสาธารณสุข | ว่าด้วยการสาธารณสุข | ปานกลาง |
ส่วน B — โมเดลมาตรฐาน เทียบกับ โมเดลโปร
ทั้งสองคล้ายกัน 99.3% — โปรคือมาตรฐานที่ขัดเงาแล้ว แต่จุดที่ต่างกลับสำคัญมาก เพราะมาตรฐานมีจุดผิดเชิงระบบ “ประหลาด → ตลาด” และศัพท์นิยามตลาดเพี้ยนหลายจุด ขณะที่โปรแก้ได้ครบ ระบุชื่อผู้พูดจริง และจัดเลขคดีสะอาด
คำทั่วไป / ผู้พูด
| เวลา | โมเดลมาตรฐาน | โมเดลโปร | หมายเหตุ |
|---|---|---|---|
| 18:35 | รับเป็นอนุญาต | รับใบอนุญาต | โปรถูก |
| 23:26 | ราวราวที่ตรงนี้ | เรื่องราวที่ตรงนี้ | โปรถูก |
| 15:26 | แก้ไขบนอาศัยอำนาจ | แก้ไขบทอาศัยอำนาจ | มาตรฐานพิมพ์ผิด บน/บท |
| 19:06 | ประกอบกิจการตลา | ประกอบกิจการตลาด | มาตรฐานตัดคำ |
| ป้ายผู้พูด | B: / A: / C: | นันท์ประภัสร์: / วิชา: / แม่ค้า: | โปรระบุชื่อจริง |
ศัพท์กฎหมาย / ชื่อเฉพาะ / เลขคดี
| เวลา | โมเดลมาตรฐาน | โมเดลโปร | ผลกระทบ |
|---|---|---|---|
| 06:43 (3×) | ประกอบกิจการประหลาด | ประกอบกิจการตลาด | แก่นเรื่อง (ผิดเชิงระบบ) |
| 06:14 | เป็นค้างคาว | เป็นครั้งคราว | นิยามตลาดตามกฎหมาย |
| 05:47 | ที่ชุมชน | ที่ชุมนุม | องค์ประกอบนิยามตลาด |
| 11:04 | พ.ร.บ.ปฏิบัติราชการฯ | พ.ร.บ.วิธีปฏิบัติราชการทางปกครอง | ตก “วิธี” — ชื่อกฎหมายผิด |
| 18:05 | อออ่าง 68/2568 | อ. 68/2568 | เลขคดีเพี้ยน |
| 05:16 | มิจฉเนตรหัส นัย | วิชา เนตรหัสดิน | ชื่อวิทยากรผิดทั้งชื่อ |
จุดผิดร้ายแรงในโมเดลมาตรฐานที่โมเดลโปรแก้ให้ — 6 จุด
| เวลา | มาตรฐาน (ผิด) | โปร (ถูก) | ระดับ |
|---|---|---|---|
| 06:43 (3×) | ประหลาด | ตลาด | วิกฤต |
| 06:14 | ค้างคาว | ครั้งคราว | วิกฤต |
| 05:47 | ที่ชุมชน | ที่ชุมนุม | วิกฤต |
| 11:04 | พ.ร.บ.ปฏิบัติราชการฯ | วิธีปฏิบัติราชการทางปกครอง | วิกฤต |
| 02:48 | เศรษฐาหาร | เศษอาหาร | ปานกลาง |
| 05:16 | มิจฉเนตรหัส นัย | วิชา เนตรหัสดิน | ปานกลาง |
โมเดลโปรในกรณีนี้
ไม่พบจุดที่ทำให้เข้าใจกฎหมายผิดในโมเดลโปร โปรแก้ “ประหลาด → ตลาด” ครบทั้ง 3 ครั้ง คืนศัพท์นิยามตลาด (ครั้งคราว / ที่ชุมนุม) แก้ชื่อกฎหมายและชื่อวิทยากร พร้อมระบุชื่อผู้พูดจริง อนึ่ง ที่ 16:29 ทั้งมาตรฐานและโปรอ้าง “มาตรา 56” ตรงกัน ซึ่งควรตรวจกับคำพิพากษาฉบับจริงอีกครั้งเลือกใช้โมเดลให้เหมาะกับงานกฎหมาย
≈ 81%
YouTube
เก็บคำพูดครบ (verbatim) แต่ศัพท์กฎหมาย ชื่อหน่วยงาน/บุคคล และตัวเลข/จำนวนเงินเพี้ยนหนัก ไม่มีป้ายผู้พูด — เหมาะเป็นร่างดิบเท่านั้น
≈ 92%
โมเดลมาตรฐาน
สะอาด อ่านลื่น ศัพท์กฎหมายแม่นกว่ามาก แต่ยังมีจุดเพี้ยนเชิงระบบบางคลิป (เช่น ตลาด → ประหลาด) ชื่อเฉพาะ และเลขคดี ควรตรวจทานก่อนใช้
≈ 96%
โมเดลโปร
ดีที่สุด แทบไม่มีจุดสื่อความผิด ระบุชื่อผู้พูดจริง จัดรูปเลขคดี/เลขมาตรา และแก้ชื่อเฉพาะ–ศัพท์กฎหมายที่มาตรฐานยังพลาด
ข้อเสนอแนะ: ใช้โมเดลโปรเป็นไฟล์หลักสำหรับงานเอกสารและการอ้างอิงทางกฎหมาย ใช้โมเดลมาตรฐานเป็นทางเลือกได้แต่ควรตรวจทานชื่อหน่วยงาน เลขมาตรา เลขคดี และจำนวนเงินก่อนนำไปใช้ และหลีกเลี่ยงคำบรรยายอัตโนมัติแบบ YouTube ในการอ้างอิงเนื้อหาคดีโดยไม่ตรวจแก้
ทำไมความแม่นยำจึงสำคัญเป็นพิเศษในงานกฎหมาย
ความผิดพลาดในซับไตเติลกฎหมายไม่ใช่แค่คำสะกดผิด แต่กระทบ การระบุหน่วยงาน/คู่ความ (กรมทางหลวง, เทศบาล), ศัพท์กฎหมาย (ค่าสินไหมทดแทน, เพิกถอน, ไกล่เกลี่ย, ชอบด้วยกฎหมาย, ศาลปกครอง), เลขมาตรา / เลขคดี / ปี พ.ร.บ. (65 ทวิ (6), พ.ศ. 2522, อ. 68/2568) และ จำนวนเงิน / อัตราดอกเบี้ย ที่ผู้อ่านอาจนำไปเข้าใจหรืออ้างอิงผิด บางบรรทัดที่อันตรายที่สุดในการทดสอบนี้คือ “ศาล → ทหาร”, “ค่าสินไหม → ค่าสินใหม่”, “ตลาด → ประหลาด”, “สถานที่พิพาท → ปี่พาทย์” และ “550,000 → 50,000”สร้างซับไตเติลด้านกฎหมายที่แม่นยำด้วยโมเดลโปร
ทดลองใช้ Loma Sub ฟรีเดือนละ 30 นาที แล้วเปรียบเทียบผลลัพธ์กับงานของคุณเอง
ผลทดสอบครอบคลุมด้านการแพทย์ การเงิน ข่าว และกฎหมาย