เปรียบเทียบ 3 ระดับการถอดเสียง
ทั้งสามเวอร์ชันไม่ได้มาจากเครื่องมือเดียวกัน โมเดลมาตรฐานและโมเดลโปรมาจากเอนจินตระกูลเดียวกัน ส่วน YouTube เป็นเอนจินคนละตัวที่อ่อนกว่ามาก ตัวเลขทั้งหมดเป็นการประเมินจากการตรวจทานเชิงระบบทีละบรรทัด ไม่ใช่ค่า WER ระดับ token
YouTube
ไฟล์ .th
คำบรรยายอัตโนมัติแบบ YouTube — เอนจิน ASR ดิบ สตรีมคำต่อเนื่อง ไม่มีเครื่องหมายวรรคตอน ไม่มีป้ายผู้พูด และมีข้อความซ้ำซ้อนจำนวนมาก
โมเดลมาตรฐาน
ไฟล์ Standard
ถอดเสียงสะอาด แบ่งหนึ่งประโยคต่อหนึ่งบรรทัด มีเครื่องหมายวรรคตอนและป้ายผู้พูดแบบทั่วไป (A / B / C)
โมเดลโปร
ไฟล์ Pro
ขัดเกลาสูงสุด แก้ศัพท์เทคนิค ชื่อยา และชื่ออุปกรณ์ให้ถูกต้อง พร้อมระบุชื่อผู้พูดจริง
* ในรายงานต้นฉบับ ไฟล์ทั้งสามใช้ชื่อ .th / base / pro ตามลำดับ
ความถูกต้องโดยรวมเฉลี่ยจากทั้งสามกรณีทดสอบ
เวชศาสตร์ฟื้นฟูหลังผ่าตัดเปลี่ยนข้อเข่า
วิดีโอให้ความรู้ผู้ป่วยผ่าตัดเปลี่ยนข้อเข่า ที่มีทั้งศัลยแพทย์ วิสัญญีแพทย์ แพทย์เวชศาสตร์ฟื้นฟู และนักกายภาพบำบัด เนื้อหาหนาแน่นด้วยชื่อยา ชื่ออุปกรณ์ และชื่อแพทย์ ซึ่งเป็นโจทย์ที่ท้าทายการถอดเสียงมากที่สุด
| มิติที่ประเมิน | YouTube | โมเดลมาตรฐาน | โมเดลโปร |
|---|---|---|---|
| การใช้คำภาษาไทยทั่วไป | ~78% | ~96% | ~99% |
| ศัพท์การแพทย์ / ศัพท์เทคนิค | ~46% | ~82% | ~97% |
| คำนามเฉพาะ (ชื่อคน, ชื่ออุปกรณ์) | ~25% | ~70% | ~95% |
| เครื่องหมายวรรคตอน / การระบุผู้พูด | ~10% | ~90% | ~98% |
| ความถูกต้องโดยรวม | ~72% | ~93% | ~98% |
ส่วน A — YouTube เทียบกับ โมเดลมาตรฐาน
ช่องว่างขนาดใหญ่ โมเดลมาตรฐานกู้คืนชื่อยา ชื่อแพทย์ ชื่ออุปกรณ์ และโครงสร้างผู้พูดได้เกือบทั้งหมด
คำภาษาไทยทั่วไป
| เวลา | YouTube | ความหมายที่ถูกต้อง | ปัญหา |
|---|---|---|---|
| 00:33 | การครูค่ะ | การขรุขระ | “ความขรุขระ” → ไร้ความหมาย |
| 00:40 | ก็เขาเสื่อม | ข้อเข่าเสื่อม | เขา (สรรพนาม) vs เข่า (อวัยวะ) |
| 00:52 | พวกเขาโก่ง | พวกเข่าโก่ง | เขา vs เข่า อีกครั้ง |
| 00:59 | ขึ้นไหวลำบาก | เคลื่อนไหวลำบาก | “เคลื่อนไหว” เพี้ยน |
| 02:30 | กำลังกายเพิ่ม | ออกกำลังกายเพิ่ม | ตกคำว่า “ออก” |
| 07:38 | ตามใครๆ เขา | ตามไกด์ไลน์ | สูญคำว่า “ไกด์ไลน์” |
| 07:52 | ชารณความรู้สึก | ระงับความรู้สึก | ศัพท์การให้ยาชา/สลบ → ไร้ความหมาย |
| 09:55 | ขยับคารุเดือน | ขยับขา ลุกเดิน | คำสั่งกายภาพเพี้ยน |
| 12:21 | ประหยัดข้อเข่า | ขยับข้อเข่า | “ประหยัดเข่า” vs “ขยับเข่า” |
ศัพท์การแพทย์ / ศัพท์เทคนิค
| เวลา | YouTube | ความหมายที่ถูกต้อง | ศัพท์ |
|---|---|---|---|
| 02:40 | พาราเซตามอ้อ | พาราเซตามอล | Paracetamol |
| 02:46 | บุฟเฟ่น | ไอบูโพรเฟน | Ibuprofen |
| 02:46 | เลยโคลฟีแนค | ไดโคลฟีแนค | Diclofenac |
| 02:48 | ฮอกเซีย | อาร์คอกเซีย | Arcoxia (etoricoxib) |
| 12:13 | Continue คลาสสิ Motion of มี | Continuous Passive Motion of Knee | ชื่อเครื่อง CPM |
| 00:05 | ผมมาทำเอง | ผมหมอทองเอก | ชื่อศัลยแพทย์หายไป |
| 07:19 | Tank…วันละกมลเปรียบ ประเสริฐคุณ | แพทย์หญิงวรกมลทิพย์ ประเสริฐกุล | ชื่อวิสัญญีแพทย์พังทั้งคำ |
| 10:03 | ธนายศหมดละแพทย์ | นายแพทย์ธนยศ มูละ | ชื่อแพทย์เวชศาสตร์ฟื้นฟู |
| 07:08 | ต้องกิ้ง | จ๊อกกิ้ง | jogging |
จุดผิดร้ายแรงที่เปลี่ยนความหมาย/เสี่ยงเข้าใจผิดทางการแพทย์ ใน YouTube — 16 จุด
ที่ผู้ป่วยอาจนำไปปฏิบัติผิดได้จริง เช่น 02:46 Ibuprofen → “บุฟเฟ่น” (ระบุชื่อยาจริงไม่ได้), 07:43 “ปวดฟันกลาง” แทน “ปวดปานกลาง” (บิดเบือนระดับความปวด), 12:13 ชื่อเครื่อง CPM พังทั้งคำ, 12:21 “ขยับเข่า” → “ประหยัดเข่า” รวมถึงชื่อยา Paracetamol/Arcoxia และชื่อแพทย์สองท่านที่เพี้ยนทั้งคำจุดที่กลับด้านน่าสนใจ
ที่ 08:01 YouTube กลับ ถูกต้อง — “เริ่มกายภาพได้ตั้งแต่ 24 ชั่วโมงแรก” ขณะที่โมเดลมาตรฐานกลับ ผิด (ดูส่วน B) จึงเป็นเครื่องยืนยันว่าโมเดลมาตรฐานไม่ได้ครอบคลุมทุกจุดที่ YouTube ทำได้ส่วน B — โมเดลมาตรฐาน เทียบกับ โมเดลโปร
ช่องว่างเล็กลงแต่สำคัญทางคลินิก โมเดลโปรแก้คำผิดทีละพยางค์และคำนามเฉพาะ รวมถึงแก้จุดที่โมเดลมาตรฐานทำผิดเอง
คำภาษาไทยทั่วไป
| เวลา | โมเดลมาตรฐาน | โมเดลโปร | ปัญหา |
|---|---|---|---|
| 00:54 | อาการปวดบวมลอย | ปวด บวม ร้อน | “ลอย” vs “ร้อน/อักเสบ” |
| 07:33 | การผ่าตัดแบบนี้มันจบ | มันเจ็บ | “จบ” vs “เจ็บ” |
| 12:51 | การยิงเดิน | การยืนเดิน | “ยิง” vs “ยืน” |
| 13:07 | ชอนขา | ช้อนขา | การสะกด |
| 13:17 | ปกครองขา | ประคองขา | “ปกครอง” vs “ประคอง” |
| 14:38 | ใช้ลายมือช่วย | ใช้แรงมือช่วย | “ลายมือ” vs “แรงมือ” |
| 14:30 | เอา ก วอล์คเกอร์ | เอาวอล์คเกอร์ | มี ก เกินมา |
ศัพท์การแพทย์ / ศัพท์เทคนิค
| เวลา | โมเดลมาตรฐาน | โมเดลโปร | ศัพท์ |
|---|---|---|---|
| 02:47 | ไดโคฟินแนค | ไดโคลฟีแนค | Diclofenac |
| 02:47 | ซิลิเบก | ซีลีเบร็กซ์ | Celebrex (celecoxib) |
| 02:47 | อะคอกเซีย | อาร์คอกเซีย | Arcoxia (etoricoxib) |
| 05:31 | บนบนซีเมนต์ | โบนซีเมนต์ | bone cement (วัสดุยึดกระดูก) |
| 12:15 | Continu Passive Motion of Knee | Continuous Passive Motion of Knee | อุปกรณ์ CPM |
| 04:14 | อยู่ในระบบ | อยู่ในระดับ | การจัดระดับ/สเตจของโรค |
| 14:34 | ก้าวขาข้าง 7 | ก้าวขาข้างเจ็บ | คำสั่งเดิน “ขาที่เจ็บ” |
| 10:05 | ธนยศ มูละ | ธนยศ มูลแพทย์ | นามสกุล (คลุมเครือ) |
จุดผิดร้ายแรงใน โมเดลมาตรฐาน ที่ โมเดลโปร แก้ให้ — 7 จุด
| เวลา | โมเดลมาตรฐาน (ผิด) | ที่ถูกต้อง (โปร) | เหตุผลที่สำคัญ |
|---|---|---|---|
| 07:57 | เริ่มกายภาพได้ตั้งแต่ “20 ปี” | ตั้งแต่ “วันแรก” (24 ชม.) | ร้ายแรงที่สุด — สื่อว่ากายภาพเริ่มได้หลัง 20 ปี |
| 07:33 | การผ่าตัดแบบนี้มัน “จบ” | มัน “เจ็บ” | กลับความหมายของประโยค |
| 04:14 | อยู่ใน “ระบบ” | อยู่ใน “ระดับ” | สูญความหมายการจัดระดับ/สเตจโรค |
| 13:17 | “ปกครอง” ขา | “ประคอง” ขา | คำสั่งกายภาพ |
| 14:34 | ก้าวขาข้าง “7” | ก้าวขาข้าง “เจ็บ” | คำสั่งเดิน |
| 00:54 | ปวดบวม “ลอย” | ปวด บวม “ร้อน” | ตกอาการ “ร้อน/อักเสบ” |
| 05:31 | “บนบน” ซีเมนต์ | “โบน” ซีเมนต์ | ศัพท์ bone cement เพี้ยน |
บรรทัดที่อันตรายที่สุดในทุกไฟล์
โมเดลมาตรฐานที่ 07:57 ถอดว่า “เริ่มกายภาพได้ตั้งแต่ 20 ปี” แทนที่จะเป็น “วันแรก” หากผู้ป่วยเชื่อตามนี้ อาจเข้าใจว่าต้องรอนานหลายปีก่อนเริ่มกายภาพบำบัด ทั้งที่จริงคือเริ่มได้ภายใน 24 ชั่วโมงแรก — โมเดลโปรแก้จุดนี้ได้ถูกต้องจุดที่โมเดลโปรยังเหลือ — ~1 จุด
มีเพียงความคลุมเครือเรื่องนามสกุลแพทย์เวชศาสตร์ฟื้นฟู (“มูละ” vs “มูลแพทย์”, 10:05) นอกนั้นไม่พบจุดที่เปลี่ยนความหมายเลยการแถลงข่าวสถานการณ์โควิด-19 (ศบค.)
การแถลงข่าวของ ศบค. วันที่ 5 พฤษภาคม 2563 (Thairath TV) ความยาวสื่อราว 60 นาที ตรวจทานทั้งสามไฟล์ ทีละบรรทัด (~1,320 บรรทัดต่อไฟล์) เนื้อหาประกอบด้วยศัพท์ระบาดวิทยา ชื่อหน่วยงาน ตัวเลขผู้ป่วย และภาษาอังกฤษปนไทย
ข้อเท็จจริงที่สำคัญที่สุด
YouTube ถอดชื่อหน่วยงานกลาง ศบค. (CCSA) ผิดทุกครั้ง (กลายเป็น สปก. / ส.ป.ก. / ศปภ ซึ่งเป็นคนละหน่วยงาน) ตลอดทั้งคลิป ~18 ครั้ง เพียงข้อนี้ก็ตัดสิทธิ์การนำไปใช้งานทางราชการหรือการแพทย์แล้ว| มิติที่ประเมิน | YouTube | โมเดลมาตรฐาน | โมเดลโปร |
|---|---|---|---|
| คำภาษาไทยทั่วไป | ~80% | ~97% | ~99% |
| ศัพท์การแพทย์ / เทคนิค | ~65% | ~95% | ~98% |
| ชื่อเฉพาะ หน่วยงาน และตัวเลข | ~55% | ~92% | ~98% |
| ความถูกต้องส่วนภาษาอังกฤษ | ~78% | ~96% | ~98% |
| การแยกผู้พูด (Diarization) | ไม่มี | ทั่วไป (C:/A:) | ระบุชื่อถูกต้อง |
| ความถูกต้องใช้งานได้โดยรวม | ~73% | ~96% | ~98% |
ส่วน A — YouTube เทียบกับ โมเดลมาตรฐาน
คำภาษาไทยทั่วไป
| เวลา | YouTube | ความหมายที่ถูกต้อง | หมายเหตุ |
|---|---|---|---|
| 00:35 | มีประวัติดีครับ | ครับ สวัสดีครับ | คำทักทายเพี้ยน |
| 00:08 | 2560 3 | 2563 | ปี พ.ศ. ผิด |
| 01:25 | ผู้ป่วยอะไรใหม่ | ผู้ป่วยรายใหม่ | “รายใหม่” → “อะไรใหม่” |
| 02:27 | ผู้นำเหล่านี้ | ผู้ป่วยรายนี้ | “ผู้ป่วย” → “ผู้นำ” |
| 11:32 | โตเที่ยวดิสก์แทนซิ่ง | Social Distancing | เสียงเพี้ยน |
| 16:36 | สายอเมริกา | สหรัฐอเมริกา | USA เพี้ยน |
| 16:56 | ปลาซิว | บราซิล | Brazil → “ปลาซิว” |
| 05:40 | เกล้าจังหวัด | 9 จังหวัด | คำบอกจำนวนเพี้ยน |
| 19:23 | ยังแฟนอยู่ | ยังแพลนอยู่ | “วางแผน” → “เป็นแฟน” |
| 02:51 | ธาตุ (เก็บตัวอย่าง) | แพทย์ (เก็บตัวอย่าง) | “แพทย์” → “ธาตุ” |
ศัพท์การแพทย์ / หน่วยงาน / ตัวเลข
| เวลา | YouTube | ความหมายที่ถูกต้อง | ระดับ |
|---|---|---|---|
| ทั้งคลิป (18×) | สปก. / ศปภ | ศบค. (CCSA) | วิกฤต |
| 00:07 | ครูที่ … 9 | โควิด-19 | วิกฤต |
| 02:51 | โคเวตต์ 19 | โควิด-19 | วิกฤต |
| 06:00 | ศูนย์กัดกัน | ศูนย์กักกัน | วิกฤต |
| 06:17 | Active Test file | Active Case Finding (ค้นหาเชิงรุก) | วิกฤต |
| 06:29 | ติดคอทันที | สถานกักกันที่รัฐจัดให้ (State Quarantine) | วิกฤต |
| 01:34 | 2,000 … 988 (แยก) | 2,988 (สะสม) | วิกฤต |
| 16:25 | 2 แสน 50,000 2,000 | 2 แสน 5 หมื่น 2 พัน | ปานกลาง |
| 02:40 | ปอดอักเสบ ✓ | ปอดอักเสบ | ถูกต้อง |
| 02:17 | เบาหวาน ✓ | เบาหวาน | ถูกต้อง |
| 15:52 | กรมควบคุมโรค ✓ | กรมควบคุมโรค | ถูกต้อง |
| 38:42 | (หายไป) | แล็บอ้างอิง / double-check | ปานกลาง |
ข้อผิดพลาดที่เปลี่ยนความหมายอย่างร้ายแรง ใน YouTube — ~17 จุด
ผู้ที่ใช้ YouTube จะเข้าใจผิดทั้ง หน่วยงานที่รับผิดชอบ (ศบค. → สปก./ศปภ.), ชื่อโรค (โควิด-19 → ครูที่ 9 / โคเวตต์ 19), ยอดผู้ป่วยสะสม (2,988 → 2,000 … 988) และ ศัพท์ระบาดวิทยา (Active Case Finding, State Quarantine, ศูนย์กักกัน → ศูนย์กัดกัน) — ไม่เหมาะสำหรับใช้งานทางการแพทย์/ราชการส่วน B — โมเดลมาตรฐาน เทียบกับ โมเดลโปร
ทั้งสองเหมือนกันระดับคำราว 95% โมเดลโปรเป็นเวอร์ชันที่ขัดเกลาแล้ว เพิ่มชื่อผู้พูดที่ถูกต้อง และที่สำคัญคือแก้จุดที่โมเดลมาตรฐานทำผิดเอง
คำภาษาไทย / ผู้พูด
| ตำแหน่ง | โมเดลมาตรฐาน | โมเดลโปร | หมายเหตุ |
|---|---|---|---|
| 00:42 | กอดหน้ากาก | ถอดหน้ากาก | “take off” — YouTube ผิดตามมาตรฐาน |
| 02:42 | นครปฐม นราธิวาส | นราธิวาส | ตัดจังหวัดที่งอกเกินออก |
| 23:51 | สว ป. ราว 10 | สปป.ลาว 10 | ชื่อประเทศ |
| ป้ายผู้พูด | C: / A: (ทั่วไป) | สุภนันท์: / ทวีศิลป์: | ระบุชื่อผู้พูดจริง |
| 09:53 | หยุด หยุดเชื้อ เพื่อชาติ | หยุดเชื้อเพื่อชาติ | ตัดคำซ้ำ |
| 02:33 | ไปรักษาได้ | ไปรักษาด้วย | แก้คำลงท้าย |
ตัวเลข / ภาษาอังกฤษ
| เวลา | โมเดลมาตรฐาน | โมเดลโปร | หมายเหตุ |
|---|---|---|---|
| 06:01 | สะสมรวมแล้ว 20 ราย | สะสมรวมแล้ว 60 ราย | สอดคล้องกับ 42+18=60 |
| 43:29 | Center for COVID Situation Admin | Center for COVID-19 Situation Admin | ชื่อเต็มหน่วยงาน |
| 53:02 | thagov.go.th | thaigov.go.th | URL จริง |
| 50:53 | from Malay | from Malé | เมืองหลวงมัลดีฟส์ |
| 47:57 | 75,95% | 75.95% | จุดทศนิยม |
| 59:01 | the word เอ่อ น้ำใจ | the word น้ำใจ | ตัดคำเสริม “เอ่อ” |
สรุปส่วน B
โมเดลมาตรฐานมีจุดผิดเชิงความหมายจริง 3 จุด (กอด/ถอด, 20 เทียบ 60, นครปฐมที่งอกมา) บวกจุดเล็กในภาษาอังกฤษ ส่วนโมเดลโปรแทบไม่มีจุดที่เปลี่ยนความหมาย ตัวเลข 2,988 ที่ทั้งสองไฟล์ตรงกันน่าจะเป็นการพูดพลาดของผู้ประกาศเอง ไม่ใช่ข้อผิดพลาดของการถอดเสียงรายการสุขภาพ — ภาวะไขมันในเลือดสูงจากพันธุกรรม
รายการให้ความรู้สุขภาพจากช่อง Rama Channel ความยาวสื่อราว 55 นาที ว่าด้วย ภาวะไขมันในเลือดสูงจากพันธุกรรม (Familial Hypercholesterolemia) เนื้อหาหนาแน่นด้วยชื่อยากลุ่มสแตติน ค่าเอนไซม์ตับ ชื่อโปรตีน และชื่อโรค ซึ่งกดดันความแม่นยำของศัพท์เฉพาะอย่างยิ่ง เราถอดความทั้งสามไฟล์ ลบบรรทัดซ้ำของคำบรรยายอัตโนมัติแบบ YouTube (รวม 2,723 บล็อก) แล้วตรวจทุกตำแหน่งของคำสำคัญด้านไขมัน/สแตติน/เอนไซม์/ชื่อโรค พร้อมสุ่มตรวจคำพูดทั่วไปตลอดไทม์ไลน์
| มิติที่ประเมิน | YouTube | โมเดลมาตรฐาน | โมเดลโปร |
|---|---|---|---|
| คำภาษาไทยทั่วไป | ~84% | ~95% | ~97% |
| ศัพท์การแพทย์ / ศัพท์เทคนิค | ~60% | ~88% | ~96% |
| ความถูกต้องโดยรวม | ~70% | ~92% | ~96% |
จุดที่ต่างจากสองกรณีแรกคือ โมเดลมาตรฐานกับโมเดลโปรใกล้เคียงกันมากในคำทั่วไป (~95% เทียบ ~97%) แต่ช่องว่างที่สำคัญทางคลินิกย้ายไปอยู่ที่ ชื่อยาและชื่อโรค — โมเดลโปรเป็นเพียงโมเดลเดียว ที่ถอดชื่อยากลุ่มสแตตินและชื่อโรคหลักได้ถูกต้องทุกคำ
ส่วน A — YouTube เทียบกับ โมเดลมาตรฐาน
ช่องว่างกว้างเหมือนสองกรณีแรก โมเดลมาตรฐานถอดคำทั่วไปได้เกือบสมบูรณ์ ส่วน YouTube ทั้งสะกดเพี้ยน ตัดเนื้อความ และทำลายศัพท์เทคนิคแทบทั้งหมด พร้อมแทรกสัญญาณรบกวนของคำบรรยายอัตโนมัติ เช่น [เพลง], [เสียงหัวเราะ] และบรรทัดซ้ำ
คำภาษาไทยทั่วไป
| เวลา | YouTube | ความหมายที่ถูกต้อง | หมายเหตุ |
|---|---|---|---|
| 00:32 | ใส่สูตร | ใส่สูท | สูท (suit) → สูตร (formula) — เปลี่ยนความหมาย |
| 00:29 | …นะคะ | …นะฮะ | ผิดคำลงท้ายตามเพศ (ผู้พูดชาย) — เกิดซ้ำทั้งคลิป |
| 01:30 | ลาม Channel | รามา Channel | ชื่อช่องรายการเพี้ยน |
| 15:16 | เมดิเลเนียน | เมดิเตอร์เรเนียน | อาหารเมดิเตอร์เรเนียนเพี้ยน |
| 00:27 | ฉุกละหก | ฉุกละหุก | สะกดผิด |
| 49:48 | ยารดไขมัน | ยาลดไขมัน | “ลด” → “รด” |
| 22:07 | ตั้งแต่เอายุ 20 | ตั้งแต่อายุ 20 | พิมพ์ผิด |
| 19:21 | (ตกประโยค) | …น่ะ | YouTube ตัดเนื้อความบางช่วงทิ้ง |
ศัพท์การแพทย์ / ศัพท์เทคนิค
| เวลา | YouTube | ความหมายที่ถูกต้อง | ระดับ |
|---|---|---|---|
| 06:34–46:39 (8×) | ไตกีซ / “ไต 173” / ไตลาย | ไตรกลีเซอไรด์ (triglyceride) | วิกฤต |
| 50:04 | ไกอิน | พาร์กินสัน (Parkinson) | วิกฤต |
| 28:52–46:43 | AT / AC / AS | AST (เอนไซม์ตับ) | วิกฤต |
| 46:32 | “5 มิลลิกรัม” | “5 เดือน” (ระยะเวลา) | วิกฤต |
| 19:21 | ไโปรตี A | Lp(a) / ไลโปโปรตีน เอ | วิกฤต |
| 00:48 | โรคเรื้อหลัง | โรคเรื้อรัง (chronic) | ปานกลาง |
| 29:33 | GT | GGT (เอนไซม์ตับ) | ปานกลาง |
| 27:06 | มิลกรัน | มิลลิกรัม | ปานกลาง |
| 49:57 | สตก / สโตก | สโตรก (stroke) | ปานกลาง |
บรรทัดที่อันตรายที่สุดของกรณีนี้ — ไตรกลีเซอไรด์ กลายเป็น “ไต”
ตลอดคลิป YouTube ถอดคำว่า ไตรกลีเซอไรด์ (triglyceride — ค่าไขมันในเลือด) ผิด ทั้ง 8 ครั้ง โดยกลายเป็น “ไตกีซ”, “ไตลาย” และที่อันตรายที่สุดคือ “ไต 173” — ผู้อ่านจะเข้าใจว่าเป็นค่าผล ไต (kidney) ทั้งที่เป็นค่าไขมัน เป็นการสับสนข้ามระบบอวัยวะที่อาจนำไปสู่ความเข้าใจผิดด้านการวินิจฉัยจุดผิดร้ายแรงที่เปลี่ยนความหมายใน YouTube — 7 จุด
นอกจากไตรกลีเซอไรด์ ยังมี พาร์กินสัน → “ไกอิน” (ชื่อโรคหาย), AST → AT / AC / AS (ระบุเอนไซม์ตับผิดบนค่าจริง), “5 เดือน” → “5 มิลลิกรัม” (สลับระยะเวลาเป็นขนาดยา), โรคเรื้อรัง → “โรคเรื้อหลัง” และชื่อยากลุ่มสแตตินที่เพี้ยนจนระบุตัวยาไม่ได้ — ไม่เหมาะกับการอ้างอิงทางคลินิกส่วน B — โมเดลมาตรฐาน เทียบกับ โมเดลโปร
ทั้งสองใกล้เคียงกันมากในคำทั่วไป แต่จุดชี้ขาดอยู่ที่ ชื่อยากลุ่มสแตตินและชื่อโรคหลัก ของรายการ — โมเดลมาตรฐานถอดเพี้ยนทั้งสามตัวยาและชื่อโรค ส่วนโมเดลโปรถอดได้ถูกต้องทุกคำ ถือเป็นโมเดลเดียวที่ปลอดภัยสำหรับการอ้างอิงทางการแพทย์ในกรณีนี้
ชื่อยา / ชื่อโรค / คำเฉพาะ
| เวลา | โมเดลมาตรฐาน | โมเดลโปร | ศัพท์ / หมายเหตุ |
|---|---|---|---|
| 27:03 | ซิมวา สเตติน | ซิมวาสแตติน | Simvastatin |
| 46:26 | วาาสเตติน | พราวาสแตติน | Pravastatin |
| 46:32 | อัธวาาสเตติน | อะทอร์วาสแตติน | Atorvastatin |
| 19:12 | Familiar Hypercholateral Neemia | Familial Hypercholesterolemia | ชื่อโรคหลักของรายการ |
| 50:02 | ความเสื่อมของ “สาว” | ความเสื่อมของ “สมอง” | brain — จุดผิดเชิงความหมายจุดเดียวของมาตรฐาน |
* คำกลุ่มเดียวกันนี้ YouTube ยิ่งเพี้ยนหนักกว่า (ซิมวาเตติน / พาสเตติน / อทวาเซติน) จนระบุตัวยาไม่ได้เลย
ชื่อยาและชื่อโรคที่โมเดลมาตรฐานพลาด แต่โมเดลโปรแก้ให้ถูก
โมเดลมาตรฐานเป็นทรานสคริปต์ทั่วไปที่ดี แต่ เชื่อถือไม่ได้กับชื่อยาเฉพาะและชื่อโรค — ถอดสแตตินทั้งสามตัว (simvastatin, pravastatin, atorvastatin) และชื่อโรค Familial Hypercholesterolemia เพี้ยน ส่วนโมเดลโปรเป็นโมเดลเดียวที่ถอด ไตรกลีเซอไรด์, ชื่อสแตติน, AST/GGT, ชื่อโรค และพาร์กินสัน ได้ถูกต้องครบสรุปกรณีที่ 3
สำหรับสื่อที่หนาแน่นด้วยชื่อยาและชื่อโรคเฉพาะ ความต่างระหว่างมาตรฐานกับโปรจะชัดขึ้น — โปรคือโมเดลเดียวที่ปลอดภัยต่อการอ้างอิงทางคลินิก ส่วนมาตรฐานยังดีสำหรับเนื้อหาทั่วไป แต่ควรตรวจทานชื่อยา/ชื่อโรคก่อนใช้ และไม่ควรใช้ YouTube ในงานที่ต้องการความถูกต้องเลือกใช้โมเดลให้เหมาะกับงานการแพทย์
≈ 72%
YouTube
หน่วยงานผิดทั้งคลิป ชื่อโรคและชื่อยาเพี้ยน อ่านไตรกลีเซอไรด์เป็น “ไต” ยอดเคสแตก — หลีกเลี่ยงในงานที่ต้องการความถูกต้อง
≈ 94%
โมเดลมาตรฐาน
แข็งแรงและใช้งานได้จริง แต่ยังพลาดชื่อยาเฉพาะและชื่อโรคบางคำ ควรตรวจทานก่อนใช้ในงานสำคัญ
≈ 97%
โมเดลโปร
ดีที่สุด เป็นโมเดลเดียวที่ถอดชื่อยา ชื่อโรค และศัพท์เทคนิคได้ถูกครบ พร้อมระบุชื่อผู้พูดถูกต้อง
ข้อเสนอแนะ: ใช้โมเดลโปรเป็นไฟล์หลักสำหรับงานการแพทย์ ใช้โมเดลมาตรฐานเป็นทางเลือกได้แต่ควรตรวจทานจุดที่ระบุก่อนเผยแพร่ และหลีกเลี่ยงคำบรรยายอัตโนมัติแบบ YouTube ในทุกบริบทที่ความถูกต้องมีความสำคัญ
ทำไมความแม่นยำจึงสำคัญเป็นพิเศษในงานการแพทย์
ความผิดพลาดในซับไตเติลการแพทย์ไม่ใช่แค่คำสะกดผิด แต่กระทบ ชื่อยาและขนาดยา, ระดับความปวด, ชื่ออุปกรณ์, ชื่อหน่วยงาน, ชื่อโรค และ ศัพท์ระบาดวิทยา ที่ผู้ชมอาจนำไปปฏิบัติผิดได้จริง สามบรรทัดที่อันตรายที่สุดในการทดสอบนี้คือ “เริ่มกายภาพได้ตั้งแต่ 20 ปี”, การถอดชื่อ “ศบค.” ผิดทั้งคลิป และการอ่าน “ไตรกลีเซอไรด์” เป็นค่า “ไต”สร้างซับไตเติลการแพทย์ที่แม่นยำด้วยโมเดลโปร
ทดลองใช้ Loma Sub ฟรีเดือนละ 30 นาที แล้วเปรียบเทียบผลลัพธ์กับงานของคุณเอง
ผลทดสอบครอบคลุมด้านการแพทย์ การเงิน ข่าว และกฎหมาย