ศูนย์บริการคำบรรยายแทนเสียง ประเทศไทย
TCC: ศูนย์บริการคำบรรยายแทนเสียง ประเทศไทย ทลายกำแพงปิดกั้นข้อมูลข่าวสาร เพื่อคนพิการทางการได้ยิน
“ธรรมชาติของเด็กหูหนวก ถ้าเขาไม่ไว้ใจ เขาจะไม่คุยกับเรา แต่ถ้าเขาไว้ใจแล้ว เขาก็จะเปิดใจคุยกับเราได้อย่างเต็มที่” ผู้ช่วยศาสตราจารย์พิเชนทร์ จันทร์สุข อาจารย์ประจำสาขาวิชาคอมพิวเตอร์คณะวิทยาศาสตร์และเทคโนโลยี มหาวิทยาลัยราชภัฏสกลนคร กล่าวถึงลูกศิษย์ที่มีความบกพร่องทางการได้ยิน ที่ทางอาจารย์รับเข้ามาอยู่ในความดูแล อบรมสั่งสอนในโครงการหลักสูตรเรียนร่วมระหว่างคนหูหนวกกับคนปกติเพื่อเสริมสร้างทักษะและความรู้ที่จะช่วยให้คนพิการสามารถใช้ชีวิตได้อย่างทัดเทียมคนทั่วไปในสังคมปกติได้
ทั้งนี้ ผศ.พิเชนทร์ กล่าวถึงที่มาของโครงการหลักสูตรที่เริ่มลงมือทำเมื่อ 3 ปีที่แล้วว่ามาจากการมองหาทางเลือกทางการศึกษาให้กับคนหูหนวกให้เพิ่มมากขึ้น โดยพบว่า นอกจากการเรียนด้านคหกรรมศาสตร์และ
ศิลปกรรมศาสตร์แล้ว วิชาคอมพิวเตอร์และเทคโนโลยีสารสนเทศก็เป็นอีกหนึ่งสาขาวิชาเฉพาะด้านที่คนหูหนวกสามารถเรียนได้
อย่างไรก็ตาม แม้ว่าเด็กเหล่านี้จะมีความรู้ในระดับหนึ่งจนสามารถเข้าศึกษาต่อในระดับสูงได้ แต่เพราะเงื่อนไขที่เกิดจากข้อจำกัดของร่างกาย ทำให้การเรียนในห้องเรียนกลายเป็นความท้าทายไม่น้อย เพราะต่อให้จะมีการใช้ล่ามภาษามือเข้ามาช่วยนักศึกษาหูหนวกเหล่านี้ แต่ก็ยังมีข้อจำกัดอยู่ที่ “ล่าม” ที่ไม่สามารถอธิบายความรู้จำเพาะอย่าง วิทยาศาสตร์หรือคณิตศาสตร์ได้ และยิ่งธรรมชาติของคนหูหนวกที่ไม่ค่อยไว้ใจใครง่าย ๆ ถึงแม้ไม่เข้าใจเนื้อหา ก็จะไม่ยอมถามครูผู้สอนเด็ดขาด
ดังนั้น เพื่อช่วยให้นักศึกษาที่ ผศ.พิเชนทร์ เรียกว่า ลูก ๆ ของตน สามารถเรียนหนังสือได้สะดวกและเข้าใจมากขึ้น อาจารย์พิเชนทร์ จึงลงมือค้นหาเครื่องมือที่จะมาเป็นตัวช่วยสำคัญในการเรียนของเด็กหูหนวกเหล่านี้
กลายเป็นจุดเริ่มต้นให้ ผศ.พิเชนทร์ได้รู้จักกับ ศูนย์บริการคำบรรยายแทนเสียง ประเทศไทย (Thailand Captioning Service Center: TCC) ที่ทางทีมวิจัยของ ดร.อนันต์ลดา โชติมงคล นักวิจัย ทีมวิจัยเทคโนโลยีที่ทุกคนเข้าถึงและสิ่งอำนวยความสะดวก (AAT) ศูนย์วิจัยเทคโนโลยีสิ่งอำนวยความสะดวกและเครื่องมือแพทย์ (A-MED) ซึ่งได้ศึกษาและพัฒนาระบบบริการคำบรรยายแทนเสียงแบบทันต่อเวลา (Real-time Captioning) มาแล้วหลายปี โดยมีเป้าหมายเพื่อช่วยให้คนพิการทางการได้ยิน หรือมีปัญหาทางการได้ยิน เช่น คนหูตึง สามารถเข้าถึงข้อมูลข่าวสารที่มาในรูปของข้อความเสียงพูดได้ทุกประเภท และช่วยสนับสนุนให้หน่วยงานและสื่อต่าง ๆ นำระบบบริการคำบรรยายแทนเสียงไปประยุกต์ใช้ให้เกิดประโยชน์สูงสุด โดยเฉพาะ สื่อโทรทัศน์ ที่มีข้อกำหนดของ คณะกรรมการกิจการกระจายเสียง กิจการโทรทัศน์ และกิจการโทรคมนาคมแห่งชาติ หรือ กสทช. กำกับบังคับให้ต้องจัดทำคำบรรยายแทนเสียงเพื่อลดข้อจำกัดการเข้าถึงข้อมูลข่าวสารของคนพิการทางการได้ยิน
“คนหูหนวกจะมีปัญหาในการเข้าถึงข้อมูลข่าวสารที่เป็นเสียงพูด เช่น ในงานประชุมสัมมนา ประกาศถ่ายทอดสดจากหน่วยงานรัฐ การถ่ายทอดสดงานพระราชพิธีต่าง ๆ หรือในการเรียนการสอน นอกจากจะพึ่งพาล่ามแล้ว การอ่านก็เป็นอีกทางหนึ่งที่จะช่วยให้เข้าถึงข้อมูลข่าวสาร ดังนั้น เทคโนโลยีที่จัดการข้อมูลเสียงให้ขึ้นเป็นคำบรรยาย หรือคำอ่าน จึงเป็นตัวช่วยสำคัญ”
ดร.อนันต์ลดา อธิบายต่อว่า เงื่อนไขสำคัญของการพัฒนาระบบ REAL-TIME CAPTIONING นี้แบ่งได้เป็น 2 ข้อหลัก ๆ ก็คือ ความรวดเร็วกับความความถูกต้องแม่นยำ ซึ่งความรวดเร็วนี้ หมายถึง ความเร็วของระบบในการถอดเสียงให้เป็นข้อความได้อย่างรวดเร็ว โดยต้องไม่ล่าช้าไปกว่าเสียงพูดที่พูดออกมาเกิน 5 วินาที และมีความถูกต้องของข้อความสูงตามข้อกำหนดของกสทช.
Real-time Captioning คืออะไร ทำงานอย่างไร ทั้งนี้ หากจะให้นิยามสั้น ๆ Real-time Captioning ก็คือระบบบริการคำบรรยายแทนเสียงแบบทันต่อเวลา เป็นนวัตกรรมที่พัฒนาขึ้น เพื่อช่วยให้คนที่มีปัญหาทางการได้ยิน ซึ่งรวมไปถึงผู้สูงอายุ เข้าถึงข้อมูลที่เป็นเสียงพูดได้ด้วยการอ่านข้อความที่ได้จากการถอดความแทนการฟังเสียง
การทำงานของระบบสามารถแบ่งออกได้เป็น 3 ส่วน ส่วนที่หนึ่งคือ ส่วนรับสัญญาณเสียงจากผู้พูด ส่วนที่สอง คือ ระบบถอดความเสียง และส่วนที่สามก็คือ ระบบแสดงผลบนสื่อต่าง ๆ ไม่ว่าจะเป็นจอมอนิเตอร์ หรือเชื่อมต่อกับระบบการออกอากาศทางโทรทัศน์ โดยส่วนที่ทีมวิจัยนำเทคโนโลยี และปัญญาประดิษฐ์ (AI) เข้าไปพัฒนาก็คือส่วนที่สองและส่วนที่สาม
โดยเฉพาะในส่วนที่สอง ที่ตั้งเป้าพัฒนาเทคโนโลยีถอดความเสียงไว้ 3 เฟส เฟสแรก คือ ระบบแบ่งพิมพ์ เฟสที่สองคือ ระบบพูดทวนที่กำลังพัฒนาอยู่ และเฟสที่สามซึ่งเป็นเฟสสุดท้าย คือ ระบบรู้จำเสียงพูด
ขณะนี้ ทางทีมวิจัยประสบผลสำเร็จในเฟสแรกและนำมาใช้งานเรียบร้อยแล้ว และอยู่ในระหว่างการพัฒนาเฟสที่สอง และสามตามลำดับ โดยแนวทางสำคัญของการวิจัยอยู่ที่สามารถสร้างคำบรรยายแทนเสียงที่มีความแม่นยำถูกต้องและทันต่อเวลาจริง
พูดให้เข้าใจง่ายขึ้น ก็คือ ทันทีที่ผู้พูดพูดออกมา คำบรรยายแทนเสียงก็จะปรากฏข้อความให้เห็นได้แทบจะในทันที หรือภายใน 5 วินาทีหลังจากที่ผู้พูดเริ่มพูด
“สำหรับระบบที่ใช้งานในปัจจุบัน มีการใช้งานมานาน 4-5 ปีแล้ว โดยเป็นการพัฒนาที่มุ่งเน้นความถูกต้องเป็นหลัก เพราะมีข้อกำหนดของกสทช.ว่าข้อความจะต้องมีความถูกต้องมากกว่า 90% ขึ้นไป อ่านแล้วเข้าใจ ไม่ผิดความหมาย ตัวระบบถอดความเสียงเฟสแรกจึงเป็นระบบแบ่งพิมพ์ ที่ให้เจ้าหน้าที่ราว 3-4 คน ช่วยกันพิมพ์ข้อความช่วงสั้น ๆ เนื่องจากมีความถูกต้องสูง โดยระบบที่พัฒนาขึ้นจะช่วยให้คนเหล่านี้พิมพ์ได้เร็ว ถูกต้องและทันต่อเวลา”
ในส่วนของระบบการแสดงผล จะมีการพัฒนาตัวช่วยในเรื่องของการจัดบรรทัด การแสดงผลข้อความให้อ่านได้ง่าย ข้อความปรากฏให้เห็นได้อย่างพอเหมาะ ไม่เร็วเกินไปจนอ่านไม่ทัน และช้าเกินไปจนขาดตอน ยกตัวอย่างเช่น ในโทรทัศน์ ก็จะมีข้อกำหนดของกสทช.ว่า บรรทัดหนึ่งไม่เกิน 35 ตัวอักษร และมีจำนวน 2 บรรทัด ซึ่งทำให้ทีมนักวิจัยต้องปรับปรุงระบบในส่วนแสดงผลให้ได้ตามเงื่อนไขดังกล่าว โดยต้องมีการตัดคำ ตัดบรรทัดที่ไม่ไปตัดกลางคำ เพื่อป้องกันการอ่านแล้วไม่เข้าใจความหมาย
“อันนี้ (ระบบแสดงผล) ก็จะเป็นระบบอัตโนมัติ ที่เราใช้ AI เข้ามาช่วยเสริมในการจัดรูปแบบข้อความในการแสดงผล ทำให้ระบบ REAL-TIME CAPTIONING เป็นระบบที่เรียลไทม์สมชื่อ”
ผสานจุดเด่นของคนและเทคโนโลยีเข้าไว้ด้วยกัน
แม้จะได้ชื่อว่าเป็นการพัฒนาเพื่อนำเทคโนโลยีนวัตกรรมเข้ามาใช้ให้เกิดประโยชน์ แต่จุดเด่นของระบบ Real-time Captioning กลับเป็นระบบที่ดึงเอาข้อดีของคนและเทคโนโลยีให้ทำงานร่วมกัน ยกตัวอย่างเช่น ในการแบ่งพิมพ์นี้ ใช้คนทำงานเป็นหลักเพื่อความถูกต้องก็จริง แต่ก็จะมีเทคโนโลยีเข้ามาเสริม อย่างเช่น โปรแกรมแนะนำคำที่ถูกต้อง คำที่สะกดยาก ช่วยให้เจ้าหน้าที่ลดความผิดพลาด และลดเวลาในการพิมพ์
ทั้งนี้ ที่ผ่านมา มีการนำระบบ Real-time Captioning ไปใช้ในสถานการณ์จริงบ้างแล้ว โดยดร.อนันต์ลดา กล่าวว่า ที่เด่นที่สุดและน่าจะเป็นที่คุ้นเคยผ่านหูผ่านตาของคนในสังคมมากที่สุดก็คือ การให้บริการคำบรรยายแทนเสียง ในงานพระราชพิธีบรมราชาภิเษก รัชกาลที่ 10 งานแถลงข่าวของศูนย์บริหารสถานการณ์โควิด-19 (ศบค.) งานประชุมสัมมนาทางวิชาการ Digital Thailand Big Bang 2019 และการร่วมเป็นผู้ช่วยสอนในห้องเรียนให้กับสาขาวิชาคอมพิวเตอร์ มหาวิทยาลัยราชภัฏสกลนคร
เสริมสร้างความเข้าใจลดความเหลื่อมล้ำ
ก่อนหน้าที่จะนำระบบ Real-time Captioning เข้ามาใช้ ผศ.พิเชนทร์ ยอมรับว่า ระหว่างผู้สอนกับนักศึกษาหูหนวกเหมือนพูดกันคนละภาษา เพราะนักศึกษาไม่ได้ยินในสิ่งที่อาจารย์พูด ขณะที่อาจารย์เองก็ไม่เข้าใจภาษามือ ซึ่งต่อให้มีล่าม แต่การบรรยายทางวิชาการจำเป็นต้องเป็นผู้ที่มีความเข้าใจอย่างลึกซึ้งในวิชาการนั้น ๆ อย่างดี ดังนั้น Real-time Captioning จึงตัดปัญหาดังกล่าว ทำให้คนหูหนวกที่ได้มีโอกาสเรียนร่วมกับคนปกติรู้สึกดีว่าตนเองสามารถพึ่งพาตนเองในการเรียนได้เหมือนคนทั่วไป
“การที่เด็กรู้หรือเห็น แต่ไม่สามารถสื่อสารได้ บางอย่างก็ทำให้เด็กน้อยใจ อธิบายแล้วไม่เข้าใจ ทำให้เข้าใจผิด แต่เมื่อระบบนี้ (Real-time Captioning) เข้ามา เขา (เด็กหูหนวก) ก็มองภาพออก เข้าใจว่าคืออะไรบ้าง ซึ่งความเข้าใจในส่วนนี้ ส่งผลให้เด็กมีพฤติกรรมเปลี่ยนไป … อันนี้เป็นประสบการณ์โดยตรงจากนักศึกษาของเอกไอทีของเรา ที่ตอนปี 1 ปี 2 เด็กจะมีความก้าวร้าวค่อนข้างสูง เรียกร้องความสนใจค่อนข้างสูง ทำอะไรเยอะแยะที่เราคิดไม่ถึงมากมาย แต่เมื่อนำระบบนี้เข้ามาใช้สักปีสองปี พฤติกรรมเหล่านั้นหายไป มันเหมือนลดความเหลื่อมล้ำว่า เขาก็เหมือนคนๆ หนึ่งที่อยู่ในระบบสังคม ในฐานะคนคนหนึ่งของสังคมที่มีขีดความรู้ความสามารถ”
นอกจากการใช้ประโยชน์ในสถาบันการศึกษาแล้ว ระบบบริการคำบรรยายแทนเสียง (Real-time Captioning) ยังเป็นตัวช่วยสำคัญในการเข้าถึงข้อมูลข่าวสารที่เป็นรายการสดตามสถานีโทรทัศน์ ที่จะช่วยให้คนพิการทางการได้ยินได้รับรู้ข้อมูลข่าวสารที่ทันต่อเหตุการณ์ โดยเฉพาะรายการข่าว และการถ่ายทอดสดต่าง ๆ
โยธิน สิทธิบดีกุล ผู้อำนวยการสำนักโทรทัศน์และวิทยุสถานีโทรทัศน์ไทยพีบีเอส (Thai PBS) กล่าวว่า ในฐานะโทรทัศน์สาธารณะ เป้าหมายหลัก ก็คือ การเผยแพร่ข้อมูลข่าวสารให้เข้าถึงผู้ชมทุกกลุ่มได้อย่างทั่วถึงและเท่าเทียม ซึ่งทุกคนในที่นี่หมายรวมถึงคนพิการทางการได้ยิน โดยปัญหาในการจัดทำคำบรรยายแทนเสียงของทางสถานีจะอยู่ในส่วนของรายการสดมากกว่า เพราะรายการอื่น ๆ สามารถจัดทำคำบรรยายเตรียมไว้ล่วงหน้าได้
“ปัญหาหลัก ๆ อยู่ที่รายการสดส่วนใหญ่ที่เป็นพวกรายการข่าว หรือการถ่ายทอดสดเหตุการณ์สำคัญ ๆ ของประเทศ โดยหลังจากที่ทำโครงการได้สักระยะหนึ่ง จนเกิดความมั่นใจว่าเป็นไปได้ สามารถนำระบบมาใช้งานได้จริงบนหน้าจอโทรทัศน์ทางสถานีก็คุยกับทางทีวีพูล ว่าในทุกครั้งที่มีการถ่ายทอดสด ทางไทยพีบีเอสก็จะทำ Live Caption ออกอากาศด้วย ถือเป็นครั้งแรกที่มีการนำ Real-time Captioning มาใช้กับสถานีโทรทัศน์ โดยงานแรก คือ งานถ่ายทอดสดของโทรทัศน์รวมการเฉพาะกิจแห่งประเทศไทย ในงานพระราชพิธีบรมราชาภิเษกรัชกาลที่ 10 ซึ่งผลจากความเรียลไทม์ของ Caption ที่ได้ทำให้ทางสถานีไทยพีบีเอสเห็นว่าทำได้”
เรียกได้ว่าการมี Real-time Captioning เป็นการช่วยแก้ปัญหา pain point ของการทำ Live Caption ที่ไม่เคยทำมาก่อนและคิดว่าทำไม่ได้ให้เป็นจริงขึ้นมาได้ ตอบโจทย์แนวคิด Media for All ของทางสถานี ที่ทำให้ผู้พิการทางการได้ยินเข้าถึงข้อมูลข่าวสารที่เป็นรายการสดได้เหมือนคนปกติทั่วไป
อย่างไรก็ตาม ดร.อนันต์ลดา เสริมว่า การนำ Real-time Captioning มาใช้ ยังมีผลพลอยได้ที่เป็นประโยชน์ต่อคนปกติทั่วไปที่สามารถรับรู้ข้อมูลข่าวสารได้ ในกรณีที่อยู่ในสถานการณ์ที่ไม่สะดวกต่อการได้ยินเสียง หรือช่วยตอกย้ำให้การรับรู้ข้อมูลข่าวสารถูกต้อง ชัดเจน แม่นยำขึ้น
เพิ่มทางเลือกของผู้พิการทางการได้ยิน
ในฐานะนายกสมาคมคนหูหนวกแห่งประเทศไทย วิทยุต บุนนาค หรืออาจารย์เจ กล่าวว่า การมี Real-time Captioning คือ การเพิ่มทางเลือกให้แก่คนพิการทางการได้ยิน ที่มีข้อจำกัดในการเข้าถึงข้อมูลข่าวสารอย่างมากจากสื่อต่าง ๆ เพราะความที่ไม่ได้ยินเสียงใด ๆ เลย ทำให้การมี คำบรรยายแทนเสียง หรือ Caption คือ ตัวเสริมสำคัญ
“อยากให้เปิดกว้าง ไม่ใช่เรื่องข่าวอย่างเดียว อยากให้เปิดกว้างไปหลาย ๆ ด้าน เพราะคนหูหนวกก็มีสิทธิ์ได้รับข้อมูลข่าวสารเหมือนคนปกติทั่วไปที่สามารถเลือกได้ว่าจะดูอะไร มีหลากหลายรูปแบบ สำหรับคนหูหนวกตอนนี้ กว่าจะได้ดูมีตัวเลือกน้อยมาก รู้สึกถึงความไม่เท่าเทียมจริง ๆ อยากให้ Caption เป็นโอกาสสำหรับการมีส่วนร่วมเข้าถึงสังคมในทุกด้าน จะได้เท่าเทียมกัน”
แม้จะมีข้อจำกัดที่คนหูหนวกจะสามารถใช้ Caption ได้ก็ต่อเมื่อคนหูหนวกเหล่านั้นต้องสามารถอ่านออกเขียนได้ แต่คนหูหนวกส่วนใหญ่ในประเทศไทยที่มีอยู่กว่า 300,000 คน ยังไม่สามารถอ่านหนังสือได้ หรืออ่านไม่คล่อง แต่การมีคำบรรยายแทนเสียงก็ยังมีประโยชน์ในมุมมองของอาจารย์เจ ที่จะช่วยให้คนพิการทางการได้ยินเหล่านี้ได้ฝึกอ่าน ฝึกใช้จนสามารถเข้าใจภาษาไทยได้คล่องแคล่วขึ้น เป็นโอกาสในการพัฒนาทักษะทางภาษาของคนพิการทางการได้ยิน
ขณะที่ในฐานะนักวิจัยและพัฒนาระบบ Real-time Captioning ดร.อนันต์ลดายอมรับว่า ตัวระบบยังต้องมีการพัฒนาต่อยอดขึ้นไปเพื่อให้สามารถใช้งานได้ง่าย ต้นทุนต่ำ เพื่อให้บริการคำบรรยายแทนเสียงมีการใช้งานแพร่หลายมากขึ้น
โดยต้องการให้สังคมทั่วไปตระหนักว่า กลุ่มผู้ใช้งาน Real-time Captioning ไม่ได้มีเฉพาะแค่ผู้พิการทางการได้ยินของไทยแต่เพียงกลุ่มเดียวเท่านั้น มันยังมีประโยชน์ต่อสถานการณ์ที่คนทั่วไปไม่สามารถได้ยินเสียงชัดเจน หรือมีประโยชน์ในการทำ Archive ทำการค้นหาข้อมูลในภายหลังได้
ขณะเดียวกัน เป้าหมายต่อไปของ Real-time Captioning ก็คือการต่อยอดพัฒนาให้เป็นศูนย์บริการคำบรรยายแทนเสียง ที่เป็นรูปแบบธุรกิจเพื่อสังคม (Social Enterprise) นอกเหนือไปจากการเป็นหนทางในการเข้าถึงข้อมูลข่าวสารของผู้พิการทางการได้ยินในสังคมไทย เหมือนที่มีบริการนี้ในต่างประเทศ เช่น ยุโรป สหรัฐอเมริกา อังกฤษ และญี่ปุ่น ที่ไม่เพียงแต่เป็นประโยชน์สำหรับคนหูหนวกเท่านั้น แต่ยังส่งผลดีต่อชาวต่างชาติต่างภาษาที่เข้าไปเรียนหรือใช้ชีวิตทำงานในประเทศนั้น ๆ
“อยากให้เมืองไทยมีบริการคำบรรยายแทนเสียงที่หลากหลายและทั่วถึง อยากให้ทุกคนมองว่ามันเป็นบริการที่จำเป็นและมีประโยชน์ มาช่วยกันทำ มาช่วยกันใช้ จะได้มีผู้ให้บริการและใช้งานที่เยอะขึ้น”