April 24, 2024

ฟังแค่ 3 วินาที AI ก็เลียนเสียงคุณได้แล้ว!!!

นักวิจัยของไมโครซอฟต์กำลังทำงานเกี่ยวกับโมเดลแปลงข้อความเป็นคำพูด (TTS) ที่สามารถเลียนแบบเสียงของบุคคล พร้อมแสดงอารมณ์และน้ำเสียงได้หลังจากการฝึกเพียง 3 วินาที

ด้วยเทคโนโลยี AI อย่าง VALL-E และกระบวนการที่ระบุไว้ในเอกสารวิจัยความยาว 15 หน้าที่เผยแพร่ในเดือนนี้บนเว็บไซต์วิจัย arXiv ถือเป็นก้าวสำคัญของ Microsoft ในการแข่งขันทางเทคโนโลยีกับ Google, Amazon และ Meta

ไมโครซอฟต์กำลังใช้ปัญญาประดิษฐ์สำหรับการประมวลผลภาษาธรรมชาติ (NLP) ซึ่งเป็นผลพลอยได้จากการซื้อธุรกิจของ Nuance ด้วยมูลค่า 20,000 ล้านดอลลาร์เมื่อปีที่แล้ว รวมทั้งเทคโนโลยีการรู้จำเสียงและเทคโนโลยี TTS และลงทุนอย่างจริงจังในการใช้เทคโนโลยีจาก OpenAI ที่เพิ่งเริ่มต้น รวมถึงเครื่องมือ ChatGPT ซึ่งจะถูกนำมาประยุกต์ใช้กับเครื่องมือค้นหา Bing และชุดแอปพลิเคชัน Office

การพัฒนาอย่างรวดเร็วของเทคโนโลยีก่อให้เกิดปัญหาด้านจริยธรรมและกฎหมายต่างๆ เสียงของบุคคลนั้นสามารถบันทึกและสังเคราะห์เพื่อใช้ในหลากหลายด้าน ตั้งแต่โฆษณาหรือการโทรสแปมไปจนถึงวิดีโอเกมหรือแชทบอท นอกจากนี้ยังสามารถใช้ในการปลอมโดยใช้เสียงของนักการเมืองหรือบุคคลที่มีชื่อเสียง เพื่อเผยแพร่ข้อมูลเท็จหรือสร้างความเกลียดชัง

ที่มา : theregister