در زبان انگلیسی به گویندگی هوش مصنوعی AI voice over یا AI voice که این با Text-to-Speech (TTS) متفاوت است. تکست تو اسپیچ یا تبدیل متن به گفتار فن آوری حدود ۱۰ ساله است که بر عکس آن در کیبورد گوگل تمام گوشی های اندروید سال هاست که موجود است. اما تغییر صدا با هوش مصنوعی چیست؟ چه اتفاق جدیدی افتاد است؟
بشنوید نمونه های گویندگی هوش مصنوعی
در اینجا چند نمونه از صدا که توسط سیستم کامپیوتری تولید شده است را برای شما آورده ایم. از تبدیل متن به گفتار تا هوش مصنوعی.
صدای گویندگی متن به گفتار مرد
“سلام. صدایی که مْی شِنَوید تولید شده توسط سیستم تبدیل متن به گفتار در موسسه فرهنگی، هنری پادان است. این تکنیک با تغییر صدا با هوش مصنوعی متفاوت می باشد. نحوه ی کار این سیستم بر اساس تبدیل هجاهای متن به سیلابهای کلمات است. این روزها در فضای مجازی، بر روی بسیاری از کلیپها این صدا را مْی شِنَوید. در این نوشته، توضیحاتی در این خصوص داده شده است.”
این صدا توسط یک نرم افزار ساده تولید میشود و استفاده از آن آزاد است. برای نتیجه بهتر باید اعراب گذاری صحیح انجام شود
صدای گویندگی متن به گفتار زن
همان متن بالا با صدای زنانه تولید شده است. این روش با گویندگی هوش مصنوعی یا تغییر صدا با هوش مصنوعی متفاوت است.
تغییر صدا با هوش مصنوعی از مرد به زن
در اینجا میشنوید که موضوع کاملا متفاوت است. صدای شخصی به صدای یک گوینده زن فرانسوی تبدیل شده. مشخص نبودن برخی واج ها به دلیل تفاوت زبان فارسی و زبان فرانسه است.
صدای جو بایدن رئیس جمهور آمریکا
میزان تغییرات در لحن و تناژ صدا را بشنوید. هوش مصنوعی یک صدای معمولی را دقیقا با صدای رئیس جمهور آمریکا جایگزین کرده است.
صدای جیمز جونز با گویندگی هوش مصنوعی
جیمز جونز گوینده مشهور آمریکایی اینبار به جای همکار ما صحبت می کند. این نیز نمونه دیگری از تغییر صدا با هوش مصنوعی است یا همان گویندگی هوش مصنوعی.
گویندگی هوش مصنوعی یا تغییر صدا
این موضوع جدید سیستم کاملا متفاوتی دارد. یک پردازشگر هوش مصنوعی، صدای شخص دیگری را دریافت میکند و توسط سرور های فوق پیشرفته آن را آنالیز میکند. از صدای نفس ها تا خش صدا و مشخصات کامل صدای تولید شده توسط حنجره ی آن فرد. سپس شما با دادن صدای خود به این سرور کلام شما را مانند صدای آن شخص بازسازی میکند. مثلا صدای یک گوینده مشهور. یا صدای یک سلبریتی و… در ایالات متحده این کار اگر با اجازه قانونی صورت نگیرد به مثابه جعل سند تلقی شده و پیگرد قانونی دارد. چیزی شبیه جعل امضا.
منع قانونی و اخلاقی استفاده از گویندگی هوش مصنوعی
در کشور ما ایران چندی ست که جعل صدای افراد مختلف از جمله گویندگان و دوبلورها فراگیر شده است. این عمل که توسط جمع کثیری از صداپیشگان تقبیح شده است در حال گذراندن مراحل پیگرد قضایی می باشد. این موضوع به چند دلیل مورد اعتراض قرار گرفته است
استفاده غیر اخلاقی
گویندگان متن های مختلف را با حساسیت فراوان انتخاب می کنند. همه صداپیشگان معتبر متن ها را برای خوانش گلچین می کنند. مثلا یک گوینده هیچ متنی در مورد رمز ارز نمیخواند. اما کسی با سواستفاده از گویندگی هوش مصنوعی این کار را با جعل صدای گوینده انجام میدهد. آیا این کار اخلاقی ست؟
استفاده تجاری
صداپیشگان علاوه بر تسلط بر فن بیان و ادبیات و صدای خوب، سالیان سال کار می کنند تا صدایی آشنا و شناخته شده در میان مردم پیدا کنند. مثلا دکلمه آنه شرلی با صدای استاد نصرالله مدقالچی، یا اتللو با صدای پرویز بهرام، پوآرو با صدای اکبر منانی و… این نقش ها سالها در گوش ما طنین انداز بوده اند. پس بسیاری از برند ها و شرکت های برای داشتن این صداها در تبلیغ خود از صداهایی اینچنین استفاده می کنند. حال در نظر بگیرید شخصی بیاید و با سواستفاده از هوش مصنوعی برند خود را با صدای این اساتید بازتولید کند! آیا قانونی و اخلاقی ست؟
استفاده از صدای درگذشتگان
بسیاری از بهترین دوبلورها و گویندگان ما از دنیا رفته اند. سال ها با وسواس فیلم دوبله کرده اند، متن خوانده اند و چه بسیار فیلمهایی که دوبله نکرده اند و متن هایی که نخوانده اند چون با موازینشان همخوان نبوده است. حال تصور کنید شخصی یا گروهی بیاید و با صدای این درگذشتگان فیلم دوبله کند و یا متن تولید کند. در حالی که دست آن دوبلور از دنیا کوتاه است! آیا اخلاقی ست؟
استفاده فکاهی
در این میان هم افرادی برای جذب فالور و محبوبیت کاذب در فضای مجازی دست به تولید کلیپ هایی با صدای دیگران می کنند. مثلا صدای یک استاد را برمیدارند و با مطلبی فکاهی و غیر اخلاقی باز نشر می دهند! چرا که صدایی که عمری به جدیت شنیده ایم اکنون در حال گفتن حرفهای نامربوط است. و این نیز از همان مصارف خلاف اخلاق و قانون در این موضوع است.
از گویندگی هوش مصنوعی چطور استفاده کنیم؟
واقعیت این است که تا قانونی برای این موضوع تدوین نشود استفاده ی صحیحی نمی توان از آن کرد. مگر با رضایت شخص گوینده. اما در صورت این رضایت شما می توانید متنی را با صدای خود بخوانید و با صدای فلان دوبلور آمریکایی باز پخش کنید. گاهی صدای ما برای گفتن یک دلنوشته مناسب نیست. این تکنولوژی میتواند به ما کمک کند تا بتوانیم صدای بهتری را جایگزین صدای خود با آوای خودمان کنیم.
البته گفتنی است که استفاده از مبدل گفتار به متن با TTS که متفاوت از هوش مصنوعی می باشد هیچ گونه منعی ندارد.
کلام آخر
«پادان» سابقهی درخشانی در صنعت صدا، گویندگی و صداگذاری دارد. سالها در سینما، تلویزیون و رادیو با اساتید مهم این حوزه همکاری داشته است. در «پادان» پیشکسوتان گویندگی و دوبله همچون کیکاووس یاکیده، ابوالحسن تهامینژاد، منوچهر اسماعیلی، منوچهر والیزاده، الهه رضایی، ژاله صادقیان، فریبا رمضانپور و … حضور دارند. در واقع «پادان» را میتوان مرجع اصلی گویندگان و دوبلورهای ایرانی دانست.
با آنکه گویندگی هوش مصنوعی خیره کننده است، اما مسیری طولانی مانده تا به صورت غیر قابل تشخیص از صدای این اساتید در شبیه سازی صدا استفاده شود اما چندان دور از دسترس هم نخواهد بود. کیفیت صدا، لحن درست، و بیان صحیح و جذاب مهمترین بخش گویندگی است. صدا روح دارد و هوش مصنوعی نه. برای استفاده از نفس بزرگان صدای ایران با پادان تماس بگیرید و تا ابد از این افتخار بهره مند بمانید.
تنها صداست که می ماند…
واقعا جالب بود، مرسی بابت انتشار این متن، نمونه صداهای هوش مصنوعی خیلی جالب و جذاب بود، تا الان چند بار گوششون دادم ولی هر بار میشنوم به اندازه دفعه اول هیجان زده میشم 😅
سلام. با سپاس از مطلب خوبتون در مورد گویندگی هوش مصنوعی. من در جایی شنیدم که از صدای استاد مدقالچی استفاده شده بود. اما خیلی تابلو بود که خودشون نیستن. یه کلاس کوچینگ رو تبلیغ میکرد.
بسیار مقالات خوب و ارزشمندی در اختیار عموم قرار میدین واقعا عالی هستین موفق باشین.