رباتی که احساسات را بیان می کند!
تاریخ انتشار: ۲۴ دی ۱۴۰۱ | کد خبر: ۳۶۸۴۷۲۳۱
ربات جدید شرکت مایکروسافت موسوم به VALL-E تنها با ۳ ثانیه گوش سپردن به صدای شخص میتواند آن را به خوبی تقلید کند و حتی میتواند احساسات گوینده را نیز حفظ کند.
خبرگزاری برنا- گروه علمی و فناوری؛ مایکروسافت جدیدترین پژوهشهای خود را در زمینه تبدیل متن به گفتار با مدلی به نام VALL-E نشان داده است که میتواند صدای افراد را تنها از یک نمونه صوتی سه ثانیهای شبیهسازی کند.
بیشتر بخوانید:
اخباری که در وبسایت منتشر نمیشوند!
محققان شرکت مایکروسافت این مدل چشمگیر جدید هوش مصنوعی تبدیل متن به گفتار را به نحوی طراحی کردهاند که میتواند فقط چند ثانیه به یک صدا گوش دهد، سپس آن صدا را تقلید کند و هرچه کاربر دوست دارد، بگوید.
گفتار نه تنها میتواند با صدای گوینده، بلکه با لحن احساسی وی و حتی آکوستیک یک اتاق همخوانی داشته باشد.
مایکروسافت میگوید، روزی میتوان از این ربات برای برنامههای کاربردی تبدیل متن به گفتار سفارشی یا پیشرفته استفاده کرد، اگرچه مانند فناوری دیپفیک(جعل عمیق)، خطر سوءاستفاده را نیز به همراه دارد.
ربات هوش مصنوعی VALL-E چیزی است که مایکروسافت آن را «مدل زبان عصبی کدک»(neural codec language model) مینامد که از شبکه فشردهسازی عصبی شرکت «متا» موسوم به Encodec مشتق شده است که صدا را از ورودی متن و نمونههای کوتاه از بلندگوی هدف تولید میکند.
محققان نحوه آموزش دیدن VALL-E را با ۶۰ هزار ساعت گفتار انگلیسی از بیش از ۷۰۰۰ سخنران در کتابخانه صوتی LibriLight متا شرح دادهاند. صدایی که این ربات سعی میکند تقلید کند باید با صدای دادههای آموزشی مطابقت داشته باشد.
این واقعیت که VALL-E لحن احساسی نمونههای اصلی را حفظ میکند، نکته برجسته آن است. همچنین کاملاً با محیط آکوستیک مطابقت دارد، بنابراین اگر گوینده صدای خود را در سالن پژواک ضبط کند، خروجی VALL-E نیز به نظر میرسد که از همان مکان آمده است.
کار Vall-E در تقلید لهجهها نیز بسیار خوب است و حداقل لهجههای آمریکایی، بریتانیایی و چند لهجه اروپایی را به خوبی تقلید میکند.
مایکروسافت برای بهبود این مدل قصد دارد دادههای آموزشی خود را «برای بهبود عملکرد مدل در قواعد زبانی، سبک گفتاری و شباهت به صدای سخنران» افزایش دهد. همچنین در حال بررسی راههایی برای کاهش کلماتی است که نامفهوم یا فراموش شدهاند.
پیامدهای این نوع فناوری کاملاً واضح است. از جنبه مثبت میتوان این گونه در نظر گرفت که کاربران میتوانند از این ربات بخواهند مثلا لیست خرید آنها را با صدای هنرپیشگان و صداپیشگان مشهور برایشان بخواند. یا اگر بازیگری در نیمه راه فیلمبرداری یک فیلم فوت کند، میتوان با استفاده از این فناوری و جلوههای ویژه پروژه را پایان رساند.
اما جنبه منفی آن نیز این است که خبر خوبی برای صداپیشهها و گویندگان نیست، چرا که هوش مصنوعی ممکن است بتواند گویندگی را به سرعت و بسیار ارزان انجام دهد، اما خب نمیتوان انتظار زیادی از آن داشت تا چندان هنرمندانه باشد.
پتانسیل کلاهبرداری با این فناوری نیز بسیار بالاست. اگر یک کلاهبردار بتواند برای سه ثانیه با شما تلفنی صحبت کند، میتواند صدای شما را بدزدد و با آن با خویشاوندانتان تماس بگیرد یا با آن میتوان هر دستگاه امنیتی تشخیص صدا را دور زد.
مایکروسافت احتمالاً به دلیل خطرات ذاتی این ربات هوش مصنوعی که میتواند کلمات دلخواه را در دهان شخص دیگری بگذارد، کد آن را به صورت منبعباز قرار نداده است، چرا که از آنجایی که VALL-E میتواند گفتار را به صورتی ترکیب کند که هویت گوینده را تقلید کند، ممکن است خطرات بالقوهای در استفاده نادرست، مانند جعل صدا یا جعل هویت داشته باشد.
ظهور هوش مصنوعیهای خلاق مانند DALL-E، ربات گفتگوگر ChatGPT، الگوریتمهای دیپفیک مختلف و تعداد بیشماری از الگوریتمهای دیگر به نظر میرسد که در چند ماه گذشته در نقطه عطف قرار گرفته و شروع به خارج شدن از آزمایشگاهها و ورود به دنیای واقعی کرده است. این فناوریها نیز مانند همه تغییرات دیگر، فرصتها و خطراتی را به همراه دارند و حاکی از آن هستند که ما واقعاً در زمان جالبی زندگی میکنیم.
انتهای پیام/
آیا این خبر مفید بود؟
نتیجه بر اساس رای موافق و رای مخالف
منبع: خبرگزاری برنا
کلیدواژه: شبیه سازی علم و فناوری هوش مصنوعی ربات احساسات صدا گوینده متا دیپ فیک هوش مصنوعی
درخواست حذف خبر:
«خبربان» یک خبرخوان هوشمند و خودکار است و این خبر را بهطور اتوماتیک از وبسایت www.borna.news دریافت کردهاست، لذا منبع این خبر، وبسایت «خبرگزاری برنا» بوده و سایت «خبربان» مسئولیتی در قبال محتوای آن ندارد. چنانچه درخواست حذف این خبر را دارید، کد ۳۶۸۴۷۲۳۱ را به همراه موضوع به شماره ۱۰۰۰۱۵۷۰ پیامک فرمایید. لطفاً در صورتیکه در مورد این خبر، نظر یا سئوالی دارید، با منبع خبر (اینجا) ارتباط برقرار نمایید.
با استناد به ماده ۷۴ قانون تجارت الکترونیک مصوب ۱۳۸۲/۱۰/۱۷ مجلس شورای اسلامی و با عنایت به اینکه سایت «خبربان» مصداق بستر مبادلات الکترونیکی متنی، صوتی و تصویر است، مسئولیت نقض حقوق تصریح شده مولفان در قانون فوق از قبیل تکثیر، اجرا و توزیع و یا هر گونه محتوی خلاف قوانین کشور ایران بر عهده منبع خبر و کاربران است.
خبر بعدی:
رشتهها و سطوح المپیاد ورزشهای فناورانه دانشجویی اعلام شد
به گزارش خبرگزاری مهر به نقل ازسازمان امور دانشجویان، رشتهها و سطوح برگزاری المپیاد ورزشهای فناورانه دانشجویی از سوی سازمان امور دانشجویان اعلام شد. المپیاد ورزشهای فناورانه دانشجویی در ۳ حوزه ورزشهای دیجیتال و فیجیتال، رباتیک، فناوری و نوآوری برگزار میشود.
ورزشهای دیجیتال و فیجیتال در ۳ سطح /دانشگاهی، استانی و ملی/
۱- دیجیتال «فیفا۲۰۲۴، E-football»،
۲- فیجیتال «مینی فوتبال فیجیتال، مینی بسکتبال فیجیتال»
۳- حرکتی «kinect» «دوچرخه سواری، تنیس، تنیس روی میز، رزمی»
ورزشهای رباتیک در ۲ سطح / استانی، ملی/
۱- مسابقات رباتهای واقعی «مسابقه خودروهای خودران، مسابقه فوتبال اندازه کوچک، مسابقه دوی رباتهای انسان نما»
۲- مسابقات شبیه سازی «مسابقه شبیه سازی فوتبال ۳ بعدی، مسابقه شبیه سازی خودروهای خودران»
۳- مسابقات لیگ نوآوری و خلاقیت «طراحی و ساخت رباتهای صخره نورد، شناگرو ایدههای آزاد»
فناوری و نوآوری در ورزش
۱- تحلیل های عملکردی در سطح ملی «تحلیل داوری صحنه های ورزشی، پیش بینی درصد مالکیت توپ در مسابقه، تحلیل بیومکانیکی و آسیب شناسی فعالیت ورزشی»
۲- طراحی و برنامهنویسی در دو سطح استانی و ملی «طراحی اپلیکیشن ورزشی، طراحی صنعتی محصول ورزش، شبیه سازی الکترونیکی ابزار ارزیابی در ورزش»
ثبتنام المپیاد ورزشهای فناورانه دانشجویی با امکان ثبت نام کلیه دانشجویان از تمام رشتهها و دانشگاههای سراسر کشور از ۲۷ فروردین ماه آغاز شده است و تا ۲۵ اردیبهشت ماه ۱۴۰۳ ادامه دارد و علاقهمندان می توانند با مراجعه به آدرس Setav.ir/stso نسبت به ثبتنام خود اقدام کنند.
کد خبر 6090902