به گزارش روشنفکر
شرکت هوش مصنوعی ElevenLabs از مدل Turbo نسخه ۲.۵ رونمایی کرد. این مدل تبدیل متن به گفتار با تأخیر کم از ۳۲ زبان حمایتمیکند. در نسخه تازه این مدل، زبانهای جدیدی همانند ویتنامی، مجارستانی و نروژی اضافه شدهاند. از ویژگیهای بسیار این مدل تأخیر زیاد کمتر آن زمان تشکیل صداست.
بر پایه اظهار ElevenLabs، در Turbo 2.5، تشکیل گفتار در زبانهای هندی، فرانسوی، اسپانیایی، ماندارین و ۲۷ زبان دیگر سه برابر سریع تر از نسخههای قبلی است. زبان انگلیسی نیز ۲۵ درصد سریع تر شدهاند. این چنین با Turbo 2.5 API گسترشدهندگان شخص ثالث میتوانند از این مدل تازه در سختافزارهایشان همانند عینک هوشمند منفعت گیری کنند تا کاربران دچار مشکلات بینایی بتوانند متنی را که روبهرویشان است، به گفتار تبدیل کنند و آن را بشنوند. این چنین این مدل در ویدیوگیم نیز میتواند برای صداگذاری کاراکترهای بازی کاربرد داشته باشد.
مدل هوش مصنوعی Turbo 2.5 برای تبدیل متن به گفتار
مدل Turbo v2.5 فناوری پیشرفته تبدیل متن به گفتار را با تأخیر کم اراعه میدهد و خروجی صدایی را که هوش مصنوعی با کیفیت بالا به وجود اورده است، تقریباً بدون نیاز به انتظار برای کاربر پخش میکند. در واقع این مدل توربو تازه با صدایی باکیفیت در کمتر از ۴۰۰ میلیثانیه متن را به گفتار تبدیل میکند.
ElevenLabs که سال ۲۰۲۲ تأسیس شد، روی گسترش مدلها و ابزارهای گفتاری و صداگذاری هوش مصنوعی تمرکز دارد. مدیرعامل این شرکت اخیراً حرف های می بود ElevenLabs اکنون نزدیک به ۴۰ کارمند دورکار در سراسر جهان دارد و تصمیم دارد تا آخر ۲۰۲۴ این تیم را به ۱۰۰ نفر افزایش دهد.
شرکت ElevenLabs اخیراً نیز ابزار جدیدی با نام AI Voice Isolator را برای افت نویز معارفه کرده می بود. این ابزار به کاربران امکان میدهد نویز و صداهای ناخواسته را از ویدیو و پادکستهایشان حذف کنند. برای منفعت گیری از این ابزار فقط باید محتوایی را که میخواهید صدایش بهبود اشکار کند، آپلود کنید. مدل این شرکت بعد از پردازش محتوا، نویز آن را حذف میکند.
دسته بندی مطالب