مدتی است که آموزش مدلهای پیشرفته هوش مصنوعی با محتواهای اختصاصی به موضوعی او گفت و گوبرانگیز تبدیل شده است. تعداد بسیاری از شرکتها با شکایتهایی از سوی نویسندگان و رسانههای گوناگون روبه رو می باشند. اکنون متا اعتراف کرده که از کتابهای دارای کپی رایت در مجموعهای موسوم به «Books3» منفعت گیری کرده است، بااینحال این شرکت تمایلی نیز به پرداخت غرامت به نویسندگان ندارد.
بر پایه گزارشی تازه، گروهی از نویسندگان با ادعای منفعت گیری غیرقانونی از مطالب دارای کپی رایت در گسترش مدلهای زبان بزرگ Llama 1 و Llama 2، علیه متا شکایت کردند. در جواب، این شرکت به نویسنده و کمدین «سارا سیلورمن»، «ریچارد کادری» و دیگر دارندگان آثاری که کپی رایت دارند، حرف های است که مدلهای هوش مصنوعی خود را با منفعت گیری از کتابهای دارای حق تکثیر آموزش داده است.
اعتراف متا و منفعت گیری منصفانه از منبع های دارای کپی رایت
متا اعتراف کرده است که از مجموعه Books3 برای آموزش مدلهای زبانی بزرگ Llama 1 و Llama 2 منفعت گیری کرده است. Books3 مجموعهای شناخته شده است که شامل متن ساده بیشتر از ۱۹۵ هزار کتاب است که مجموعاً نزدیک به ۳۷ گیگابایت حجم دارد. این آرشیو توسط یک محقق هوش مصنوعی در سال ۲۰۲۰ بهگفتن راهی برای اراعه یک منبع داده بهتر برای بهبود الگوریتمهای یادگیری ماشین تشکیل شد.
متا اکنون اذعان کرده است که از قسمتهایی از مجموعه داده Books3 منفعت گیری میکند؛ استدلال متا این است که منفعت گیری از آثار دارای کپی رایت برای آموزش مدلهای هوش مصنوعی نیازی به رضایت یا پرداخت غرامت به نویسندگان ندارد. این شرکت ادعاهای مربوط به نقض حق تکثیر شاکیان را رد میکند و میگوید که هرگونه منفعت گیری از آثار دارای کپی رایت در Books3 باید بهگفتن «منفعت گیری منصفانه» در نظر گرفته بشود. بدین معنی که شرکتها میتوانند بدون اجازه از مالک، از منبع های آنها برای آموزش هوش مصنوعی منفعت گیری کنند.
OpenAI نیز در پی شکایت نیویورک تایمز، آشکارا اظهار کرده است که آموزش مدلهای هوش مصنوعی بدون منفعت گیری از مطالب دارای کپی رایت غیرممکن است.
منبع