در جدیدترین اخبار صنعت فناوری مطلع شدیم که شرکت شرکت OpenAI به دنبال توافق با رسانهها بوده و میخواهد برای آن پول بپردازد.
همانطور که در اخبار گذشته بیان کردیم، نیویورک تایمز از OpenAI و مایکروسافت به دلیل نقض قوانین کپیرایت و استفاده غیرقانونی از مطالب آنها شکایت کرده است و ادعا میکند که فناوری هوش مصنوعی این شرکتها به طور غیرقانونی میلیونها مقاله تایمز را برای آموزش ChatGPT و سایر خدمات برای ارائه دسترسی فوری به اطلاعات به مردم کپی کرده است.
مورد ذکر شده آخرین شکایت در این زمینه میباشد که در آن شاکی مدعی است که اطلاعات و محتوای آنها بدون پرداخت هیج مبلغی برای آموزش مدلهای هوش مصنوعی به اصطلاح زبان بزرگ میشود. در این راستا بازیگران، نویسندگان، روزنامهنگاران و دیگر افراد خلاقی که آثار خود را در اینترنت منتشر میکنند، میترسند که هوش مصنوعی از مطالب آنها درس بگیرد و چتباتهای رقابتی و سایر منابع اطلاعاتی را بدون پرداخت هزینه مناسب ارائه دهد.
سخنگوی OpenAI در آن زمان گفته بود که این شرکت «به حقوق سازندگان و صاحبان محتوا احترام میگذارد» و متعهد است که با آنها در مورد «مدلهای درآمدی جدید» همکاری داشته باشد. بااینحال، نیویورک تایمز بهدلیل کپیکردن بدون مجوز مقالاتش، «میلیاردها دلار خسارت قانونی» را درخواست کرده است.
اوایل این ماه نیز گفته شد که اپل قصد دارد با دریافت مجوز ناشران رسانههای بزرگ از آرشیو اخبار و مطالب آنها برای آموزش مدلهای هوش مصنوعی خود استفاده کند. حال براساس گزارش منتشر شده توسط رسانه The Verge به نظر میرسد که OpenAI نیز به دنبال توافق با رسانهها است و میخواهد برای دریافت مجوز استفاده از اطلاعات نشریات معتبر مانند نیویورک تایمز با آنها مذاکره کند.
مطابق اطلاعات منتشر شده OpenAI بین ۱ تا ۵ میلیون دلار در سال برای مجوز مقالات خبری دارای قانون کپیرایت برای آموزش مدلهای هوش مصنوعی خود در نظر گرفته است. با این حال در گزارش اخیر مطلع شدیم که شرکت اپل به دنبال همکاری با شرکتهای رسانه ای برای استفاده از محتوا برای آموزش هوش مصنوعی میباشد و حداقل ۵۰ میلیون دلار در یک دوره چند ساله برای دادهها ارائه میدهد.
ین اعداد تقریباً مشابه برخی از معاملات مجوزهای قبلی غیر هوش مصنوعی هستند. زمانی که متا برگه اخبار فیسبوک را راه اندازی کرد، استفاده از آن در اروپا ممنوع شد، بنابراین شرکت متا تا ۳ میلیون دلار در سال برای مجوز اخبار، سرفصلها و پیشنمایشها ارائه کرد. با این حال مشخص نیست که آیا کل پرداختها با برخی از اعداد بزرگتری که دیدهایم برابری میکند یا خیر. به عنوان مثال، گوگل در سال ۲۰۲۰ اعلام کرد که در مجموع یک میلیارد دلار برای مشارکت با سازمانهای خبری سرمایهگذاری خواهد کرد. تحت فشار یک قانون جدید، گوگل نیز اخیراً موافقت کرد که سالانه ۱۰۰ میلیون دلار به ناشران کانادایی در ازای پیوند دادن به مقالات آنها بپردازد.
تا آنجا که میدانیم، دادههای آموزشی مدلهای زبان بزرگ امروزی عمدتاً بر روی اطلاعاتی است که در اینترنت وجود دارد. در حالی که برخی از مدلهای هوش مصنوعی نحوه دریافت دادههای آموزشی خود را فاش نمیکنند، اغلب اطلاعاتی در دسترس میباشد که برای آموزش آنها از کدام مجموعه دادهها استفاده شده است. برخی از ارائهدهندگان داده مانند LAION منبع باز و کاملاً رایگان هستند و توسط مدلهایی مانند Stable Diffusion استفاده میشوند. همچنین توسعهدهندگان هوش مصنوعی هنوز مجبورند افرادی را برای بررسی، برچسبگذاری و گاهی اوقات پاکسازی دادههای آموزشی استخدام کنند که به طور قابل توجهی به هزینههای عملیاتی میافزاید.
OpenAI و اپل تنها توسعهدهندگان هوش مصنوعی نیستند که امیدوارند با سازمانهای خبری همکاری کنند. گزارش شده است که گوگل یک ابزار هوش مصنوعی به نام پیدایش را به نمایش گذشته است که حقایق را جمعآوری کرده و داستانهای خبری را برای مدیران نیویورک تایمز، وال استریت ژورنال و واشنگتن پست منتشر میکند. در همین حال، برخی از سازمانهای خبری از ابزارهای مولد هوش مصنوعی در اتاقهای خبری با نتایج متفاوت استفاده کردهاند. با ما همراه باشید در صورت انتشار اخبار جدید در رابطه با این موضوع بلافاصله آن را با شما به اشتراک خواهیم گذاشت. همچنین شما نیز میتوانید نظرات رویکرد اخیر OpenAI پس از شکایت نیویورک تایمز با ما در میان بگذارید.