OpenAI прокоментувала нещодавній позов The New York Times щодо використання його текстів для навчання ШІ. На думку компанії, позов став несподіванкою. Свою позицію представники OpenAI висловили в чотирьох пунктах, один з них повністю присвятили стосункам з виданням. В ньому компанія пояснила, що позов безпідставний, і припустила, що NYT маніпулює інструментами ШІ. Про це йдеться в офіційній заяві OpenAI.

  • В компанії наголошують на тому, що перемовини з виданням були конструктивними і зосередженими на партнерстві в галузі використання ChatGPT, за допомогою чого NYT могло би зв’язуватися зі своїми читачами в новий спосіб, а OpenAI – отримувати доступ до звітів. Водночас, згідно із заявою OpenAI, вони пояснили виданню, що їхній контент не буде доволі ефективним для майбутнього навчання. Позов від 27 грудня став «несподіванкою та розчаруванням» для компанії. 
  • OpenAI пригадує, що The New York Times заявили, ніби бачили певні повторення їхнього контенту, але відмовлялися ділитися прикладами цього попри зобов’язання компанії розслідувати та вирішувати будь-які проблеми. Також у OpenAI підкреслили, що в червні (2023 року – ред.) відключили функцію ChatGPT після того, як дізналися, що програма може відтворювати контенти онлайн у непередбачуваний спосіб.

OpenAI зазначає, що повторення, про які пише NYT, можуть ставатися через статті багаторічної давнини, що поширювалися на численних сторонніх вебсайтах. Представники OpenAI припускають, що видання або давало можливість моделям повторювати контент, або відбирали приклади з великої кількості спроб. Також OpenAI наголошує, що постійно роблить системи більш стійкими до атак, націлених на вилучення навчальних даних, і вже має певний прогрес.

Щодо позову, то попри його безпідставність, в OpenAI сподіваються на конструктивне партнерство з NYT, а також подальшу співпрацю з медіа. Окрім цього, у статті представництво компанії обговорило ще деякі питання навчання ШІ за допомогою видань.

  • Згідно із заявою, OpenAI прагне підтримувати здорову новинну екосистему, бути хорошим партнером та створювати взаємовигідні можливості. Компанія працює над розробкою технологій для підтримки новинних ЗМІ, представники зустрічаються з провідними медіа, щоби вивчити можливості, обговорити проблеми та запропонувати рішення. Також у заяві йдеться про те, що OpenAI вдалося встановити партнерські відносини з новинними ЗМІ. Зокрема з Assocated Press, Axel Springer, American Journalism Project.
  • У другому пункті OpenAI наголошує на тому, що навчання ШІ має бути лише добросовісним. В компанії вважають це критично необхідним для конкурентоспроможності в США. А в деяких країнах навіть ухвалені закони, які дозволяють навчання на контенті, що захищений авторським правом. Втім, OpenAI забезпечує процес відмови для видавців для того, щоб інструменти ШІ не могли отримати доступ до їхніх сайтів. У заяві зазначається, що The New York Times пройшов його у серпні 2023 року.
  • У статті надали пояснення збоям, які трапляються під час навчання. Зокрема, запам’ятовування і повторення результатів моделювання. За словами представників OpenAI, таке трапляється, коли певний контент з’являється в навчальних даних частіше за один раз. Компанія здійснює заходи для того, щоб обмежити ненавмисне запам’ятовування. Але вони очікують на відповідальність від користувачів, а також нагадують, що навмисне маніпулювання моделями є неналежним використанням технології ШІ.

«Як люди отримують освіту, щоб навчитись вирішувати нові проблеми, ми хочемо, щоб наші моделі ШІ спостерігали за діапазоном світової інформації, з кожної мови, культури та галузі», – наголошують в OpenAI. І додають, що «агрегатор знань такий великий, що окреме джерело, включно з The New York Times, не матиме великого значення для навчання моделі». 

Що цьому передувало

The New York Times позивається до суду проти OpenAI та Microsoft за порушення авторських прав. На думку представників видання, статті використовують для тренування штучного інтелекту. В NYT вимагали відповідальності компаній за «незаконне копіювання і використання унікально цінних робіт». Серед інших вимог – знищення моделей чат-ботів та навчальних даних, що використовують їхні матеріали. Водночас у медіа з’явилась інформація про те, що OpenAI пропонує деяким ЗМІ виплати у розмірі від $1 до $5 млн в обмін на використання їхніх новин для навчання моделей ШІ, що є в основі ChatGPT.