MetaAI та Papers with Code оголосили про випуск Galactica — аналога відомого алгоритму обробки природної мови GPT-3 від OpenAI. Як повідомили в Papers with Code, головна відмінність Galactica від конкурентів — це орієнтованість на наукові роботи, включно з математичними та біологічними текстами та написанні статей для вікіпедії.
Що вміє Galactica?

Galactica навчався на базах з науковими та академічними текстами і довідковому матеріалі. Сервіс являє собою набір зі 120 мільярдів параметрів, і може бути запущений на одному графічному процесорі NVIDIA A100.
«Моделі Galactica навчаються на новому високоякісному наборі наукових даних під назвою NatureBook, завдяки чому моделі можуть працювати з науковою термінологією, математичними та хімічними формулами, а також вихідними кодами», — зазначають на сайті сервісу.
З поширених сценаріїв використань Galactica її розробники пропонують наступні:
- Створювати огляди доступної літератури по заданій темі;
- Написання статей для «Вікіпедії»;
- Створення конспектів лекцій;
- Генерування наукових відповідей на поставлене запитання.
Як використовувати Galactica?

Galactica вже доступна в тестовому режимі за посиланням. Для її використання не потрібно проходити реєстрацію чи очікувати на доступ, проте розробники зазначають, що в сервісі досі можуть бути баги й довіряти написаним текстам поки не варто. Зокрема вже відомо про наступні проблеми:
- Немає жодних гарантій правдивості або надійності висновків та текстів, написаних з використанням мовних моделей, навіть таких великих й навчених на високоякісних даних, як Galactica;
- Galactica добре підходить для створення текстів про добре прописані концепції, щодо яких є багато матеріалів, але гірше працює з малодослідженими темами;
- Деякий текст, створений Galactica, може виглядати дуже автентичним і дуже переконливим, але може бути помилковим у важливих аспектах.