Nvidia анонсировала новую платформу видеоконференцсвязи для разработчиков под названием Nvidia Maxine, которая, по ее утверждению, может улучшить качество общения.

Как сообщает The Verge, Nvidia Maxine – это не потребительская платформа, а набор инструментов для сторонних фирм по улучшению собственного программного обеспечения.


Maxine будет обрабатывать звонки в облаке с помощью графических процессоров Nvidia и улучшать их качество с помощью искусственного интеллекта. 

Используя ИИ, система может:

  • Перестраивать лица и взгляды абонентов так, чтобы они всегда смотрели прямо в свою камеру;
  • Сокращать требования к пропускной способности для видео передавая только «ключевые точки лиц»;
  • Повышать разрешения видео выше исходного; 
  • Добавлять искусственное освещение лица;
  • Создавать перевод и транскрипцию в реальном времени;
  • Анимировать аватары пользователей.

Конечно, не все эти функции являются новыми. Сжатие видео и транскрипция в реальном времени достаточно распространены, и Microsoft и Apple внедрили выравнивание взгляда в Surface Pro X и FaceTime, чтобы люди сохраняли зрительный контакт во время видеозвонков (хотя технологии Nvidia выглядят более качественно).

Nvidia надеется, что ее преимущество в облачных вычислениях и впечатляющие исследования и разработки в области искусственного интеллекта помогут ей превзойти своих конкурентов. 

Во время телефонной конференции с журналистами генеральный менеджер Nvidia Ричард Керрис охарактеризовал Maxine как «действительно захватывающее и очень своевременное решение» и выделил сжатие видео на основе искусственного интеллекта как особенно полезную функцию.

«У всех нас были случаи, когда пропускная способность была ограничением в наших звонках, которые мы проводим ежедневно, – сказал Керрис. — Если мы применим ИИ к этой проблеме, мы сможем реконструировать сцены различий на обоих концах вызова и передавать только то, что нужно передать, тем самым значительно уменьшив требования к пропускной способности».