Nvidia анонсировала новую платформу видеоконференцсвязи для разработчиков под названием Nvidia Maxine, которая, по ее утверждению, может улучшить качество общения.
Как сообщает The Verge, Nvidia Maxine – это не потребительская платформа, а набор инструментов для сторонних фирм по улучшению собственного программного обеспечения.
Maxine будет обрабатывать звонки в облаке с помощью графических процессоров Nvidia и улучшать их качество с помощью искусственного интеллекта.
Используя ИИ, система может:
- Перестраивать лица и взгляды абонентов так, чтобы они всегда смотрели прямо в свою камеру;
- Сокращать требования к пропускной способности для видео передавая только «ключевые точки лиц»;
- Повышать разрешения видео выше исходного;
- Добавлять искусственное освещение лица;
- Создавать перевод и транскрипцию в реальном времени;
- Анимировать аватары пользователей.
Конечно, не все эти функции являются новыми. Сжатие видео и транскрипция в реальном времени достаточно распространены, и Microsoft и Apple внедрили выравнивание взгляда в Surface Pro X и FaceTime, чтобы люди сохраняли зрительный контакт во время видеозвонков (хотя технологии Nvidia выглядят более качественно).
Nvidia надеется, что ее преимущество в облачных вычислениях и впечатляющие исследования и разработки в области искусственного интеллекта помогут ей превзойти своих конкурентов.
Во время телефонной конференции с журналистами генеральный менеджер Nvidia Ричард Керрис охарактеризовал Maxine как «действительно захватывающее и очень своевременное решение» и выделил сжатие видео на основе искусственного интеллекта как особенно полезную функцию.
«У всех нас были случаи, когда пропускная способность была ограничением в наших звонках, которые мы проводим ежедневно, – сказал Керрис. — Если мы применим ИИ к этой проблеме, мы сможем реконструировать сцены различий на обоих концах вызова и передавать только то, что нужно передать, тем самым значительно уменьшив требования к пропускной способности».