Google представила новый инструмент искусственного интеллекта под названием Gemini, который является прямым продолжением и развитием предыдущей системы Bard. Gemini предлагает пользователям улучшенные возможности для совместной работы, обновлённый и более интуитивно понятный интерфейс. Основной целью Google является предоставление доступа к своим передовым моделям ИИ широкому кругу пользователей.
Содержание
Что такое Gemini
Gemini — это модель искусственного интеллекта, разработанная компанией Google DeepMind. Она будет доступна в трех версиях:
- Gemini Nano на смартфонах Google Pixel 8 Pro;
- Gemini Pro — на ее основе теперь работает Google Bard. Позволяет генерировать тексты и изображения, задавать вопросы и искать информацию;
- Gemini Ultra — веб-версия ИИ-модели, где реализовано наибольшее количество функций, конкурент GPT-4.
Возможности Gemini
Модель ИИ Gemini Ultra умеет распознавать и анализировать тексты, изображения, аудио и даже видео (этого GPT-4 еще не умеет), а также генерировать текст и изображения. Примеры возможностей Gemini:
- распознает рукописный текст на изображениях;
- проверяет наличие ошибок в тексте (как в письменном, так и на изображении) и объясняет, что нужно исправить и почему;
- создает отдельный интерфейс для каждой задачи — например, пошаговую инструкцию с иллюстрациями, как приготовить блюдо;
- генерирует компьютерный код, таблицы, различные виды текстов и изображений;
ведет с пользователем «осознанный» диалог.
Одно из главных преимуществ модели от Google — взаимодействие с видео. В демонстрационном ролике было показано, как Gemini распознает и озвучивает действия, происходящие на видео, предсказывает, что будет дальше, и предлагает варианты развития событий. Также модель предложила пользователю сыграть в игру, сравнила предметы по разным характеристикам, предложила и проиллюстрировала, что можно сделать с двумя клубками пряжи, распознала гитару и включила мелодию на гитаре.

Как пользоваться
Воспользоваться Gemini Nano можно только на смартфонах Pixel 8 Pro, а Gemini Ultra уже доступна. Сейчас у пользователей есть возможность протестировать только Gemini Pro. Для этого нужно включить VPN и открыть Google Bard.
Примеры использования
Пример использования Gemini Ultra пока можно увидеть только в демонстрационном ролике.
Gemini же специально обучался для роли личного помощника: нейросеть Google способна прошерстить список входящих имейлов в Gmail, выбрать самые важные и подготовить черновики ответов на каждое. Но всё неидеально: иногда Gemini может «галлюционировать», то есть придумать какой-то фрагмент письма или подсказать несуществующий адрес в Google Maps.