Google представила новый инструмент искусственного интеллекта под названием Gemini, который является прямым продолжением и развитием предыдущей системы Bard. Gemini предлагает пользователям улучшенные возможности для совместной работы, обновлённый и более интуитивно понятный интерфейс. Основной целью Google является предоставление доступа к своим передовым моделям ИИ широкому кругу пользователей.

Содержание

  1. Что такое Gemini
  2. Возможности Gemini
  3. Как пользоваться
  4. Примеры использования

Что такое Gemini

Gemini — это модель искусственного интеллекта, разработанная компанией Google DeepMind. Она будет доступна в трех версиях:

  • Gemini Nano на смартфонах Google Pixel 8 Pro;
  • Gemini Pro — на ее основе теперь работает Google Bard. Позволяет генерировать тексты и изображения, задавать вопросы и искать информацию;
  • Gemini Ultra — веб-версия ИИ-модели, где реализовано наибольшее количество функций, конкурент GPT-4.

Возможности Gemini

Модель ИИ Gemini Ultra умеет распознавать и анализировать тексты, изображения, аудио и даже видео (этого GPT-4 еще не умеет), а также генерировать текст и изображения. Примеры возможностей Gemini:

  • распознает рукописный текст на изображениях;
  • проверяет наличие ошибок в тексте (как в письменном, так и на изображении) и объясняет, что нужно исправить и почему;
  • создает отдельный интерфейс для каждой задачи — например, пошаговую инструкцию с иллюстрациями, как приготовить блюдо;
  • генерирует компьютерный код, таблицы, различные виды текстов и изображений;
    ведет с пользователем «осознанный» диалог.

Одно из главных преимуществ модели от Google — взаимодействие с видео. В демонстрационном ролике было показано, как Gemini распознает и озвучивает действия, происходящие на видео, предсказывает, что будет дальше, и предлагает варианты развития событий. Также модель предложила пользователю сыграть в игру, сравнила предметы по разным характеристикам, предложила и проиллюстрировала, что можно сделать с двумя клубками пряжи, распознала гитару и включила мелодию на гитаре.

Возможности Gemini

Как пользоваться

Воспользоваться Gemini Nano можно только на смартфонах Pixel 8 Pro, а Gemini Ultra уже доступна. Сейчас у пользователей есть возможность протестировать только Gemini Pro. Для этого нужно включить VPN и открыть Google Bard.

Примеры использования

Пример использования Gemini Ultra пока можно увидеть только в демонстрационном ролике.

The capabilities of multimodal AI | Gemini Demo

Gemini же специально обучался для роли личного помощника: нейросеть Google способна прошерстить список входящих имейлов в Gmail, выбрать самые важные и подготовить черновики ответов на каждое. Но всё неидеально: иногда Gemini может «галлюционировать», то есть придумать какой-то фрагмент письма или подсказать несуществующий адрес в Google Maps.