Активируйте JavaScript для полноценного использования elitetrader.ru Проверьте настройки браузера.
ИИ повсюду – какие новинки представил Google на ежегодной конференции » Элитный трейдер
Элитный трейдер
Искать автора

ИИ повсюду – какие новинки представил Google на ежегодной конференции

21 мая 2024 ИХ "Финам"
Google на этой неделе провел ежегодную конференцию разработчиков, на которой представил масштабные обновления. Наиболее «громким» из них стала интеграция ИИ в поиск, что в СМИ уже назвали одним из крупнейших шагов вперед с момента основания сервиса. В целом, как отмечает TechCrunch, за 110 минут презентации компании искусственный интеллект упоминался 121 раз – компания сама подсчитала эту цифру и ее упомянул гендиректор Сундар Пичаи.

«Конечно, неудивительно, что эта тема оказалась в центре внимания, но в любом случае это впечатляющая цифра. Gemini – персональный помощник на основе ИИ - и его различные версии привлекли всеобщее внимание. Google включает платформу практически во все свои предложения, включая Android, Search и Gmail», - отмечают авторы материала. По их словам, технологическому гиганту приходится нелегко в условиях высокой конкуренции – так, всего за день до презентации OpenAI заявила о выпуске GPT-4o - более быстрой и дешевой версии своей ИИ-модели. Ожидается, что Apple объявит о сделке по включению технологии OpenAI в свои предложения в рамках собственной конференции разработчиков WWDC в следующем месяце.

TechCrunch составил подборку новинок, анонсированных Google.

ИИ в поиске Google
Компания добавляет больше ИИ в свой поиск, развеивая сомнения в том, что теряет долю рынка в пользу таких конкурентов, как ChatGPT и Perplexity. Кроме того, компания планирует использовать Gemini в качестве инструмента для таких вещей, как планирование поездок. Google планирует использовать генеративный искусственный интеллект для организации всей страницы результатов поиска. Это станет к существующей функции «Обзор AI», которая создает короткий фрагмент с совокупной информацией по теме, которую вы искали. Функция «Обзор ИИ» становится общедоступной.

Обновления генеративного ИИ
Google анонсировала Imagen 3, новейшую модель в семействе моделей генеративного искусственного интеллекта Imagen. Демис Хассабис, генеральный директор DeepMind, исследовательского подразделения Google в области искусственного интеллекта, сказал, что Imagen 3 более точно понимает текстовые подсказки, которые он переводит в изображения, по сравнению со своим предшественником Imagen 2, и является более «творческим и детализированным». Кроме того, по его словам, модель производит меньше «отвлекающих артефактов» и ошибок. «Это также наша лучшая модель для рендеринга текста, что было проблемой для моделей генерации изображений», — добавил Хассабис.

Генеративный ИИ для обучения
Также Google представил LearnLM, новое семейство генеративных моделей искусственного интеллекта, настроенных для обучения. Это результат сотрудничества исследовательского подразделения Google DeepMind AI и Google Research. По словам Google, модели LearnLM предназначены для «разговорного» обучения студентов по ряду предметов. Хотя продукт уже доступен на нескольких платформах Google, компания запускает LearnLM через пилотную программу в Google Classroom. Он также работает с преподавателями, чтобы увидеть, как LearnLM может упростить и улучшить процесс планирования уроков. По словам Google, LearnLM может помочь учителям открыть для себя новые идеи, контент и виды деятельности или найти материалы, адаптированные к потребностям конкретных групп учащихся.

Firebase Genkit
К платформе для разработки приложений Firebase появилось новое дополнение под названием Firebase Genkit, которое призвано облегчить разработчикам создание приложений на основе искусственного интеллекта на jаvascript/TypeScript. Это платформа с открытым исходным кодом, использующая лицензию Apache 2.0, которая позволяет разработчикам быстро встраивать искусственный интеллект в новые и существующие приложения. Некоторые из вариантов использования Genkit, которые компания выделила, включают многие стандартные варианты использования GenAI: генерация и обобщение контента, перевод текста и генерация изображений.

Проведение викторин
Новинкой YouTube являются викторины, создаваемые искусственным интеллектом. Этот новый диалоговый инструмент искусственного интеллекта, который позволяет пользователям образно «поднимать руку» при просмотре обучающих видеороликов. Зрители могут задавать уточняющие вопросы, получать полезные объяснения или проходить тесты по теме. Это будет некоторым облегчением для тех, кому приходится смотреть более длинные образовательные видеоролики, такие как лекции или семинары. Новые функции будут доступны только некоторым пользователям Android в США.

Обновления Gemma 2
Один из самых популярных запросов, которые Google услышал от разработчиков, — это более расширение модели Gemma (инструмент для разработчиков ИИ), поэтому Google добавит в Gemma 2 новую модель с 27 миллиардами параметров. Следующее поколение моделей Gemma от Google будет запущено в июне. По словам Google, этот объем оптимизирован Nvidia для работы на графическом процессоре следующего поколения.

Google Play
Google Play привлекает некоторое внимание благодаря новым функцим, новым способам привлечения пользователей, обновлениям Play Points и другим улучшениям инструментов для разработчиков, таких как консоль Google Play SDK и Play Integrity API, среди прочего. Особый интерес для разработчиков представляет так называемый Engage SDK, который предоставит разработчикам приложений возможность демонстрировать пользователям свой контент в полноэкранном режиме, персонализированном для отдельного пользователя.

Обнаружение мошенничества во время звонков
Google анонсировал функцию, которая, по словам компании, будет предупреждать пользователей о потенциальных мошенниках во время разговора. Эта функция, которая будет встроена в будущую версию Android, использует Gemini Nano, самую маленькую версию предложения Google по генеративному искусственному интеллекту, которую можно запускать полностью на устройстве. Система эффективно отслеживает «модели разговоров, обычно связанные с мошенничеством» в режиме реального времени.

Google приводит пример человека, притворяющегося «представителем банка». Распространенные тактики мошенников, такие как запросы пароля и подарочные карты, также активируют систему. После включения появится всплывающее уведомление о том, что пользователь может стать жертвой обманщиков.

Функция Ask Photos
Google Photos получает поддержку искусственного интеллекта благодаря запуску экспериментальной функции Ask Photos, основанной на модели искусственного интеллекта Gemini от Google. Новое дополнение, которое появится позднее этим летом, позволит пользователям осуществлять поиск по своей коллекции Google Photos, используя запросы, которые используют понимание ИИ содержания их фотографий и других метаданных. Раньше пользователи могли искать конкретных людей, места или предметы на своих фотографиях, но обновление искусственного интеллекта сделает поиск нужного контента более интуитивным и упростит процесс ручного поиска.

Gemini в Gmail
Пользователи Gmail смогут искать, обобщать и составлять свои электронные письма, используя технологию Gemini AI. Он также сможет выполнять действия с электронными письмами для более сложных задач, например находить квитанции и заполнять онлайн-формы.

Gemini 1.5 Pro
Еще одно обновление генеративного ИИ заключается в том, что Gemini теперь может анализировать более длинные документы, кодовые базы, видео и аудиозаписи, чем раньше. В закрытом предварительном просмотре новой версии Gemini 1.5 Pro, текущей флагманской модели компании, выяснилось, что она может принимать до 2 миллионов токенов. Это вдвое превышает предыдущую максимальную сумму. Благодаря этому уровню новая версия Gemini 1.5 Pro поддерживает самый большой ввод данных среди всех имеющихся на рынке моделей.

Gemini Live
Компания анонсировала новый интерфейс Gemini под названием Gemini Live, который позволяет пользователям вести «углубленный» голосовой чат с Gemini на своих смартфонах. Пользователи могут прерывать Gemini во время разговора чат-бота, чтобы задать уточняющие вопросы, и он адаптируется к их манере речи в реальном времени. А Gemini может видеть и реагировать на окружение пользователей с помощью фотографий или видео, снятых камерами их смартфонов.

На первый взгляд Live не кажется радикальным обновлением существующей технологии, отмечается в материале. Но Google утверждает, что использует новые методы из области генеративного искусственного интеллекта для обеспечения менее подверженного ошибкам анализа изображений — и сочетает эти методы с улучшенным речевым движком для более последовательных, эмоционально выразительных и реалистичных диалогов.

Gemini Nano
Google также встраивает Gemini Nano, самую маленькую из своих моделей искусственного интеллекта, непосредственно в настольный клиент Chrome, начиная с Chrome 126. Это, по словам компании, позволит разработчикам использовать модель на устройстве для реализации своих собственных функций искусственного интеллекта. Google планирует использовать эту новую возможность для реализации таких функций, как существующий инструмент «Help me write» из Workspace Lab в Gmail.

Gemini на Android
Gemini от Google на Android, замена искусственного интеллекта Google Assistant, вскоре воспользуется своей способностью глубоко интегрироваться с мобильной операционной системой Android и приложениями Google. Пользователи смогут перетаскивать изображения, созданные с помощью искусственного интеллекта, прямо в свои Gmail, Google Messages и другие приложения. Между тем, по словам Google, пользователи YouTube смогут нажать «Ask this video», чтобы найти конкретную информацию в этом видео YouTube.

Gemini на Google Maps
Возможности модели Gemini появятся на платформе Google Maps для разработчиков, начиная с API Places. Разработчики могут показывать генеративные описания мест и территорий с помощью искусственного интеллекта в своих приложениях и на веб-сайтах. Описания создаются на основе анализа Gemini данных сообщества Google Maps, насчитывающего более 300 миллионов участников. Разработчикам больше не придется писать собственные описания мест.

Процессоры получают прирост производительности
Google представил следующее, шестое поколение своих чипов искусственного интеллекта Tensor Processing Units (TPU). Названные Trillium, они будут запущены позднее в этом году. Новые TPU будут иметь прирост производительности вычислений на один чип в 4,7 раза по сравнению с пятым поколением. Кроме того, Trillium включает в себя третье поколение SparseCore, которое Google описывает как «специализированный ускоритель для обработки сверхбольших вложений, распространенных в расширенных рабочих нагрузках».

Project IDX
Project IDX, браузерная среда разработки следующего поколения, ориентированная на искусственный интеллект, сейчас находится в стадии открытого бета-тестирования.В этом обновлении реализована интеграция с платформой Google Maps в IDE, помогающая добавить функции геолокации в приложения, а также интеграция с Chrome Dev Tools и Lighthouse для облегчения отладки приложений. Вскоре Google также позволит развертывать приложения в Cloud Run, бессерверной платформе Google Cloud для запуска клиентских и серверных сервисов.

Veo
Google нацеливается на Sora от OpenAI с Veo, моделью искусственного интеллекта, которая может создавать видеоклипы 1080p продолжительностью около минуты при наличии текстовой подсказки. Veo может снимать различные в различных стилях, включая снимки пейзажей и замедленную съемку, а также вносить изменения и корректировки в уже созданные кадры.Он также основан на предварительной коммерческой работе Google в области создания видео, анонсированной в апреле, в которой использовалось семейство моделей генерации изображений Imagen 2 компании для создания зацикленных видеоклипов.

Функция «Circle to Search»
Функция «Circle to Search» на базе искусственного интеллекта, которая позволяет пользователям Android получать мгновенные ответы с помощью таких жестов, как обведение, теперь сможет решать более сложные задачи. Сервис создан для того, чтобы сделать взаимодействие с Google поиском более естественным посредством таких действий, как обведение, выделение, написание текста или нажатие.

Pixel 8a и Pixel Slate
Google не дождался конференции, чтобы продемонстрировать последнее дополнение к линейке смартфонов Pixel, и на прошлой неделе анонсировала новый Pixel 8a. Стоимость телефона начинается от 499 долларов. В модели, в частности, добавлен чип Tensor G3. Кроме того, уже доступен планшет Pixel Slate.