Google Gemini – что за зверь такой

Google Gemini — давно обещанное семейство моделей генеративного ИИ следующего поколения от Гугла. Оное разработано спецами DeepMind и Google Research.
Google Gemini представлено четырьмя вариантами didri.ru:
- Gemini Ultra, очень большая модель.
- Gemini Pro. Модель несколько меньше предыдущей.
- Gemini Flash, более быстрая, «дистиллированная» версия Pro.
- Gemini Nano, две небольшие модели: Nano-1 и немного более производительная Nano-2, работающая в автономном «плавании».
Все модели – мультимодальные. Другими словами, способны работать и анализировать не только текст. Google утверждает, что они были предварительно обучены и настроены на различных общедоступных:
- фирменных и лицензированных аудио, изображениях и видео;
- наборе кодовых баз; и тексте на разных языках.
Это отличает Gemini от таких моделей, как LaMDA от Google, которая была обучена исключительно на текстовых данных. LaMDA не может понимать или генерировать что-либо, выходящее за рамки текста.
Отметим, что этика и законность обучения моделей на публичных данных, в некоторых случаях без ведома или согласия владельцев данных, неясны. У Google есть политика возмещения ущерба ИИ, чтобы защитить определенных клиентов Google Cloud от судебных исков, если они с ними столкнутся, но эта политика содержит исключения.