Google анонсувала Gemini 2.5, нову родину міркуючих ШІ-моделей. Флагман Gemini 2.5 Pro — це мультимодальна модель із вбудованими можливостями «мислення», що дозволяють аналізувати інформацію, робити логічні висновки та вирішувати складні завдання з огляду на контекст. Google стверджує, що всі майбутні моделі сімейства Gemini 2.5 будуть мати такі здібності.
Порівняно з попередніми моделями, як Gemini 2.0 Flash Thinking, нова версія демонструє значний прогрес. Gemini 2.5 Pro лідирує у тестах LMArena (переваги користувачів), AIME 2025 (математика) та GPQA diamond (наука), а також займає перше місце з результатом 18,8% у тесті Humanity's Last Exam, що оцінює знання та міркування на рівні людської межі.

В області програмування модель показує стрибок у порівнянні з Gemini 2.0: у тесті SWE-Bench Verified нова ШІ-модель набрала 63,8%, обійшовши OpenAI o3-mini та DeepSeek R1, хоча поступилася Claude 3.7 Sonnet від Anthropic (70,3%). А у тесті Aider Polyglot (редагування коду) вона показала 68,6%, перевершивши провідні моделі конкурентів.

Gemini 2.5 Pro підтримує контекстне вікно в 1 млн токенів, а скоро ліміт збільшуватиме до 2 мільйонів. Це дозволяє моделі обробляти величезні обсяги даних, включаючи текст, аудіо, зображення, відео та цілі репозиторії коду.
Google позиціонує Gemini 2.5 як відповідь на моделі типу o1 від OpenAI, підкреслюючи її потенціал для майбутніх ШІ-агентів, здатних виконувати завдання автономно.