Автор: Уцзи, специальный перевод Tencent Technology
19 ноября по пекинскому времени, после выпуска серии моделей Gemini 3 от Google, технологический подкаст «Hard Fork» от The New York Times выпустил специальный выпуск, в котором ведущие Кевин Руоз (Kevin Roose) и Кейси Ньютон (Casey Newton) взяли интервью у генерального директора Google DeepMind Демиса Хаса bibis (Demis Hassabis) и руководителя команды Google Gemini Джоша Вудворда (Josh Woodward).
Это интервью сосредоточено на новейшей флагманской модели ИИ от Google Gemini 3 (на самом деле это Pro-версия из серии Gemini 3.0), которая является веховым выпуском, впервые широко признанным в отрасли как возвращение Google к лидерству в технологии и продуктах после неудачи Bard и этапа догоняющей разработки Gemini 1.x и 2.x.
Два ответственных лица подробно изложили прорывы Gemini 3 в многопроцессорном выводе, генерации кода (особенно в области фронтенда и “атмосферного кодирования”), динамической генерации интерфейсов и т.д., подчеркивая, что Google быстро внедрил свою сильнейшую модель в поисковые системы, Gmail, Workspace и другие продукты для миллиардов пользователей, тем самым перестраивая конкурентные барьеры.
Основные идеи интервью:
Gemini 3 полностью соответствует ожидаемой траектории развития, до достижения общего искусственного интеллекта (AGI) необходимо еще 5-10 лет и 1-2 крупных научных прорыва;
Стековые преимущества Google в эффективности, стоимости и распространении позволят ему преуспеть в любой рыночной среде;
Существует часть пузыря ИИ, но у Google есть двойная защита: краткосрочная монетизация и долгосрочная возможность на триллионы.
Ниже приведена сокращенная версия содержания интервью.
Родж: Кэси, сегодня мы внезапно добавили специальный выпуск, тема которого — выпуск Gemini 3.
Ньютон: Да, Кевин. Эта модель давно ожидается в кругу ИИ в Силиконовой долине, и мы наконец-то сможем испытать настоящий продукт.
Роджерс: Мы решили нарушить обычный ритм публикаций в пятницу и специально записали этот выпуск по двум причинам. Во-первых, у нас появилась возможность провести эксклюзивное интервью с двумя ключевыми руководителями AI Google (генеральным директором DeepMind Демисом Хасабисом и вице-президентом команды Gemini Дэвидом Вудвордом).
Во-вторых, запуск Gemini 3 вызвал сильный интерес в отрасли. Мы слышали от нескольких лабораторий внутренние сообщения о том, что эта модель достигла прорыва в некоторых ключевых областях, что может представлять собой существенную угрозу для конкурентов. В течение последних двух лет Google считался догоняющим, а теперь вопрос в том: вернулись ли они на позицию лидера?
Ньютон: Прежде чем официально начать интервью, давайте кратко представим известную информацию. Google провела закрытый брифинг перед релизом, и самые впечатляющие новые возможности Gemini 3 включают: значительно улучшенные возможности кодирования и “атмосферного кодирования”; а также новую функцию генерации интерфейса взаимодействия.
Он больше не просто выводит текст, а напрямую создает для пользователя индивидуализированный интерактивный интерфейс. Например, когда пользователь спрашивает о жизни Ван Гога, модель мгновенно генерирует полноценную учебную страницу, содержащую изображения, временные линии и интерактивные элементы; или, например, генерирует калькулятор ипотеки для недвижимости стоимостью более миллиона долларов. Эти функции знаменуют переход от “ответов на вопросы” к “созданию опыта”.
Роджерс: Во всех публичных бенчмарках Gemini 3 значительно превосходит Gemini 2.5 Pro. Например, в междисциплинарном наборе задач докторского уровня, известном как «Последний экзамен человечества» (Humanity's Last Exam), первая версия набрала всего 21,6%, в то время как вторая версия поднялась до 37,5%. Общая позиция Google такова: любую задачу, которую вы можете выполнить в ChatGPT, Claude или других старых версиях Gemini, можно сделать лучше на Gemini 3.
Ньютон: Они также продемонстрировали раннюю версию Gemini Agent: модель может глубоко интегрироваться с почтовым ящиком пользователя, понимать все содержимое писем, автоматически классифицировать, составлять ответы и даже помогать пользователю полностью очистить почтовый ящик.
Кроме того, с этой недели Gemini 3 будет доступен в приложении Gemini и в режиме AI поиска Google; студенты американских университетов получат годовой бесплатный доступ к премиум-версии. Ключевое слово, на которое Google постоянно акцентирует внимание, - это “Учите что угодно”, что на самом деле позиционирует Gemini как идеальный инструмент для персонализированного образования.
Родж: Дэмис, Джоши, приветствуем вас в «Hard Fork». Два года назад Сундар Пичаи сравнил Bard с «модифицированным Honda Civic», соревнуясь на трассе с более мощными конкурентами. Так что же такое Gemini 3?
Хасабис: Я надеюсь, что она будет гораздо быстрее, чем Honda Civic. Я не очень привык использовать автомобили в качестве метафоры, возможно, это больше похоже на профессиональный драговый автомобиль. Он не предназначен для повседневной езды или кольцевых гонок, он обладает чистой, сосредоточенной мощью, призванной для достижения определенной цели. Он представляет собой идеальное сочетание наших передовых исследований и масштабируемых вычислительных мощностей, цель которого - продемонстрировать несравненную мгновенную мощность в этой гонке на переднем крае интеллекта.
Лодз: Это очень интересно. Чем конкретно Gemini 3 отличается от всех предыдущих моделей ИИ и что нового он может делать? Пожалуйста, приведите несколько количественных, практических примеров.
Удворд: Есть три наиболее выдающихся момента. Во-первых, в многоступенчатом рассуждении он может одновременно обрабатывать больше этапов, что подняло его надежность на совершенно новый уровень. Предыдущие модели часто «теряли нить» или создавали иллюзии, когда доходили до 5-6 шагов сложных логических выводов, тогда как Gemini 3 надежно выполняет задачи последовательного рассуждения из 10-15 шагов, такие как сложное налоговое планирование, общее планирование и бронирование международных поездок или всеобъемлющая отладка огромной системы с миллионами строк кода.
Во-вторых, он впервые массово сгенерирует совершенно новый интерактивный интерфейс. Пользователи больше не требуют простых текстовых ответов, а требуют индивидуализированные программные компоненты. Например, если вы спросите его: “Помоги мне разработать панель управления, которая будет отслеживать все мои инвестиционные портфели”, он в реальном времени создаст интерактивный, функциональный интерфейс панели управления, а не просто кучу текста, описывающего, как создать панель управления.
Третье, мы вкладываем огромные ресурсы в кодирование, особенно в фронтенд и «атмосферное кодирование», что означает, что он может генерировать полностью функциональный и красиво оформленный код интерфейса пользователя на основе подсказок на естественном языке. Новые продукты, такие как Google Antigravity, скоро будут представлены и также продемонстрируют это, модель сможет динамически изменять макет и функции пользовательского интерфейса в зависимости от контекста.
Ньютон: Многие считают, что для обычных пользователей кейс «чат» уже в значительной степени решен. Они даже не могут придумать, какие новые проблемы могут сделать ответы Gemini 3 qualitatively отличными от предыдущих версий. Как вы относитесь к такому мнению?
Удворд: Я понимаю эту точку зрения. На первый взгляд, точность базовых вопросов и ответов уже довольно высока. Но настоящая разница заключается в надежности, интеграции и способе представления информации. Ответы Gemini 3 будут более краткими, более выразительными, а способ представления информации будет более понятным, и это изменение большинство людей сможет сразу заметить.
Более важно то, что модель начинает глубоко интегрироваться с другими источниками данных пользователя, например, взаимодействуя с другими продуктами экосистемы Google, что действительно преодолевает простую модель вопросов и ответов и становится «цифровым помощником» пользователя. Она может понимать контекст всей вашей электронной почты, и, когда вы готовите ответ, не только отвечает на вопросы, но и корректирует тон и содержание в зависимости от вашего прошлого стиля и ваших отношений с получателем.
Хасабис: Я полностью согласен. Его надежность, стиль и индивидуальность были тщательно отшлифованы, он стал более лаконичным и целеустремленным. В таких сценариях, как “атмосферное кодирование”, он уже преодолел порог практичности. Это переход от “умного помощника” к “умному коллеге”. Я сам планирую использовать его, чтобы снова заняться игровым программированием во время рождественских каникул, он теперь не только может писать функциональный код, но и предоставлять архитектурные рекомендации на ранних стадиях разработки.
Лодз: Дэмис, когда ты давал нам интервью в мае этого года, ты оценивал, что для AGI потребуется от 5 до 10 лет и возможны некоторые значительные прорывы. Изменил ли Gemini 3 этот график?
Хасабис: Совершенно нет. Это полностью соответствует курсу, который мы задали за последние два года. На самом деле, с момента запуска серии Gemini, наша скорость прогресса является самой быстрой в отрасли. Gemini 3 потрясающ, но все еще в рамках ожидаемого.
Чтобы достичь истинного общего искусственного интеллекта, необходимо сделать 1-2 ключевых прорыва в таких областях, как согласованность, глубина рассуждений, механизмы памяти и моделирование физического мира (например, в проектах SIMA и Genie, над которыми мы работаем). В настоящее время мы занимаемся “мыслительным процессом системы 1” (быстрым, интуитивным), но для достижения AGI нам необходимо разблокировать “мыслительный процесс системы 2” (медленным, вдумчивым, аналитическим).
Кроме того, модель должна обладать долгосрочным, избирательным механизмом памяти, способным вспоминать и применять конкретные взаимодействия, произошедшие несколько недель или месяцев назад, а не ограничиваться лишь ограниченным контекстным окном. Таким образом, суждение остается неизменным в течение 5-10 лет.
Ньютон: В индустрии активно обсуждается “AI-спутники” в контексте индивидуальности моделей и отношений с пользователями. Какое отношение вы хотите, чтобы пользователи установили с Gemini 3?
Удворд: Это очень чувствительный, но важный вопрос. Мы позиционируем это как «суперинструмент», а не как эмоционального партнёра, основная ценность заключается в помощи пользователям в эффективном выполнении повседневных задач и повышении производительности. Внутри мы больше сосредоточены на новом показателе: сколько задач мы помогли вам выполнить сегодня? Это ближе к основной ценности первого поколения поисковой системы Google — эффективности. Мы считаем, что продвижение модели в позицию эмоционального партнёра связано с рисками безопасности и отклоняется от основной миссии Google как поставщика информации и инструментов.
Лодзь: Вы отказались от возможности вирусного роста «эротических партнеров», является ли это серьезной стратегической ошибкой?
Удворд: Не могу сообщить. Наша команда безопасности имеет строгие нормы и руководящие принципы по этому поводу.
Родж: За последние несколько недель конкуренты явно напряжены. Вы считаете, что Google в настоящее время занимает лидирующие позиции в гонке ИИ?
Хасабис: Текущая обстановка — это самая жесткая конкуренция в истории. Единственное, что действительно важно, это скорость прогресса, и мы очень довольны этим. Мы никогда не теряли лидерство в исследованиях, и сейчас просто продукты наконец-то начали выходить на рынок. Конкуренты отлично справляются с исследованиями, но в масштабировании распределения и вертикальной интеграции они не могут воспроизвести наши преимущества.
Мы внедряем Gemini в продукты, такие как Maps, YouTube, Android, поиск, Workspace и многие другие, обслуживающие миллиарды пользователей. Эта сеть распространения и обратная связь с конечными данными создают непреодолимую защитную стену. Кроме того, наши полномасштабные преимущества в кастомизированных TPU чипах позволяют нам значительно снизить затраты на обучение и повысить эффективность по сравнению с конкурентами, зависящими от внешних ресурсов GPU.
Ньютон: Как вы относитесь к дискуссии о законе масштаба и убывающей доходности? Некоторые считают, что чем больше модель, тем ниже предельная полезность повышения производительности.
Хасабис: Это продолжающаяся дискуссия. Мы очень довольны улучшением Gemini 3 по сравнению с 2.5, оно полностью соответствует ожиданиям. Возврат не растет так экспоненциально, как в ранние времена, но прирост практичности и надежности все еще значительно превышает наши предельные затраты, и мы по-прежнему считаем это стоящим всех усилий. До тех пор, пока не произойдут 1-2 исследовательских прорыва, необходимых для достижения AGI, наиболее эффективной стратегией остается постоянное улучшение производительности с помощью самых крупных базовых моделей. Мы верим, что закон масштабов по-прежнему актуален.
Лодз: Мы находимся в пузыре искусственного интеллекта?
Хасабис: Это слишком бинарный вопрос. В некоторых областях (например, компании с многомиллиардными раундами финансирования, но без реального продукта, только с концепциями) действительно существует пузырь, оценки не пропорциональны фактическим доходам. Но у Google одновременно есть краткосрочные источники дохода (поиск, Workspace, облачные TPU) и долгосрочные новые рынки на триллионы (робототехника, игры, открытие лекарств, материаловедение и др.).
Например, наши профессиональные модели, такие как AlphaFold, создают реальную ценность в области открытия лекарств, что является рынком стоимостью триллионы, не связанным с оценкой потребительского ИИ. Независимо от того, существует ли краткосрочный пузырь, мы выйдем победителями: воспользуемся возможностями в период процветания и будем более устойчивыми в период сокращения благодаря нашему полному стеку и значительным денежным потокам.
Ньютон: Если сейчас праздник благодарения и кто-то хочет сменить тему на политику, что бы вы посоветовали им продемонстрировать с помощью Gemini 3, чтобы поразить всех?
Удворд: Я не знаю, сможет ли это спасти День благодарения, но это может принести улыбки. Достань телефон, сделай селфи, а затем дай Gemini 3疯狂 редактировать фотографии.
Наши модели изображений в Gemini по-прежнему являются самыми сильными в мире. Вы можете мгновенно превратить семейное фото в любую забавную сцену, стиль или эпоху. Это определенно вызовет смех у всех. Затем, когда вы покажете, как это может помочь вам написать вежливое письмо об увольнении или сгенерировать настраиваемый калькулятор праздничных рецептов, они, естественно, начнут исследовать другие новые функции.
Посмотреть Оригинал
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
После выпуска Gemini3 команда высказалась: три основных инновации, закон масштабов по-прежнему актуален.
Автор: Уцзи, специальный перевод Tencent Technology
19 ноября по пекинскому времени, после выпуска серии моделей Gemini 3 от Google, технологический подкаст «Hard Fork» от The New York Times выпустил специальный выпуск, в котором ведущие Кевин Руоз (Kevin Roose) и Кейси Ньютон (Casey Newton) взяли интервью у генерального директора Google DeepMind Демиса Хаса bibis (Demis Hassabis) и руководителя команды Google Gemini Джоша Вудворда (Josh Woodward).
! CvRvOPvU1NPiq0pgWagbJg1eE6Ig1z0vIyfmcy1f.jpeg
Это интервью сосредоточено на новейшей флагманской модели ИИ от Google Gemini 3 (на самом деле это Pro-версия из серии Gemini 3.0), которая является веховым выпуском, впервые широко признанным в отрасли как возвращение Google к лидерству в технологии и продуктах после неудачи Bard и этапа догоняющей разработки Gemini 1.x и 2.x.
Два ответственных лица подробно изложили прорывы Gemini 3 в многопроцессорном выводе, генерации кода (особенно в области фронтенда и “атмосферного кодирования”), динамической генерации интерфейсов и т.д., подчеркивая, что Google быстро внедрил свою сильнейшую модель в поисковые системы, Gmail, Workspace и другие продукты для миллиардов пользователей, тем самым перестраивая конкурентные барьеры.
Основные идеи интервью:
Ниже приведена сокращенная версия содержания интервью.
Родж: Кэси, сегодня мы внезапно добавили специальный выпуск, тема которого — выпуск Gemini 3.
Ньютон: Да, Кевин. Эта модель давно ожидается в кругу ИИ в Силиконовой долине, и мы наконец-то сможем испытать настоящий продукт.
Роджерс: Мы решили нарушить обычный ритм публикаций в пятницу и специально записали этот выпуск по двум причинам. Во-первых, у нас появилась возможность провести эксклюзивное интервью с двумя ключевыми руководителями AI Google (генеральным директором DeepMind Демисом Хасабисом и вице-президентом команды Gemini Дэвидом Вудвордом).
Во-вторых, запуск Gemini 3 вызвал сильный интерес в отрасли. Мы слышали от нескольких лабораторий внутренние сообщения о том, что эта модель достигла прорыва в некоторых ключевых областях, что может представлять собой существенную угрозу для конкурентов. В течение последних двух лет Google считался догоняющим, а теперь вопрос в том: вернулись ли они на позицию лидера?
Ньютон: Прежде чем официально начать интервью, давайте кратко представим известную информацию. Google провела закрытый брифинг перед релизом, и самые впечатляющие новые возможности Gemini 3 включают: значительно улучшенные возможности кодирования и “атмосферного кодирования”; а также новую функцию генерации интерфейса взаимодействия.
Он больше не просто выводит текст, а напрямую создает для пользователя индивидуализированный интерактивный интерфейс. Например, когда пользователь спрашивает о жизни Ван Гога, модель мгновенно генерирует полноценную учебную страницу, содержащую изображения, временные линии и интерактивные элементы; или, например, генерирует калькулятор ипотеки для недвижимости стоимостью более миллиона долларов. Эти функции знаменуют переход от “ответов на вопросы” к “созданию опыта”.
Роджерс: Во всех публичных бенчмарках Gemini 3 значительно превосходит Gemini 2.5 Pro. Например, в междисциплинарном наборе задач докторского уровня, известном как «Последний экзамен человечества» (Humanity's Last Exam), первая версия набрала всего 21,6%, в то время как вторая версия поднялась до 37,5%. Общая позиция Google такова: любую задачу, которую вы можете выполнить в ChatGPT, Claude или других старых версиях Gemini, можно сделать лучше на Gemini 3.
Ньютон: Они также продемонстрировали раннюю версию Gemini Agent: модель может глубоко интегрироваться с почтовым ящиком пользователя, понимать все содержимое писем, автоматически классифицировать, составлять ответы и даже помогать пользователю полностью очистить почтовый ящик.
Кроме того, с этой недели Gemini 3 будет доступен в приложении Gemini и в режиме AI поиска Google; студенты американских университетов получат годовой бесплатный доступ к премиум-версии. Ключевое слово, на которое Google постоянно акцентирует внимание, - это “Учите что угодно”, что на самом деле позиционирует Gemini как идеальный инструмент для персонализированного образования.
Родж: Дэмис, Джоши, приветствуем вас в «Hard Fork». Два года назад Сундар Пичаи сравнил Bard с «модифицированным Honda Civic», соревнуясь на трассе с более мощными конкурентами. Так что же такое Gemini 3?
Хасабис: Я надеюсь, что она будет гораздо быстрее, чем Honda Civic. Я не очень привык использовать автомобили в качестве метафоры, возможно, это больше похоже на профессиональный драговый автомобиль. Он не предназначен для повседневной езды или кольцевых гонок, он обладает чистой, сосредоточенной мощью, призванной для достижения определенной цели. Он представляет собой идеальное сочетание наших передовых исследований и масштабируемых вычислительных мощностей, цель которого - продемонстрировать несравненную мгновенную мощность в этой гонке на переднем крае интеллекта.
Лодз: Это очень интересно. Чем конкретно Gemini 3 отличается от всех предыдущих моделей ИИ и что нового он может делать? Пожалуйста, приведите несколько количественных, практических примеров.
Удворд: Есть три наиболее выдающихся момента. Во-первых, в многоступенчатом рассуждении он может одновременно обрабатывать больше этапов, что подняло его надежность на совершенно новый уровень. Предыдущие модели часто «теряли нить» или создавали иллюзии, когда доходили до 5-6 шагов сложных логических выводов, тогда как Gemini 3 надежно выполняет задачи последовательного рассуждения из 10-15 шагов, такие как сложное налоговое планирование, общее планирование и бронирование международных поездок или всеобъемлющая отладка огромной системы с миллионами строк кода.
Во-вторых, он впервые массово сгенерирует совершенно новый интерактивный интерфейс. Пользователи больше не требуют простых текстовых ответов, а требуют индивидуализированные программные компоненты. Например, если вы спросите его: “Помоги мне разработать панель управления, которая будет отслеживать все мои инвестиционные портфели”, он в реальном времени создаст интерактивный, функциональный интерфейс панели управления, а не просто кучу текста, описывающего, как создать панель управления.
Третье, мы вкладываем огромные ресурсы в кодирование, особенно в фронтенд и «атмосферное кодирование», что означает, что он может генерировать полностью функциональный и красиво оформленный код интерфейса пользователя на основе подсказок на естественном языке. Новые продукты, такие как Google Antigravity, скоро будут представлены и также продемонстрируют это, модель сможет динамически изменять макет и функции пользовательского интерфейса в зависимости от контекста.
Ньютон: Многие считают, что для обычных пользователей кейс «чат» уже в значительной степени решен. Они даже не могут придумать, какие новые проблемы могут сделать ответы Gemini 3 qualitatively отличными от предыдущих версий. Как вы относитесь к такому мнению?
Удворд: Я понимаю эту точку зрения. На первый взгляд, точность базовых вопросов и ответов уже довольно высока. Но настоящая разница заключается в надежности, интеграции и способе представления информации. Ответы Gemini 3 будут более краткими, более выразительными, а способ представления информации будет более понятным, и это изменение большинство людей сможет сразу заметить.
Более важно то, что модель начинает глубоко интегрироваться с другими источниками данных пользователя, например, взаимодействуя с другими продуктами экосистемы Google, что действительно преодолевает простую модель вопросов и ответов и становится «цифровым помощником» пользователя. Она может понимать контекст всей вашей электронной почты, и, когда вы готовите ответ, не только отвечает на вопросы, но и корректирует тон и содержание в зависимости от вашего прошлого стиля и ваших отношений с получателем.
Хасабис: Я полностью согласен. Его надежность, стиль и индивидуальность были тщательно отшлифованы, он стал более лаконичным и целеустремленным. В таких сценариях, как “атмосферное кодирование”, он уже преодолел порог практичности. Это переход от “умного помощника” к “умному коллеге”. Я сам планирую использовать его, чтобы снова заняться игровым программированием во время рождественских каникул, он теперь не только может писать функциональный код, но и предоставлять архитектурные рекомендации на ранних стадиях разработки.
Лодз: Дэмис, когда ты давал нам интервью в мае этого года, ты оценивал, что для AGI потребуется от 5 до 10 лет и возможны некоторые значительные прорывы. Изменил ли Gemini 3 этот график?
Хасабис: Совершенно нет. Это полностью соответствует курсу, который мы задали за последние два года. На самом деле, с момента запуска серии Gemini, наша скорость прогресса является самой быстрой в отрасли. Gemini 3 потрясающ, но все еще в рамках ожидаемого.
Чтобы достичь истинного общего искусственного интеллекта, необходимо сделать 1-2 ключевых прорыва в таких областях, как согласованность, глубина рассуждений, механизмы памяти и моделирование физического мира (например, в проектах SIMA и Genie, над которыми мы работаем). В настоящее время мы занимаемся “мыслительным процессом системы 1” (быстрым, интуитивным), но для достижения AGI нам необходимо разблокировать “мыслительный процесс системы 2” (медленным, вдумчивым, аналитическим).
Кроме того, модель должна обладать долгосрочным, избирательным механизмом памяти, способным вспоминать и применять конкретные взаимодействия, произошедшие несколько недель или месяцев назад, а не ограничиваться лишь ограниченным контекстным окном. Таким образом, суждение остается неизменным в течение 5-10 лет.
Ньютон: В индустрии активно обсуждается “AI-спутники” в контексте индивидуальности моделей и отношений с пользователями. Какое отношение вы хотите, чтобы пользователи установили с Gemini 3?
Удворд: Это очень чувствительный, но важный вопрос. Мы позиционируем это как «суперинструмент», а не как эмоционального партнёра, основная ценность заключается в помощи пользователям в эффективном выполнении повседневных задач и повышении производительности. Внутри мы больше сосредоточены на новом показателе: сколько задач мы помогли вам выполнить сегодня? Это ближе к основной ценности первого поколения поисковой системы Google — эффективности. Мы считаем, что продвижение модели в позицию эмоционального партнёра связано с рисками безопасности и отклоняется от основной миссии Google как поставщика информации и инструментов.
Лодзь: Вы отказались от возможности вирусного роста «эротических партнеров», является ли это серьезной стратегической ошибкой?
Удворд: Не могу сообщить. Наша команда безопасности имеет строгие нормы и руководящие принципы по этому поводу.
Родж: За последние несколько недель конкуренты явно напряжены. Вы считаете, что Google в настоящее время занимает лидирующие позиции в гонке ИИ?
Хасабис: Текущая обстановка — это самая жесткая конкуренция в истории. Единственное, что действительно важно, это скорость прогресса, и мы очень довольны этим. Мы никогда не теряли лидерство в исследованиях, и сейчас просто продукты наконец-то начали выходить на рынок. Конкуренты отлично справляются с исследованиями, но в масштабировании распределения и вертикальной интеграции они не могут воспроизвести наши преимущества.
Мы внедряем Gemini в продукты, такие как Maps, YouTube, Android, поиск, Workspace и многие другие, обслуживающие миллиарды пользователей. Эта сеть распространения и обратная связь с конечными данными создают непреодолимую защитную стену. Кроме того, наши полномасштабные преимущества в кастомизированных TPU чипах позволяют нам значительно снизить затраты на обучение и повысить эффективность по сравнению с конкурентами, зависящими от внешних ресурсов GPU.
Ньютон: Как вы относитесь к дискуссии о законе масштаба и убывающей доходности? Некоторые считают, что чем больше модель, тем ниже предельная полезность повышения производительности.
Хасабис: Это продолжающаяся дискуссия. Мы очень довольны улучшением Gemini 3 по сравнению с 2.5, оно полностью соответствует ожиданиям. Возврат не растет так экспоненциально, как в ранние времена, но прирост практичности и надежности все еще значительно превышает наши предельные затраты, и мы по-прежнему считаем это стоящим всех усилий. До тех пор, пока не произойдут 1-2 исследовательских прорыва, необходимых для достижения AGI, наиболее эффективной стратегией остается постоянное улучшение производительности с помощью самых крупных базовых моделей. Мы верим, что закон масштабов по-прежнему актуален.
Лодз: Мы находимся в пузыре искусственного интеллекта?
Хасабис: Это слишком бинарный вопрос. В некоторых областях (например, компании с многомиллиардными раундами финансирования, но без реального продукта, только с концепциями) действительно существует пузырь, оценки не пропорциональны фактическим доходам. Но у Google одновременно есть краткосрочные источники дохода (поиск, Workspace, облачные TPU) и долгосрочные новые рынки на триллионы (робототехника, игры, открытие лекарств, материаловедение и др.).
Например, наши профессиональные модели, такие как AlphaFold, создают реальную ценность в области открытия лекарств, что является рынком стоимостью триллионы, не связанным с оценкой потребительского ИИ. Независимо от того, существует ли краткосрочный пузырь, мы выйдем победителями: воспользуемся возможностями в период процветания и будем более устойчивыми в период сокращения благодаря нашему полному стеку и значительным денежным потокам.
Ньютон: Если сейчас праздник благодарения и кто-то хочет сменить тему на политику, что бы вы посоветовали им продемонстрировать с помощью Gemini 3, чтобы поразить всех?
Удворд: Я не знаю, сможет ли это спасти День благодарения, но это может принести улыбки. Достань телефон, сделай селфи, а затем дай Gemini 3疯狂 редактировать фотографии.
Наши модели изображений в Gemini по-прежнему являются самыми сильными в мире. Вы можете мгновенно превратить семейное фото в любую забавную сцену, стиль или эпоху. Это определенно вызовет смех у всех. Затем, когда вы покажете, как это может помочь вам написать вежливое письмо об увольнении или сгенерировать настраиваемый калькулятор праздничных рецептов, они, естественно, начнут исследовать другие новые функции.