Исследователи OpenAI: системы ИИ могут справиться с большей частью исследовательской работы в течение двух лет

Сообщение Gate News, 29 апреля — исследователи OpenAI Сэбастьен Бьюбек и Эрнест Рю заявляют, что системы ИИ смогут выполнять большую часть человеческой исследовательской работы в течение двух лет, представляя математику как четкий показатель прогресса ИИ. В отличие от расплывчатых тестов производительности, математические задачи дают точную верификацию: ответы либо правильные, либо неправильные, не оставляя места для двусмысленности.

Бьюбек отметил, что истинное мышление ИИ требует способности выдерживать длинные цепочки рассуждений. Одна ошибка в многошаговом аргументе рушит все доказательство, делая обнаружение и исправление ошибок по ходу процесса главной целью для продвинутых моделей. Внутренние лаборатории OpenAI уже сгенерировали более десяти полностью новых теорем, пригодных для публикации в ведущих журналах по комбинаторике, демонстрируя, что ИИ теперь создает действительно оригинальные, прорывные работы, выходя за рамки простого комбинирования уже существующих статей.

Однако устойчивые научные прорывы требуют постоянного сосредоточения на протяжении недель тестирования. Текущие системы все еще нуждаются в строгом человеческом надзоре, чтобы направлять и проверять каждую смену курса. Бьюбек использует выражение “время для достижения AGI” (AGI time), чтобы измерить, как долго модель может независимо имитировать человеческое мышление; текущие системы работают примерно от нескольких дней до одной недели, а цель индустрии — недели или месяцы, чтобы обеспечить автономную работу в таких областях, как биология.

Долговременная память критически важна для этого будущего. Обычные окна чата ограничивают глубину — сложные математические доказательства часто превышают 50 страниц — тогда как репозитории кода показывают, как расширенные сессии работы позволяют вести более глубокое решение задач. По мере того как ИИ получает больше независимости и памяти, человеческая экспертиза становится более ценной, а не менее. Работникам нужно сохранять глубокие базовые знания, чтобы оспаривать и верифицировать ответы машины, а организациям потребуются новые автоматизированные фильтры и системы репутации, чтобы поддерживать доверие в условиях потока научных исследований, дополненных ИИ.

Отказ от ответственности: Информация на этой странице может поступать от третьих лиц и не отражает взгляды или мнения Gate. Содержание, представленное на этой странице, предназначено исключительно для справки и не является финансовой, инвестиционной или юридической консультацией. Gate не гарантирует точность или полноту информации и не несет ответственности за любые убытки, возникшие от использования этой информации. Инвестиции в виртуальные активы несут высокие риски и подвержены значительной ценовой волатильности. Вы можете потерять весь инвестированный капитал. Пожалуйста, полностью понимайте соответствующие риски и принимайте разумные решения, исходя из собственного финансового положения и толерантности к риску. Для получения подробностей, пожалуйста, обратитесь к Отказу от ответственности.

Связанные статьи

Стоимость китайской токенизации у Claude на 65% выше, чем у английского; у OpenAI только на 15% больше

Gate News сообщение, 29 апреля — исследователь ИИ Аран Комацузаки провел сравнительный анализ эффективности токенизации на шести основных ИИ-моделях, переведя основополагающую работу Рича Саттона "The Bitter Lesson" на девять языков

GateNews10м назад

Аналитики по полупроводникам настроены оптимистично по поводу рынка ИИ: «как минимум еще на три года» — передовая упаковка является главной «узкой» частью отрасли

Bubble Boi указывает, что инвестиционный цикл ИИ все еще находится на ранней стадии, и ожидает по крайней мере еще три года роста, при этом он не планирует фиксировать прибыль. Он считает, что передовая упаковка — это действительно узкое место в полупроводниках; необходимо в рамках одной и той же упаковки интегрировать больше HBM и более крупные кристаллы. Он настроен оптимистично по NAND/Flash: цены могут продолжать расти, и в будущем, возможно, будет добавлена флэш-поставка. Личная стратегия — занимать средства для докупки, и, опираясь на инженерный практический опыт, понимать технические детали, считая, что это является преимуществом.

ChainNewsAbmedia23м назад

AWS расширяет интеграцию OpenAI в Amazon Bedrock

Amazon Web Services объявила 29 апреля о существенном расширении своего партнерства с OpenAI, интегрировав новейшие возможности OpenAI в свою облачную инфраструктуру. Расширение добавляет три новых предложения в Amazon Bedrock: новейшие модели OpenAI (ограниченный превью), программирование Codex

CryptoFrontier35м назад

Король Карл III встретился с шестью руководителями техсектора США, включая Дженсена Хуанга, Джеффа Безоса и Тима Кука, чтобы обсудить финансирование стартапов в Великобритании

Сообщение Gate News, 29 апреля — Во время своего государственного визита в Соединенные Штаты король Карл III встретился с шестью известными американскими лидерами технологической отрасли в Blair House в Вашингтоне: генеральным директором NVIDIA Дженсеном Хуангом, основателем Amazon Джеффом Безосом, генеральным директором Apple Тимом Куком, генеральным директором AMD Су Цзифэнем, генеральным директором Salesforce Марком Бениоффом и президентом Alphabet Рут Пора:

GateNews1ч назад

Поставки глобальных AR-умных очков взлетели на 98% в 2025 году благодаря дисплею Meta Ray-Ban и волноводной технологии

Сообщение Gate News, 29 апреля — поставки глобальных умных очков дополненной реальности (AR) выросли на 98% в 2025 году: во втором полугодии поставки увеличились на 148% в годовом исчислении, согласно Counterpoint Research. Рост был обусловлен расширением производства

GateNews1ч назад

Легендарный трейдер хедж-фонда рассказал о P/E американского рынка: тем, кто в ближайшие несколько лет будет покупать широкий рынок, будет очень трудно получить прибыль

Менеджер хедж-фонда Пол Тюдор Джонс (Джонс) в ходе интервью предупреждает, что нормативно-правовые пробелы в отношении ИИ могут привести к катастрофическим последствиям, поскольку они несут риски, невиданные прежде, из-за модели «разрушение—итерация». Также он отмечает, что доля рыночной капитализации США в ВВП достигает 252%, а коэффициент цена/прибыль завышен; в долгосрочной перспективе инвестировать в широкий рынок без прибыли будет сложно. Он приводит в пример бокс, говоря, что возможностей для торговли немного, и призывает к глобальному сотрудничеству для выработки регулирования ИИ.

ChainNewsAbmedia1ч назад
комментарий
0/400
Нет комментариев