Сообщение Gate News, 23 апреля — исследователи Google, включая Хэ Кайминга и Се Сайнина, опубликовали работу, представляющую Vision Banana — универсальную модель понимания изображений, созданную с помощью легкой инструкции по дообучению для уточнения на компании Nano Banana Pro (Gemini 3 Pro Image) модель генерации изображений. Ключевое нововведение унифицирует выходы всех задач компьютерного зрения в виде RGB-изображений, позволяя выполнять сегментацию, оценку глубины и предсказание нормалей поверхности посредством генерации изображений без специализированных архитектур или функций потерь.
В семантической сегментации Vision Banana превзошла специализированную модель SAM 3 на 4,7 процентного пункта на Cityscapes; в сегментации по референсному выражению она обошла SAM 3 Agent. Однако в инстанс-сегментации она уступила SAM 3. Для 3D-задач метрическая оценка глубины достигла 0,929 средней точности на четырех стандартных наборах данных, превзойдя Depth Anything V3 с 0,918, используя только синтетические данные без реальной информации о глубине или параметров камеры на этапе инференса. Оценка нормалей поверхности достигла уровня лучших на сегодняшний день результатов на трех внутренних бенчмарках.
Дообучение включало минимальный объем данных по задачам зрения, смешанный с исходным обучением генерации изображений, сохраняя способность модели к генерации — производительность совпала с оригинальной Nano Banana Pro в тестах качества генерации. В работе предлагается, что предварительное обучение генерации изображений в зрении параллельно предварительному обучению генерации текста в языке: модели учатся внутренним представлениям, необходимым для понимания изображений, во время генерации, а инструкционное дообучение лишь высвобождает эту возможность.
Отказ от ответственности: Информация на этой странице может поступать от третьих лиц и не отражает взгляды или мнения Gate. Содержание, представленное на этой странице, предназначено исключительно для справки и не является финансовой, инвестиционной или юридической консультацией. Gate не гарантирует точность или полноту информации и не несет ответственности за любые убытки, возникшие от использования этой информации. Инвестиции в виртуальные активы несут высокие риски и подвержены значительной ценовой волатильности. Вы можете потерять весь инвестированный капитал. Пожалуйста, полностью понимайте соответствующие риски и принимайте разумные решения, исходя из собственного финансового положения и толерантности к риску. Для получения подробностей, пожалуйста, обратитесь к
Отказу от ответственности.
Связанные статьи
SpaceX оценивает общую доступную рыночную нишу в $28.5 трлн, при этом $26.5T будет приходиться на сектор ИИ
Сообщение Gate News, 23 апреля — SpaceX оценивает свою общую доступную рыночную нишу (TAM) в $28.5 трлн, согласно внутренним документам. Компания прогнозирует, что более 90% рынка, примерно $26.5 трлн, будет приходиться на искусственный интеллект.
Ожидается, что корпоративный ИИ будет занимать основную часть возможностей рынка ИИ, представляя примерно $22.7 трлн от общего TAM.
GateNews1м назад
«Книга Нэвала» Naval запускает AI-фонд USVC, розничные инвесторы тоже могут инвестировать в OpenAI, Anthropic до IPO
Известный венчурный инвестор Силиконовой долины Naval, под управлением которого работает AngelList, недавно запустил новый фонд под названием USVC. Фонд ориентирован на то, чтобы обычные инвесторы могли косвенно участвовать в OpenAI, Anthropic, xAI, Vercel, Crusoe, Sierra и Legora и других популярных непубличных технологических компаниях, при этом входной порог составляет всего минимум 500 долларов.
Официально его подают как «инвестиции в компании будущего до того, как всё станет очевидным», и подчеркивают, что это фонд, открытый для всех инвесторов, без необходимости иметь статус квалифицированного инвестора. Он пытается превратить венчурные активы, которые раньше были доступны только богатым и людям из круга, в продукт, к которому могут получить доступ и розничные инвесторы.
Инвестировать в ранние AI-компании можно уже за 500 долларов
Ключевая история USVC очень прямолинейна: когда всё больше звездных стартапов выбирают оставаться на частном рынке в течение длительного времени, по-настоящему взрывной рост оценок зачастую происходит в I
ChainNewsAbmedia7м назад
Tesla приобретет компанию по оборудованию для ИИ на сумму до $2 миллиарда
Сообщение Gate News, 23 апреля — Tesla объявила 23 апреля, что договорилась приобрести компанию по аппаратному обеспечению для искусственного интеллекта на сумму до $2 миллиарда в виде обыкновенных акций Tesla и вознаграждений в акциях.
Приблизительно $1.8 миллиарда
GateNews10м назад
Топовая юридическая фирма взимает более 2000 долларов США в час, судебные документы разоблачили «ИИ-глюки, череда ошибок»
Верховная юридическая фирма США Sullivan & Cromwell принесла извинения судье за примерно три десятка случаев AI-ошибок, ложных прецедентов и вымышленных положений в судебных документах, поданных по делу о банкротстве в Манхэттене, за что и извинилась перед судьей. Несмотря на высокие почасовые гонорары и внутренние учебные политики, при фактической подготовке не было внедрено проверочное рассмотрение; этот инцидент вновь вызвал дискуссии о применении AI в юридической сфере и об этической ответственности.
ChainNewsAbmedia28м назад
DeepSeek публикует TileKernels с открытым исходным кодом — библиотеку GPU-ядeр для обучения и вывода больших моделей
Сообщение Gate News, 23 апреля — DeepSeek опубликовал TileKernels с открытым исходным кодом под лицензией MIT. Это библиотека GPU-ядeр, написанная на TileLang для обучения и вывода больших языковых моделей. TileLang — предметно-ориентированный язык, разработанный командой tile-ai для выражения высокопроизводительных GPU-ядeр в
GateNews37м назад
Samsung SDS расширяет партнерство с Google Cloud, чтобы обслуживать регулируемые отрасли с помощью ИИ и услуг безопасности
Сообщение Gate News, 23 апреля — Samsung SDS расширила партнерство с Google Cloud, чтобы предоставлять услуги ИИ, облачных вычислений и безопасности для регулируемых отраслей, включая государственный сектор и финансовые услуги.
Компании развернут Google Distributed Cloud для клиентов, которым требуется
GateNews1ч назад