Ускорение генерации текста
Обычно модель строит ответ по одному маленькому фрагменту слова, и на длинных ответах задержка становится заметной. Авторы предлагают научить ту же модель выдавать сразу несколько следующих фрагментов за один шаг, чтобы уменьшить число обращений к ней. Берут исходный вариант модели, как учителя, а копию, как ученика. Учитель подсказывает, какие продолжения наиболее правдоподобны, а ученик обучается выдавать пакет продолжения так, чтобы текст оставался связным и логичным. Проверка остаётся простой, система принимает те фрагменты, которые согласуются с учителем, и быстро переходит дальше. В экспериментах получают ускорение более чем в 3 раза при небольшом падении качества. Подход практически не меняет код вывода и подходит для чатов, это позволяет снизить задержку ответа пользователю.
Восстановление позы камеры для пространственных задач
Опубликована статья о понимании пространства по нескольким изображениям, когда нужно ответить на вопрос с учётом того, откуда сделан кадр и как выглядела бы сцена с другой точки. Обычные модели часто путаются, потому что не фиксируют положение камеры явно. Авторы делают это положение отдельной подсказкой. Сначала система оценивает, где находилась камера для каждого изображения и в какую сторону она смотрела. Затем текстовое описание желаемой точки зрения переводится в такую же форму, и модель строит внутреннее представление сцены уже в целевом ракурсе. Для проверки был собран набор данных «CAMCUE» с десятками тысяч примеров обучения и отдельным тестом с описаниями от людей. На задачах пространственных вопросов метод даёт прирост точности и лучше предсказывает поворот камеры, при этом работает быстрее, потому что не перебирает много вариантов.
Увеличение автономности БПЛА
Работа про низковысотные сети, где дроны помогают автомобилям обрабатывать данные ближе к месту их появления. Авторы предлагают многоуровневую схему: лёгкие дроны нижнего уровня принимают задачи от машин и выполняют часть вычислений, а более мощный дрон верхнего уровня служит резервом и берёт остаток, когда нижним не хватает энергии или мощности. Новизна в управлении стремится к тому, чтобы задержка была небольшой, а заряд дронов нижнего уровня оставался устойчивым при длительной работе, даже если будущая нагрузка неизвестна и условия меняются. В каждый момент система решает, кому отправить задачу, как разделить вычисления, сколько ресурсов выделить и как менять траектории, опираясь на текущий заряд. Алгоритм в реальном времени балансирует скорость и расход энергии. В моделировании подход снизил энергозатраты передачи у дронов нижнего уровня более чем на 26 процентов и дал более стабильную работу при сопоставимых задержках.
Система поиска по PDF
NVIDIA выпустила семейство Nemotron ColEmbed V2 для поиска по документам, которые выглядят, как изображения страниц, например, PDF со сканами, таблицами и сложной версткой. Пользователь вводит текстовый запрос, а система должна найти нужные страницы и кусочки текста, даже если они спрятаны в колонках, подписях к рисункам или мелком шрифте. Новизна заключается в том, что модель формирует не один общий вектор, а набор точных представлений для запроса и для документа, а затем сравнивает их на финальном шаге, чтобы повысить точность совпадения. В релизе предусмотрены варианты 3B, 4B и 8B для корпоративного поиска и сценариев с базой знаний. NVIDIA также показывает результаты на ViDoRe V3, где версия 8B занимает первое место по метрике качества. Подход точнее, но требует больше памяти на индексы. Компания продвигает поиск по визуальным документам, как отдельный слой для работы с архивами и отчетами.
Атака на сервера обновлений Notepad++
Обнаружена атака на цепочку обновлений Notepad++, по причине которой часть пользователей могла попасть на вредоносные ресурсы при попытке обновления. Сообщается, что был скомпрометирован хостинг провайдер проекта, после чего злоумышленники получили возможность перехватывать трафик домена и перенаправлять людей на свои серверы. Важно, что исходный код редактора не пострадал, проблема была связана с доставкой обновлений. Уязвимость нашли в компоненте обновления WinGUp, где не хватало проверки целостности загружаемых файлов, поэтому легитимные обновления возможно было подменить. Авторы публикации пишут, что атака была выборочной и могла оставаться незаметной с июня по декабрь 2025 года, а к ней привязывают группу Lotus Blossom. В ответ, сайт перенесли к другому провайдеру и обещают проверку цифровой подписи в релизе 8.9.2, а пользователям советуют переустановить редактор из доверенного источника.
OpenAI Frontier
OpenAI анонсировала Frontier, платформу для компаний, которые хотят внедрять ИИ-агентов в бизнес-процессы и держать их под контролем. Это единое место, где можно создавать и запускать агентов, давать им общий контекст, подключать источники данных и задавать разрешения, чтобы агент не выходил за рамки. Также заявлены обучение на практике и оценка со стороны людей, чтобы агент со временем работал аккуратнее и полезнее. Важная деталь в том, что Frontier рассчитана не только на решения OpenAI, платформа должна поддерживать агентов, сделанных самой компанией-заказчиком или другими поставщиками, через открытые стандарты. Доступ пока ограничен небольшим числом клиентов, среди ранних пользователей названы Intuit, State Farm, Thermo Fisher и Uber, цена пока не раскрыта.