Адаптивное подавление активаций для уменьшения галлюцинаций
В статье предложен метод адаптивного подавления активаций трансформера для снижения феномена, когда большая языковая модель уверенно выдаёт неверные факты. Авторы рассматривают такие активации, как структурную помеху в остаточном потоке, и выявляют «узлы галлюцинации» с помощью поканального линейного исследования. В режиме вывода действует прямой крючок, который с учётом меры уверенности выборочно ослабляет вклад этих узлов без дообучения и дополнительных проходов. Проверки на моделях, cодержащих от 125 миллионов до 8 миллиардов параметров по наборам на правдивость показали устойчивое улучшение точности при сохранении показателя неопределённости модели и показателей рассуждения. Авторы отмечают, что вмешательство селективно, не снижает общую производительность моделей и приводит к локальным улучшениям по ряду показателей генерации.
Бывший вице-президент Microsoft «полностью поражён» ноутбуком от Apple
Бывший вице-президент Microsoft Стивен Синофски объявил о переходе на ноутбук Macbook Neo и признался, что устройство его впечатлило. По его словам, Macbook Neo справляется с рабочими задачами, а компромиссы по объёму оперативной памяти и производительности оказались приемлемыми. По мнению Синофски, новая платформа демонстрирует высокий уровень энергоэффективности, что не всегда можно сказать о многих ноутбуках на операционной системе Windows. Он напомнил о неудаче с устройством Surface RT в 2012 году и выразил сожаление, что на тот момент, попытка внедрить платформу на базе архитектуры ARM не была доведена до успешной реализации. В своём публичном сообщении он поздравил производителя с хорошим продуктом и отметил, что теперь ему комфортнее работать на этом устройстве.
Потоковое предсказание траекторий с учётом точек окончания
В статье описывается потоковый метод предсказания траекторий агентов в сцене, предназначенный для работы в реальном времени для непрерывного режима автономных систем. Главное нововведение состоит в использовании точек окончания предыдущих прогнозов как якорей, для передачи контекста между соседними тактами времени. Такой приём позволяет сценовому модулю извлекать целевую информацию без громоздких этапов уточнения или многократного декодирования, и тем самым, снизить задержку вывода. Архитектура экономна по ресурсам, даёт согласованные последовательные предсказания и сохраняет стабильность при скользящем вводе данных. В экспериментах на общепринятых дорожных наборах метод показал лучшие потоковые результаты по точности и латентности при заметном снижении потребления вычислительных ресурсов.
Android-смартфоны с чипами MediaTek оказались под угрозой
Команда Ledger обнародовала подробности серьёзной уязвимости в смартфонах на базе процессоров MediaTek. Исследователи продемонстрировали эксплойт, который при подключении телефона к компьютеру без загрузки системы за 45 секунд позволяет получить пин-код и извлечь seed-фразы криптокошельков. Демонстрация проведена на модели CMF Phone 1 от компании Nothing. MediaTek в январе направила обновление партнёрам, но многие устройства остаются потенциально уязвимыми. Авторы указывают, что проблема связана с архитектурой доверенной среды Trustonic и доступом к секретам через общую платформу. Проблема может затронуть миллионы устройств различных производителей. Владельцам советуют проверять список моделей, находящихся под угрозой на сайтах производителей и устанавливать официальные патчи.
Тетрис остаётся трудным даже при одном типе фигур
Авторы показывают, что даже при сильном упрощении игры вычислительная сложность остаётся высокой. Рассматривается вариант, в котором во всей последовательности используется только один тип фигуры. Доказано, что почти для всех фигур из набора тетромино, стоит задача определить, можно ли полностью очистить поле, а также стоит задача понять, возможно ли избежать проигрыша до конца заданной последовательности фигур. Они относятся к классу трудных вычислительных задач при стандартных правилах поворота фигур. Исключение составляет только квадратная фигура. Этот результат опровергает предположение о том, что случай с длинной прямой фигурой должен быть простым. Также показано, что трудность сохраняется и в ситуации, когда последовательность фигур подаётся блоками по 7 элементов.
В России образовался третий полюс развития ИИ наравне с США и Китаем
Инвестиционная фирма a16z опубликовала рейтинг 100 популярных приложений на основе генеративных моделей и в аналитической части отметила важное географическое изменение. Авторы указывают, что мировая экосистема искусственного интеллекта всё больше дробится на три крупных центра и, что Россия, которая ранее почти не выделялась, теперь фактически стала третьим полюсом по активности в потребительских AI-продуктах. В качестве примера приводят сервис DeepSeek с заметной аудиторией в Китае и России. Приложения с локальным доступом работают в условиях санкций, Яндекс Браузер со встроенным помощником Алиса достиг планки в 71 миллион активных пользователей в месяц, а в веб-списке появился GigaChat от Сбера. Авторы связывают этот сдвиг с ограничениями доступа к западным сервисам, что формирует самостоятельную экосистему.