Улучшение стратегий в онлайн-обучении с подкреплением
В онлайн-обучении с подкреплением агент учится во время взаимодействия со средой, поэтому важно своевременно использовать уже найденные удачные действия. Частая проблема в value based-подходах в том, что агент долго не начинает стабильно использовать удачные решения, даже если уже встретил хорошие траектории. Причина в том, что оценки Q-функций обновляются постепенно и с шумом, поэтому полезный опыт не сразу влияет на выбор действий. Авторы предлагают действие Instant Retrospect Action, в котором после каждого шага агент дополнительно анализирует недавний опыт и сопоставляет текущую ситуацию с похожими состояниями из памяти через k ближайших соседей. Это помогает быстрее уточнять ценность действий и улучшать представления в сети, чтобы близкие, но разные состояния не смешивались. За счет более частого и локально точного обновления агент быстрее переходит к более выгодной политике.
Scope в сгенерированном коде
Иногда программы умеют создавать другой код автоматически, как конструктор. Но тут легко получить ошибку: фрагмент сгенерированного кода может пытаться использовать переменную, которая для него «не существует», потому что она была объявлена в другом месте и находится уже вне доступа. Это сравнимо с тем, что мы написали слово в черновике, а потом вырвали страницу и пытаемся читать это слово в тетради. Обычно компилятор обнаруживает такие ошибки заранее, но с генерацией кода все сложнее и некоторые языки делают проверки прямо во время выполнения. Авторы аккуратно описывают такие проверки математически и предлагают более надежный вариант, который лучше отсекает ситуации, когда сгенерированный код случайно использовал «чужую» переменную.
Фрактальное шифрование изображений с преобразованием Фурье
Статья повествует про способ шифровать изображения так, чтобы их было трудно взломать и при этом после расшифровки картинка оставалась нормальной, без заметных искажений. Авторы берут два инструмента из математики. Первый связан с фракталами — это структуры со «сложным узором», который можно задавать формулами. В работе этот принцип используют как основу для смешивания данных изображения, чтобы результат выглядел хаотичным и его было сложно восстановить без ключа. Второй инструмент — это преобразование Фурье, оно позволяет смотреть на изображение как на набор частот, как на смесь простых волн. С помощью этого авторы контролируют, как именно перемешиваются детали картинки при шифровании, чтобы защита была сильной, а обратное восстановление оставалось точным. Далее в статье сравнивают метод с другими схемами и показывают, что по их результатам он работает достаточно быстро и устойчив к типовым атакам.
У Gemini появилось агентное зрение
Google обновил работу модели с изображениями так, что она стала действовать как визуальный агент. Раньше модель в основном смотрела на картинку целиком и отвечала по общему впечатлению, из-за чего путалась в мелких деталях и ошибалась при подсчетах. Теперь используется цикл «думай-действуй-наблюдай». Если на фото есть маленький объект или подпись, модель не угадывает, а генерирует и запускает код, который увеличивает нужный фрагмент, обрезает область, подписывает найденные объекты и только затем делает вывод. Похожий подход применяют для таблиц и графиков — вместо оценки на глаз данные извлекаются и пересчитываются через код, поэтому ответ легче проверить. По заявлению компании точность визуальных задач выросла примерно от 5 до 10 процентов. Функция доступна в AI Studio, Vertex AI и в режиме Thinking в приложении Gemini.
ИИ нашёл уязвимости релиза OpenSSL
Стартап AISLE заявил, что его автономная система анализа кода обнаружила 12 уязвимостей, попавших в январский релиз OpenSSL, ключевой криптобиблиотеки для защищенного трафика в интернете. Некоторые ошибки, по словам авторов, существовали в коде десятилетиями и одна из них тянется с 1998 года. Система описывается, как гибрид, она сочетает ИИ и символьные методы, сама исследует пути выполнения, ищет редкие граничные случаи и предлагает патчи. Часть исправлений разработчики OpenSSL приняли напрямую, а несколько проблем нашли до выхода релиза, поэтому пользователи их не получили. Таким образом, автоматический анализ способен просматривать гораздо больший объем сценариев, чем человек, и это ускоряет поиск уязвимостей в крупном open-source проекте. Авторы сообщают, что раньше нашли свыше 100 багов в Linux, cURL и Apache.
Соискатели начали искусственно расширять свои резюме из-за страха ботов с ИИ
Соискатели всё активнее подгоняют резюме под системы автоматического скрининга, насыщая текст ключевыми словами и фразами из описаний вакансий. Исследование Monster на опросе 1001 человека в США показывает 77% боятся, что резюме отфильтрует программа и до рекрутера оно не дойдёт. В ответ документы становятся длиннее, одностраничный формат выбрали лишь 35%, а 49% сообщили о длине 1,5 страницы и больше. При этом более двух третей тратят меньше 30 минут на адаптацию под конкретную позицию, поэтому правки часто поверхностные: подмена названий навыков, добавление ключевых формулировок, небольшие перестановки. Только 6% уверены, что резюме читают внимательно. Эксперты по найму предупреждают, что простое набивание словами не гарантирует успеха, несоответствие опыта быстро заметно и может сыграть против кандидата. Оптимальный выход — это писать по делу и использовать термины вакансии.