MAX слушает ваши звонки? Да нет, что вы. Просто нейросеть ищет фразу «не слышу».
NewsMakerИ может научиться искать что угодно. Без обновлений. Без вашего ведома.
В MAX нашли встроенный модуль распознавания ключевых слов во время звонков. Сейчас функция отключена, а система распознаёт только одну фразу: «не слышу». Но сама схема работы выглядит интереснее: модель подгружается с серверов VK и при желании может смениться без обновления приложения.
О таком механизме рассказал исследователь p1llag3r во второй части серии «Что скрывает MAX». Автор разобрал APK мессенджера, проследил путь от серверного конфига до нативного кода звонков и показал, как клиент получает архив с моделью, проверяет контрольную сумму и загружает файл в модифицированный WebRTC.
Речь идёт о системе Keyword Spotting, которая ищет заранее заданную фразу прямо в аудиопотоке. Похожие механизмы давно используют голосовые ассистенты. Во время звонка система получает звук с микрофона, режет поток на короткие фрагменты и оценивает, прозвучало ключевое выражение или нет.
По данным автора разбора, текущая модель ищет только фразу «не слышу» и нужна для фиксации проблем со связью. В перехваченном серверном конфиге модуль помечен как выключенный через флаг use: false. Там же указан лимит работы на 60 секунд за звонок.
В MAX нашли встроенный модуль распознавания ключевых слов во время звонков. Сейчас функция отключена, а система распознаёт только одну фразу: «не слышу». Но сама схема работы выглядит интереснее: модель подгружается с серверов VK и при желании может смениться без обновления приложения.
О таком механизме рассказал исследователь p1llag3r во второй части серии «Что скрывает MAX». Автор разобрал APK мессенджера, проследил путь от серверного конфига до нативного кода звонков и показал, как клиент получает архив с моделью, проверяет контрольную сумму и загружает файл в модифицированный WebRTC.
Речь идёт о системе Keyword Spotting, которая ищет заранее заданную фразу прямо в аудиопотоке. Похожие механизмы давно используют голосовые ассистенты. Во время звонка система получает звук с микрофона, режет поток на короткие фрагменты и оценивает, прозвучало ключевое выражение или нет.
По данным автора разбора, текущая модель ищет только фразу «не слышу» и нужна для фиксации проблем со связью. В перехваченном серверном конфиге модуль помечен как выключенный через флаг use: false. Там же указан лимит работы на 60 секунд за звонок.