В России представили AI-детектор для определения текстов, написанных нейросетью

Разработка позволяет с высокой точностью устанавливать авторство текстов — человек или ИИ

Разработка может быть полезна владельцам пабликов и редакторам / Фото: developers.sber.ru

На технологической конференции GigaConf 2024 исследователи Сбера и компании SberDevices представили GigaCheck — детектор для определения авторства русскоязычных текстов. В русскоязычном сегменте разработки у детектора практически нет альтернатив с близкими показателями.

Сейчас детектор дает обобщенную оценку авторства. Если в одном тексте использованы как фрагменты, написанные человеком, так и фрагменты, сгенерированные искусственным интеллектом, то определение авторства осуществляется по преобладающему контенту. В ближайшее время GigaCheck сможет также определять, какие именно фрагменты текста сгенерированы LLM.

«С помощью GigaCheck мы проанализировали 220 000 текстов новостных ресурсов за последний месяц и выявили, что в среднем 6% из них создано LLM, а в некоторых крупных изданиях превышает треть от всего опубликованного контента. До сих пор вероятность создания подобного работающего детектора текстов считалась крайне низкой. Многие эксперты расценивали эту задачу как практически нерешаемую», - рассказал управляющий директор управления экспериментальных систем машинного обучения Сергей Марков.

Работу детектора текстов оценят эксперты, занимающиеся проверкой подлинности научных публикаций, диссертаций и дипломов. Владельцы пабликов в соцсетях с помощью детектора смогут быстро обнаруживать созданные генеративными моделями комментарии и посты. Редакторы и все, принимающие работу копирайтеров, также получат эффективный инструмент для ее проверки и оценки.

К ЧИТАТЕЛЯМ

Узнавайте новости первыми, подпишитесь на наш телеграм-канал

Обсуждаем новости в нашем канале ВК. Подписывайтесь и оставайтесь на связи

Хотите больше историй и видео? Подпишитесь на наш дзен-канал