
На технологической конференции GigaConf 2024 исследователи Сбера и компании SberDevices представили GigaCheck — детектор для определения авторства русскоязычных текстов. В русскоязычном сегменте разработки у детектора практически нет альтернатив с близкими показателями.
Сейчас детектор дает обобщенную оценку авторства. Если в одном тексте использованы как фрагменты, написанные человеком, так и фрагменты, сгенерированные искусственным интеллектом, то определение авторства осуществляется по преобладающему контенту. В ближайшее время GigaCheck сможет также определять, какие именно фрагменты текста сгенерированы LLM.
«С помощью GigaCheck мы проанализировали 220 000 текстов новостных ресурсов за последний месяц и выявили, что в среднем 6% из них создано LLM, а в некоторых крупных изданиях превышает треть от всего опубликованного контента. До сих пор вероятность создания подобного работающего детектора текстов считалась крайне низкой. Многие эксперты расценивали эту задачу как практически нерешаемую», - рассказал управляющий директор управления экспериментальных систем машинного обучения Сергей Марков.
Работу детектора текстов оценят эксперты, занимающиеся проверкой подлинности научных публикаций, диссертаций и дипломов. Владельцы пабликов в соцсетях с помощью детектора смогут быстро обнаруживать созданные генеративными моделями комментарии и посты. Редакторы и все, принимающие работу копирайтеров, также получат эффективный инструмент для ее проверки и оценки.
К ЧИТАТЕЛЯМ
Узнавайте новости первыми, подпишитесь на наш телеграм-канал
Обсуждаем новости в нашем канале ВК. Подписывайтесь и оставайтесь на связи
Хотите больше историй и видео? Подпишитесь на наш дзен-канал