

Как распознать тексты, написанные ИИ?
Такой вопрос нам задают юристы на каждом воркшопе по ИИ. И в зависимости от компании, технического уровня команды и их юзкейсов мы даем разные советы. Если коротко, есть 2 рабочих метода распознавания ИИ в тексте: - "глазной" - набор приемов поиска ИИ "на глаз", - инструментальный - используем специальное ПО для этого. 15 глазных приёмов: 1. Длинное тире везде "—" дефиса нигде Инструкция: Листаем текст и находим 5–7 знаков “—”. Если все они "—" длинные тире (а не короткие "-" дефисы). Сюда же кавычки-“ёлочки”. 2. Безупречная грамотность без “человеческих” огрехов Инструкция: Берем пару абзацев. Ищем пропущенные запятые перед “который” и “что”, ошибки в падежах (“в соответствии требованиям”), разговорные сокращения. А еще простые опечатки. "Чистые" тексты получаются только после серьезной редактуры, да и все мы не Розентали🫣 3. Подзаголовки ради порядка, а не логики Инструкция: Если их более 4 на станицу, и каждый со своим списком или выводом, и при этом структура не помогает пониманию. Живой юрист структурирует по делу, не для красоты. 4. Обязательный вывод после каждого абзаца Инструкция: Смотрим 3 раздела подряд. И если 2 из них заканчиваются выводами “Таким образом…”, “Следовательно…” - это паттерн ИИ. Человеку свойственно делать общие выводы, ему неудобно дробить выводы на части. 5. Шаблонные вводные слова и канцелярит Инструкция: Ищем всю нам привычную "канцелярскую ветошь": “Крайне важно…”, “Исходя из вышеизложенного…”, “Не только…, но и…”, “В соответствии с…”. Если их больше 1 на абзац или 5 на страницу - это ИИ. Если приноровиться, можно даже теплоту промта угадывать по ним, с температурой - 0,1-0,2 вообще перестаешь видеть суть. 6. Повтор одной идеи разными словами Инструкция: Берем основную мысль документа, если она повторяется в 3+ разных формулировках без развития. ИИ часто “пережёвывает” одну мысль, не замечая, что уже её озвучил. Человеку непривычно повторяться. 7. Ритм текста: монотонный “машинный гул” Инструкция: Читаем 3-5 предложений в ряд, если они примерно одинаковой длины, сбалансированы по структуре и часто используют двоеточия или тире. Живая речь “дышит”: короткие, длинные, рваные фразы. 8. Англицизмы, кальки и странные слова Инструкция: Ищим “фактаж”, “контрактант”, “это не ракетная наука”, особенно когда они диссонируют с текстом. У человека "в теме" есть похожий русский аналог, а человек "не в теме" такое не придумает. 9. Нейтральность без авторской позиции Инструкция: Смотрим в тексте на оценку, критику, предпочтения (“спорная норма”, “неоднозначная практика”)? Человек, а особенно юрист, не может писать беспристрастно, у него всегда есть позиция. У машины - нет. 10. Псевдо-баланс вместо анализа Инструкция: Особенно показательны обороты: “С одной стороны… с другой стороны…”, “Хотя это может быть полезно, следует учитывать риски…”. Часто бывает, что обе части говорят об одном или вторая часть пустая и очевидная. Это защитный паттерн нейросеть, а не юридический анализ. 11. Вода вместо конкретики Инструкция: Надо попробовать выделить суть любого абзаца в одной мысли. Если не получается, или она сводится к формуле “это важно” — это “вода”. Человек всегда даст смысл, статью, прецедент, цифру или пример. 12. Отсутствие ссылок там, где они обязательны Инструкция: Ищем фразы, ссылающиеся на другие источники, вроде “эксперты считают…”, “по данным исследований…”. Если нет ни одной сноски, номера статьи или дела - это ИИ. Он избегает точных ссылок, потому что не может их придумать “правдоподобно”. 13. Уверенная ложь (галлюцинация с достоинством) Инструкция: Проверяем 1–2 фактических утверждения: номер статьи, название дела, дата. Если источник не указан, но тон — безусловный (“Как известно…”, "наукой доказано..."), и простое гугление этого не подтверждает - держи “галлюцинацию”. 14. Вычурные, но бессмысленные формулировки Инструкция: Ищите фразы, звучащие “наукообразно”, но пустые по содержанию: “Введение является важнейшим компонентом…”, “Оптимизация процессов свидетельствует о зрелости подхода…”. Словесные обёртки - маркер перефразировки ИИ. 15. Маркеры бота: прямые обращения или мета-комментарии Инструкция: ищем маркеры бота “Как Вы и просили…”, “На момент моего последнего обновления…”, "хочешь, я подготовлю презентацию?". Тут глупо не подчистили хвосты за моделью.




























