Может ли Google обнаружить ChatGPT? Как это повлияет на ранжирование в случае признания

Есть ли способ для Google определить и сказать, генерируется ли текст и исходит ли он от ЧатGPT из OpenAI? И приведет ли это возможное обнаружение к штрафу за ранжирование этого текста в результатах поиска Google?

Давайте начнем с основного вопроса, касающегося обнаружения.

Может ли Google определить и определить, отправлен ли текст из ChatGPT?

Да и нет; Теоретически Google, скорее всего, мог бы обнаружить, что текст генерируется AI или ChatGPT, если бы они создали для этого систему.

Нет никаких указаний на то, что Google делает это при индексации и ранжировании различного контента.

В широко цитируемом интервью с Джоном Мюллером из Google в апреле 2022 года его спросили, может ли Google понять разницу между тем, генерирует ли контент человек или алгоритм ИИ, на что он отвечает: «Я не могу этого утверждать».

В целом, это интервью вызвало огромный интерес и вызвало споры, потому что Джон Мюллер также сравнил контент, генерируемый ИИ, с автоматически генерируемым и, следовательно, со спамом, как и предыдущая позиция Google в его Основы поиска Google (ранее Руководство для веб-мастеров).

Это не позиция Google в отношении содержания ИИ больше.

Почему Google как поисковая система заинтересована в обнаружении контента, исходящего от ChatGPT?

Короче говоря, Google хочет предоставить пользователям наилучшие результаты поиска и постоянно работает над улучшением того, как это сделать. Большая часть этой оптимизации заключается в предотвращении показа спам-контента.

Они опишите это так:

Автоматически сгенерированный спам (или «автоматически сгенерированный») — это контент, который был сгенерирован программным путем без создания чего-либо оригинального или добавления достаточной ценности; вместо этого он был создан с основной целью манипулирования поисковым рейтингом, а не помощи пользователям.

Причина в том, что качество автоматически генерируемого контента, генерируемого различными типами скриптов, было очень низким и в основном содержало ключевые слова и было направлено на манипулирование результатами поиска Google.

Вот почему Google пытается обнаружить этот тип контента, чтобы удалить его из поисковой выдачи и сохранить целостность результатов поиска.

Предполагалось, что, сосредоточившись на высококачественном контенте, созданном людьми, Google сможет обеспечить лучший опыт для своих пользователей и сохранить доверие к своей поисковой системе.

Но с появлением различных новых типов ИИ (машинное обучение, GAN или как мы хотим их называть) маркетологи и писатели уже не просто используют их для создания бесконечного количества спам-контента, но используют эти системы для создания большего, лучший и более полезный контент для пользователей.

Вот почему вопрос о том, хочет ли Google различать контент, созданный людьми, и контент, созданный искусственным интеллектом, становится гораздо менее ясным.

Как Google может обнаружить контент ChatGPT?

Чтобы понять, как Google распознает текст, поступающий из системы искусственного интеллекта, такой как ChatGPT, нужно знать, как работают эти языковые модели.

Языковая модель работает с вероятностью и может предсказать следующее слово в предложении на основе слов, которые были до него. Это делается путем анализа шаблонов и статистики языка в большом корпусе текстов и использования этой информации для прогнозирования того, какие слова могут следовать за данной последовательностью слов. Делая это, языковая модель может генерировать текст, который звучит естественно и связно, даже если он не всегда точен на 100%.

Есть разные примеры демонстраций этих проверок на предмет того, сгенерирован ли текст искусственным интеллектом.

Один из самых продвинутых, которые я видел, это GLTR (гянт лязыковая модель ТВосток рoom), который вы можете бесплатно попробовать здесь: http://gltr.io/dist/index.html

Пример анализируемого текста ChatGPT

GLTR — это инструмент, который позволяет проводить криминалистическую проверку текста, чтобы определить, мог ли он быть написан человеком или искусственным интеллектом.

Он был разработан группой исследователей из лаборатории искусственного интеллекта MIT-IBM Watson и Гарвардского НЛП и позволяет пользователям анализировать визуальный след языковой модели на входном тексте.

С помощью GLTR каждый текст анализируется на основе вероятности того, что каждое слово будет предсказанным словом с учетом контекста слева. Если фактическое используемое слово будет в первых 10 предсказанных словах, фон будет окрашен в зеленый цвет; для первых 100 ожидаемых слов он окрашен в желтый цвет; для топ-1000 он окрашен в красный цвет; в противном случае он окрашен в фиолетовый цвет.

GLTR предлагает следующие возможности:

  • Возможность попробовать образцы текстов и посмотреть, сможете ли вы найти разницу между текстом, созданным машиной, и текстом, созданным человеком.
  • Гистограммы, которые показывают статистику по тексту, включая долю вероятности фактического слова, деленную на максимальную вероятность любого слова в заданной позиции, и энтропию по первым 10 результатам для каждого слова.

Еще одним скриптом, обнаруживающим написанный AI контент, является «демонстрация детектора вывода GPT-2» от Huggingface.


Вы можете попробовать это здесь: https://huggingface.co/openai-detector/

Стоит отметить, что эти примеры и детекторы построены на модели GPT-2 NLG. Поскольку ChatGPT построен на более продвинутом GPT-3, его будет труднее обнаружить (хотя, похоже, он все еще обнаруживает GPT-3).

И по мере развития этих моделей они будут становиться все более и более совершенными и тем самым все больше и больше походить на человеческое письмо. В демоверсии GLTR это будет означать, что гистограммы будут выглядеть одинаково независимо от того, пишет ли их человек или ИИ.

Это также может быть причиной того, что OpenAI и другие подобные платформы работают над тем, чтобы такие игроки, как Google и другие поисковые системы, могли определять, исходит ли текст от ИИ. внедрение своего рода водяного знака в текст.

Этот встроенный секретный сигнал в сгенерированном тексте будет указывать на источник.

Основная причина этого заключается не в том, чтобы просто разрешить проверку текста, сгенерированного в основном для целей SEO, например, если кто-то использует ChatGPT для SEO, а в том, чтобы предотвратить плагиат путем перезаписи контента или олицетворения путем захвата стиля письма других.

Что говорит Google?

Google официально не объявил, что они определяют, написан ли контент искусственным интеллектом или реальным человеком.

Но в ходе обсуждения контента, созданного ИИ, еще до того, как был представлен ChatGPT, они заявили, что сами по себе они не против контента ИИ, а скорее сосредоточены на том, является ли это полезным контентом или нет.

Прочтите наш подробный пост о том, почему Google не против контента, созданного ИИ, или обзор того, противоречит ли контент ИИ правилам. Распространенное заблуждение среди многих SEO-маркетологов.

Это здорово в соответствии с долгой историей усилий поисковых гигантов по борьбе со спамом и контентом, который создается исключительно с учетом SEO, а не пользователя.

В целом Google — одна из самых позитивно настроенных на ИИ компаний в мире и уже много лет входит в число компаний, инвестирующих больше всего в исследования ИИ.

«Он (ИИ) может сделать людей более продуктивными, чем мы могли себе представить»
Сундар Пичаи, генеральный директор Alphabet, владельца Google

Источник

Что говорят SEO-специалисты?

Среди SEO-маркетологов и экспертов ведутся серьезные споры. Аргумент заключается в том, может ли Google обнаруживать контент, созданный ChatGPT, и влияет ли он на ранжирование.

Есть три разных точки зрения:

Точка зрения 1) Это может быть обнаружено, и это окажет негативное влияние

Некоторые эксперты считают, что Google может обнаруживать контент ChatGPT и что это негативно скажется на ранжировании. Они утверждают, что Google может обнаруживать неестественные языковые шаблоны, генерируемые ChatGPT, и что это будет рассматриваться как спам-контент.

Точка зрения 2) Это не может быть обнаружено и, следовательно, не окажет никакого влияния

С другой стороны, некоторые считают, что Google не может обнаружить контент ChatGPT и что это никак не повлияет на ранжирование. Они утверждают, что контент, созданный ChatGPT, неотличим от контента, написанного реальным человеком, и что Google не сможет отличить его.

Точка зрения 3) Это может быть обнаружено, но не повлияет, пока его полезное содержание

Третья точка зрения, на которую мы подписываемся здесь, в SEO.ai, состоит в том, что не имеет значения, может ли Google обнаруживать контент, созданный ИИ, или нет.

Важно то, полезен ли пользователям контент, созданный человеком или алгоритмом искусственного интеллекта. Это контент, который Google хочет продвигать в результатах поиска (SERP), поскольку он лучше всего отвечает на запрос пользователя.

На данный момент невозможно узнать, какая сторона права и как это влияет на SEO. Google официально не объявил, что определяет, пишет ли контент искусственный интеллект или реальный человек. Пока они этого не сделают, дискуссия будет продолжаться.

Заключение

Подводя итог вышесказанному:

  • Google может обнаружить текст, сгенерированный ChatGPT
  • В настоящее время нет никаких указаний на то, что Google делает это.
  • Google хочет предоставить пользователям лучшие результаты поиска и предотвратить спам-контент.
  • Позиция Google в отношении ИИ-контента изменилась
  • Google потенциально может обнаруживать контент ChatGPT, анализируя шаблоны и статистику языка в тексте.
  • GLTR — это пример метода определения того, пишет ли текст человек или ИИ.

Похожие записи

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *