Кейс про то, как я на кошках тренируюсь контент в ChatGPT генерировать.
Актуализировал статистику по доходам и посетителям за весь период работы над сайтом.
История домена и создание сайта
Домен был зарегистрирован в январе 2023 года. Тематика про животных была придумана из головы без какого-либо анализа. Предполагал, что буду монетизировать сайт с помощью контекстной рекламы и CPA-офферов.
В Яндекс Wordstat выписал небольшое количество маркерных запросов, типа «кошка мята, котенок блохи». В КейКоллекторе спарсил ключевые запросы и почистил от мусора. В программе Penguin сделал фильтрацию, удаление дублей и кластеризацию.
Изначально планировал делать сайт на копипастном контенте. Спарсил мешап статьи, которые собраны из разных источников поисковой выдачи с перемешанными абзацами. Статьи получались читабельными. Первоначально загрузил на сайт около 200 статей и прекратил работу над сайтом.
К теме животных душа у меня не лежит, поэтому и сайт я в итоге забросил. Спустя пару месяцев я создал на сайте раздел с фото и загрузил туда несколько десятков сгенерированных фото кошек с помощью Stable Diffusion. Галереи фото создавал под ключевые запросы, например, «кошка грызет кость».
Трафик с момента запуска рос от 0 до 50 человек в день. В апреле начался спад и трафик скатился до 10 человек в день. Надо было изначально залить 1000-3000 статей, но у меня пропал интерес к сайту и я занялся другими делами.
Знакомство с X-GPTWriter, первые тесты
В августе я узнал про X-GPTWriter — программа массовой генерации контента через ChatGPT для сайтов на WordPress. Оценил возможности программы, попробовал демо версию и приобрел лицензию на 3 месяца.
До этого момента я уже генерировал контент в ручную через различные бесплатные сервисы или телеграм-боты. На одном сайте я рерайчу таким способом отдельные куски текста.
По информации из телеграм чата программы пришел к выводу, что хороший результат дает действие «Сгенерировать статьи по готовым планам». Правда планы статей необходимо предварительно написать самому или сгенерировать с помощью этой же программы.
Также есть простое действие «Сгенерировать статьи», которое позволяет сразу же получить статью по ключевой фразе, кластеру кейвордов или промту. В этом режиме ЧатГПТ имеет больше «свободы», поэтому заголовки и текст статьи могут часто уходить в сторону от главной ключевой фразы.
Условно разделю эксперименты с программой на несколько тестов и опишу подробнее.
Тест 1 — генерация статей по ключу
Но этот режим можно использовать для тестирования ниши. На вход подаете 10-15 ключевых фраз по вашей теме и проверяете на сколько осмысленные и правдивые статьи получатся на выходе. Если статьи хорошо читаются и не имеют искаженных данных, то тему можно брать в работу и генерировать сайт.
Тема про кошек показала хорошие результаты по читабельности контента. За исключением рейтингов и топов и обзоров конкретных товаров. Решил, что такие статьи генерировать не буду. Например, по запросу «лучшие сухие корма для беременных кошек» можно получить рейтинг кормов с названиями Товар1, Товар2 и т.д. А также можно получить рекомендации по ведению беременности только не у кошек, а у людей.
Сгенерированная статья состоит из элементов, которые можно включать/отключать в интерфейсе программы.
Блок комментариев мне не понравились, поэтому я их больше не генерировал. Все остальные элементы вполне соответствовали моим запросам. По блокам с видео и картинкам напишу подробнее ниже, когда буду описывать конечный план действий.
Тест 2 — генерация планов статей
Это промежуточный этап, который позволяет сгенерировать план статьи и потом на его основе сгенерировать статью целиком. По планам статей также можно оценить насколько хорошо ChatGPT знаком с вашей тематикой.
В моем случае примерно из 10 планов 1-3 были хорошими, остальные с мелкими недочетами или требовали редактирования. Для генерации планов на вход я подавал файл с кластерами запросов, которые у меня были сделаны в Пингвине.
Тест 3 — генерация LSI-слов
При генерации планов статей можно дополнительно предоставить программе список тематических фраз, которые будут направлять ChatGPT в нужное русло и не уходить от темы.
По информации от разработчика функция по генерации в LSI-фраз в программе X-GPTWriter является вспомогательной и дает не очень хороший результат. LSI-фразы лучше всего генерировать в сторонних сервисах на основание статей конкурентов.
В моем случае, если кластер запросов не содержал мусорных фраз, то X-GPTWriter формировал адекватные фразы. Поэтому я решил использовать данный функционал в конечном алгоритме для генерации статей.
Тест 4 — генерация статей по планам
В этой функции на вход в X-GPTWriter надо предоставить готовый план статьи с заголовками H2 и/или H3, также можно предоставить список LSI-фраз.
Вывод по этому тесту — по хорошему плану будет сгенерирована хорошая статья. По плану, в котором есть «бредовый» заголовок будет сгенерирован соответствующий абзац.
Другие тесты
Тестировал другие функции программы: копирайт, рерайт, планы статей на основе доноров. Результаты этих тестов не устраивали, но позже необходимо вернуться к этим тестам, так как в программу постоянно вносятся изменения.
Протестировал функцию уменьшения спамности и исправления орфографии. Тоже не устроил результат, так как в результирующем файле появлялись блоки текста вообще не относящиеся к теме статьи.
Алгоритм генерации статей после тестов в X-GPTWriter
После моих тестов я пришел к выводу, что буду генерировать мало статей, но они будут более качественными. Я взял запросы, которые собирал ранее для статей на копипасте. Кластеризацию выполнял заново, попытался отсечь как можно больше «сомнительных» и «мусорных запросов». Далее приступил к следующим действиям:
- В X-GPTWriter запустил функцию формирования LSI-фраз по каждому кластеру запросов. В результате получил txt файлы, в которых записаны LSI-фразами и исходный кластер кейвордов.
- Запускаю функцию формирования планов статей, на вход подаю файлы из предыдущего шага. В настройках X-GPTWriter предварительно указываю, чтобы формировалось по два файла плана статей на каждый файл с запросами. В каждом плане статьи также сохраняются исходные LSI-фразы.
- В текстовом редакторе редактирую планы статей (делаю из двух один хороший план). Двух планов статей хватает, чтобы создать один хороший план. На LSI-слова не обращаю внимания, они остаются без изменения с тем файлом, который был взят за основу. Оставляю только один файл с планом статьи, второй файл удаляю.
- Формирую статьи по готовым планам. В элементах статьи изначально формировал: Заголовок, Дескрипшн, Заголовки H2, Подзаголовки H3, Основное изображение, Тело статьи, Доп. изображения из Гугл, Доп. видео и Вопрос-ответ. На выходе получаю xml файл со статьями и папку с картинками.
- В программе TextKit проставлял категорию и рандомную дату поста из нужного диапазона. Даты для публикации ставил как прошлые, так и будущие.
- Стандартным плагином импортирую файл в WordPress. Картинки загружаю через медиа библиотеку вордпресс.
Что с картинками?
На текущий момент идеального решения нет. Я попробовал несколько вариантов и все мне не очень нравятся.
Парсинг картинок из Гугл
- Быстро уменьшается место на хостинге, а у меня и так его не много осталось.
- Картинки иногда не по теме.
- Иногда плохое качество, маленькое разрешение.
- Картинки с водяными знаками вет клиник и других организаций, которые могут написать моему хостингу претензию.
Не парсить картинки, а ставить ссылки на источники
- Со временем картинки могут удалить на сайте доноре
- Иногда битые ссылки
Пока остановился на втором варианте. Если статьи будут давать траф, то буду редактировать в ручную.
Можно еще генерировать картинки через Далли, но не думаю, что меня это тоже устроит из-за плохого качества. Можно вообще не вставлять картинки, но тогда нужно искать способ вставить их позже.
Планы и задачи на будущее
- Провести еще ряд экспериментов по генерации контента с учетом новых доработок и обновлений в программе. Еще раз проверить рерайт и копирайт.
- Решить вопрос с картинками. В ручную совсем не хочется дорабатывать. Может как-то стоковые фото грузить, все-таки кошечек все любят рассматривать.
- В ближайшее время довести число постов до 1000 штук. Посмотреть что будет с трафиком и доходом.
- Научиться работать с кастомными промтами и тоже их протестировать.
Результаты
Трафик в первые недели
По моему алгоритму работал 4 дня, сгенерировал 200 статей. Начал 15 сентября и уже в конце сентября пошел первый трафик.
Трафик идет с Яндекса, Гугл уже на копипасте мне трафик не давал. Рост трафика показал на графике.
Часть статей публиковались прошлыми датами, часть попадали в отложенные записи до конца ноября.
Трафик по месяцам (сентябрь — февраль 2023-2024)
График посетителей общий (заходы с поиска + прямые заходы). Уточню, что количество прямых заходов (ботов) растет, а количество посетителей с поиска падает.
Монетизация и доход по месяцам (сентябрь — февраль 2023-2024)
В октябре подал заявку в РСЯ, сайт одобрили. Поставил стандартный набор блоков. В конце ноября проверил статистику и даже удивился, что доходность сайта оказалась высокой. Не было времени анализировать подробнее. Выкладываю статистику по месяцам.
- Октябрь — 271 руб.
- Ноябрь — 1001 руб.
- Декабрь — 1651 руб.
- Январь — 262 руб.
- Февраль — 108 руб.
Интересно, спасибо…. да, с картинками пока все сложно!
Привет! Как в итоге с сайтом? Вырос траф?
До Нового года трафик рос. В праздники просел. Жду, когда все восстановится. Скоро обновлю пост и статистику прикреплю. На данный момент еще не решил, как лучше картинки парсить или генерировать. Есть одна идея, проверю в январе.
НЕМЕДЛЕННО прикрути комменты к ТГ каналу! 😂
И так дел по горло, теперь еще и за чатом следить))