Я думаю, что здесь есть люди занимающиеся web-разработкой на PHP+MySQL, возможно что-то еще. Я хочу заняться разработкой сайтов. Подскажите, пожалуйста, по каким книжкам вы учились? Сейчас так много книжек, а как выбрать хорошую не ясно. Что надо изучать помимо PHP? SEO? Фреймворки? Есть у меня небольшой опыт разработки, в общих чертах представляю что да как, но все как-то туманно и не ясно, что должен знать разработчик? Так же буду благодарен если кто-то расскажет о своей работе web-разработчиком.
Сегодня решил поделиться кейсом о поэтапном создании сайта, который будет парсить авторский контент с других площадок (речь не идёт о воровстве, глумиться буду над текстами песен "Только для ознакомления"). Идея наверняка стара как мир, но работает до сих пор.
Этап 1 - Идея
Как-то днём я искал текст песни Руки Вверх (не смейтесь, люблю эту группу). После блуждания по ГС сайтам, которые сидят в ТОП3 выдачи по запросам Текст песни Руки Вверх ..., я пришёл к выводу, что контент везде одинаковый, но почему-то кто-то вверху, а кто-то снизу. Запросов со словами "Текст песни..." в месяц около миллиона. А почему бы не попробовать и мне создать сайт про текста песен? Туда же прилеплю парочку фишек, типа плеера под каждую песню (на тот момент я понятия не имел, как можно для нескольких тысяч песен собрать кучу мп3 записей + как их хранить на сервере? Огромный вопрос), сделаю более-менее нормальную оптимизацию сайта под seo. Решил побороть поисковик огромным наплывом низкочастотных запросов, ведь материала должно было быть много. А монетизировать буду с помощью рекламки от Adsence (я и не знал ещё, сколько геморроя будет с ней).
Этап 2 - Команда и инструменты
В напарники я взял очень умного паренька, с которым вместе учился в универе. Мы оба были php-шники, из-за этого долго не думали и перекинулись именно на этот язык программирования. Тем более PHP очень хорошо работает со строками, имеет встроенный CURL, дабы парсить сайты. Но я как-то не захотел юзать именно CURl, а нашёл стороннюю библиотеку PHP Simple HTML DOM Parser. Не стану описывать все способы работы с этой библиотекой именно здесь, потому что это займёт много времени, да и к тому же я уже описывал принципы работы с ней в своём блоге. Вот сама статья http://seo-love.ru/programmirovanie/php/966-pishem-php-parser-sajtov-s-nulya.html Суть вся заключается в работе с DOM-моделью странички, которую вы скачаете. Куча функций поможет пробежаться по отдельным блокам, выдрать любую информацию, что вам потребуется. Библиотечка очень проста в использовании, так что советую всем начинающим программистам парсеров.
Этап 3 - Анализ конкурентов, наполнение базы, дизайн сайта
Дизайн сайта рисовали сами. Сразу скажу, что это совсем не идеал и в дальнейшем можно было бы обновить его. Но пока покатит и так Главное - большое количество текстов и хорошая перелинковка.
Вместе с напарником мы нашли несколько тематических сайтов, которые могли бы спарсить. Для начала решили попрактиковаться на простом сайтике реп-песен. Вроде бы простенькая структура, всё должно быть хорошо. К тому же почти на каждой площадке такого типа есть что-то подобие навигации, алфавита песен или исполнителей. Будем бегать по нему с помощью нашего парсера.
Давайте представим, что мы смогли накатать скрипт, который отлично собирает нужную вам информацию. После просмотра полученного понимаешь, что 20-30% от общего количества спарсенных материалов (а всего с первого сайта удалось сграбить около 3 тысяч текстов песен) содержит внешние ссылки на другие сайты. Не забываем удалять их, дабы не стать линкопомойкой. Мы на этом чуть не обожглись. К тому же ГС сайт очень часто имел столько неявных структурных решений, что голова кругом идёт. Мне встречались разные ссылки, типа http://адресВадика, которые совершенно не должны были быть в списке исполнителей. Скрипт умирал каждый раз, после встречи с таким непонятным багом.
В общем первый сайт нам удалось спарсить за 1 месяц. Да, это долго, но мы не имели опыта (зато теперь смогу спарсить всё, что только можно). Последующие сайты стали парситься за 3-4 дня. т.е. скрипт мог работать неделю, а сам код писали за несколько дней.
Этап 4 - Прикручиваем плеер к сайту
Пусть это будет нашей фишкой. На сайтах-конкурентах такого не было, так что можно вылезти с помощью эдакой фишки. Мы нашли портал, на котором можно через GET-строку передать ключевые слова и получить обратно iframe с плеером. Всё очень красиво и просто. Вам не надо хранить песни на серваке, только пути к ним на сервере другой площадки (удалённый url).
Этап 5 - Приделываем видео
Представьте, что у каждого второго материала будет видео с ютюба. Гугль проиндексирует его как картинку, т.е. вы сможете продвигаться картинками. Это ли не плюс?) Мы загорелись этой идеей и написали скриптик, который будет динамически отправлять ключевики (название песни + исполнитель) и получать обратно видео. Если очень заинтересует, то пишите в личку, бесплатно скину пример скрипта.
Этап 6 - Делаем уникальный контент с помощью парсера
Это самый сложный этап. Напарник предложил мне спарсить описания для исполнителей. И дабы хотя бы немного уникализировать контент - прогнать всё через синонимайзер. Мы очень долго писали скрипт, который сможет передавать частями код на сервис, отвечающий за синонимайзинг (заметьте - я ничего не использую своего, только сторонние ресурсы). Код есть в наличии, но он стоял таких усилий и такого усердия, что просто так не отдам никому (пишите в личку, поболтаем по этому поводу).
На выходе мы получили много много описаний самых разных певцов. Да, этот текст является читабельным на 40-50%, но это уникальный материал, хотя бы частично. Лучше пусть будет, чем нет, подумали мы.
Этап X - Промежуточные итоги
На данном этапе у нас уже есть шаблон сайта и огроменная база. Такое количество информации собиралось бы несколько лет, если работать руками (добавлять через форму и т.д.).
Мы не составляли подробно семантическое ядро. Это упрощает процесс, потому что для такого огромного количества страниц делать его пришлось бы несколько лет.
Просто решили в название страницы использовать связку "Текст песни + Исполнитель+ - + НазваниеПесни". Так же включили несколько ключевых слов в блоки страницы, точные фразы, разбавленные и т.д.
Этап 7 - Индексация поисковиками
Добавили сайт в аддурилки и ждём. Для разнообразия прогоням по твиттеру и liveinternet сайт с помощью сервиса IndexGator (очень хорошая вещь, рекомендую. Страницы влетают в индекс, к тому же ссылки с Твиттера, как было замечено, хорошо влияют на увеличение позиции по НЧ запросам). Реакция от поисковиков была очень разная.
Яндекс нас не взлюбил сразу. Мы вошли нормально в индекс только в январе месяце, когда показали этому поисковику "Русские не сдаются". Яша постоянно выкидывал нас из индекса и вообще проиндексировал первую страницу только через полтора месяца. Наверняка это из-за ворованного контента. ну да ладно. Google был более адекватен в этом плане и смог запустить в свой индекс практически 80 тысяч страниц.
Могу сказать, что всё время индексации мы дополняли базы новыми материалами. К тому же решили сделать Музыкальный блог, в который запихали несколько уникальных статей на музыкальную тематику. Это тоже поспособствовало лучшей индексации.
Этап 8 - Наращивание трафика
Хочу заметить, что мы не покупали ссылки, никак не продвигали сайт кроме естественного продвижения. Наша цель - много НЧ запросов. Привожу пример по показам и посетителям из Google Analytics за последний месяц: 7357 пользователей и 37 416 просмотров страниц. Вроде бы неплохие такие показатели. Пришло время монетизировать сайт, подумал я.
Этап 9 - Страшная монетизация
Это было ОЧЕНЬ сложно. В Adsence нас с первого раза не взяли, потому что их рекламные блоки не должны быть расположены рядом с контентом, защищённым авторским правом. Мы попробовали использовать тизерную рекламу (сервис тизернет), но за месяц заработали целых 80 рублей. Не густо.
Я хотел уже бросить сайт, т.к. не видел вариантов монетизации, но вдруг обратил внимание, что на других аналогичных площадках есть реклама от Гугля. Начал искать причину такого странного отношения к моему проекту и нашёл. Если захотите почитать подробней способ обхода авторских прав на Adsence, то жду вас на моём блоге. Статью такую писал, вдруг кого заинтересует http://seo-love.ru/kejsy-gotovye-resheniya/961-obkhodim-avtorskie-prava-v-google-adsence.html
Вроде бы всё, ура, реклама есть на портале. Пока что за неделю принесло всего 300 рублей, но это ПОКА. Планируем увеличивать посещалку за счёт продвижения по НЧ запросам, покупки ссылок и т.д.
Выводы
Уникальность контента - не всегда главный показатель хорошей выдачи. Если у вас будет грамотно спроектирован сайт, то таким методом можно парсить любой контент: видео, музыку, фото и т.д. Главное - количество! Монетизировать такой трафик тоже возможно, если подойти ко всему процессу досконально и не бросать начатое.
Если вас заинтересовала данная статья, либо вы хотите сотрудничать со мной, хотите получить парсер и т.д., то прошу на мой блог SEO-Love.ru.
К нам едет ревизор! Помогите кто чем может! Коментарии для минусов внутри.
Нужно создать бесплатный сайт за три дня. Подскажите вменяемые конструкторы. Помогите сами! Опыта не имеем. Без сайта по нормативам Мин.Образования деятельность учреждения приостановят...
Сразу скажу, я не занимаюсь разработкой и написанием сайтов, но знаю и умею писать простенько на HTML.
Мне тут недавно обратился знакомый с заказом написать сайт для фирмы. Я сразу предупредил, могу простенько без изысков - информативную визитку. Ну думаю, помогу другу, применю знания и изваяю что нибудь.
Подготовился, написал болванку и поехал в офис. Там посмотрели на болванку и сказали х**ня. Надо: всплывающие окна, обратная связь, фотки сливающиеся с фоном, форум, доска объявлений, а самое главное что бы он всегда был в первой строчке Googla. Предлагали пока без денег, у них сейчас с деньгами напряг, а как я напишу, так у них продажи пойдут и мне сразу заплатят много(сумма не уточнялась), и я в первой степени в этом заинтересован. Я попытался объяснить как работает поисковик, что новые сайты он не видит пока им нет полгода, что есть такое SEO, что есть фотосессия(а не краденые фотки из нета), что есть Jawa PHP Perl, что это целая индустрия.
То что они хотят, я сделать не могу и им следует обратиться в хорошую фирму и порекомендовал несколько. Директор посмотрел на меня и сказал - так тыж не программист, вали отсюда.
Итог: Прошло две недели, мне позвонил директор той фирмы и сказал, что они решили работать со мной, а не с барыгами из фирм которые лупят огромные деньги. Я вежливо сказал, что своим корявым сайтом могу угробить весь его хрупкий бизнес и мне это не интересно.
В последнее время вижу много постов с просьбой о помощи, о удаленной работе и так далее. Хорошим пикабушникам и мастерам своего дела посвящается :) Если возможно, поднимите пост вверх, что бы люди увидели, вдруг кто нуждается. Коменты для минусов внутри.
Ищу тех, кто занимается графическим дизайном и/или созданием сайтов. Нужны умельцы с хорошим портфолио либо наывками, для создания логотипа, айдентики, дизайна упаковки, сайта визитки. Сразу все можно не уметь :)
Очень прошу отнестись лояльно, и не писать, аля "я только что окончил школу, учусь рисовать, нужны проэкты для портфолио". Проект достаточно серьезный, и нужны люди с опытом. Оплата естественно соответствующая :)
Прошу, присылайте свою почту, портфолио, пожелания в коменты, я вышлю вам задание. Надеюсь мы сможем друг-другу помочь.
Здравствуйте мои дорогие пикабушники:)
Видел много постов, в которых люди просят о помощи, и вот сам решился! Занимаюсь веб-программированием, и хотелось бы немного попрактиковаться! Может есть здесь люди которым нужен сайт, например для клана в какой-то онлайн игре, или может просто сайт-визитка. Выполню ваши заказы, за небольшую плату:) Могу создать сайт на готовой CMS, или же простенький с помощью HTML, CSS! Не топите пожалуйста, может кому-то и правда пригодится этот пост)
Коменты для минусов внутри:)