7.30.2008

Ну почему!!!! И еще этот ап...

Блог валялся 2 недели и до этого не обновлялся пару недель. А тут как раз прошел гугл апдейт. И что мы имеем?! Наполовину меньше страниц в индексе, пр скатился до н\а, наверняка еще и по запросам упал. В яндексе теперь кэш моей морды выглядит как "index of..." - ненавижу падонки!!!
Что касательно апдейта вообще, то в остально мне понравился, несколько других сайтов подросли в пр нормально так, правда ни так как хотелосьбы, но все же прогресс налицо)
И как у многих такая фигня что над чем меньше работал то хорошо пошло.
Кстати одно наблюдение, сделал месяца полтора назад 4 адалт блога, все на разных сабдоменах разных доменов. 2 прогнал по адалт дирам. Из этих 2-х один забанен гуглем почти сразу (я думаю большое число взаимных ссылок), 2-й шустро и хорошо индексируется (он без взаимных ссылок регеился где возможно), но при апе пр не получил. Третий тоже только индексируется, но на него ссылки только с других 3-х блогов, в вот 4-й получил пр 3 почему-то - наверное домен хостинга тк хорошо дал)

Ярлыки: ,

2.17.2008

Аналоги Google Trends

Так как с некоторого временим я являюсь ярым поклонником свежих новостей в топах :)), то одного гугл трендс мне уже не хватает. Посему недавно озадачился поиском аналогов.

Вот тут спросил у народа. Там много всего насоветовали, а точнее:

Ebay Popular Searches

Это тут примерно: http://antiques.ebay.com/_W0QQ_trksidZp3907Q2em21 - там внизу есть "Popular Searches" - мне не понравился, очень уж высококонкурентные запросы, вообщем то с гугл трендс мало чего общего имеет.

Quantcast Audience Keywords

Уже ближе. Можно выбрать сайт из их топов (или самому вбить если он у них есть в листинге) и посмотреть его статсы, примерно так http://www.quantcast.com/bizrate.com, там есть “Audience Keywords” – то что нужно, но нет “related keywords”, что есть недостаток + неоткуда контента подтянуть, надо отдельно что-то выпарсивать.

А вообще сайт очень даже полезный в плане анализа кто-что ищет и как сайты где стоят. Вообще с него удобно очень напарсить свою хорошую базу запросов пользователей, а еще можно напарсить базу доменных имен (типа как тут продается), которую тоже есть способы заюзать (сам не пробовал, но ведь покупают её!).

Quantcast Audience Keywords
Ну тут я думаю все ястно, но опять же, запросы жирные, релатев нету(.

Вот там собрано все что нужно! Ну у него все расписано понятно, перепечатывать не буду. Большинство из представленного там опять же страдают отсутствием сопутствующих запросов и необходимостью парсить контент откуда-нить еще и низкой частотой обновления.

Search.com Most Popular Searches
Search.com Narrrow Your Search

Замечу только что как и написал автор “Вообще я порекомендовал бы Топ 1000 поисковых запросов.” - +1000 за этот сервис. И кеи не высококонтурентные там есть, и релайтед к ним есть и оттуда же можно контента набрать (из сниппетов например). Его я на вооружение возьму).

Пока искал еще обнаружил это. Это заголовки новостей + немного описания от CNN, отдаются в виде rss по категориям. Тоже как мне кажется вполне себе заслуженный источник.

Вот этот сервис еще обнаружился. Тоже очень порадовал. Там на морде есть “Top Searches” и есть аозможность прочекать свое слово. Для всего отдает сопутствующие результаты, строит графики, часто обновляется, дает выдачу свежего контента (спам в основном правда, но можно фильтровать). Есть одна замечательная возможность, которой не увидел ни в одном из других сервисов, можно “до бессконечности”(пока не кончатся) выбирать фразы, выбирая все из “Related Terms”. blogscope net hot keywords

А вот видны релэйтед серчи, приятно что, если пойти по одному из них, то покажутся результаты по
выбранному запросу и к нему опять же релэйтед слова и т.д.

blogscope net hot keywords relaited

Ну все! Источники есть, надо срочно писать парсеры и заводить автоблоги. Еще радость вышел наконец апдейт софтины мною пользуемой для блогов и vipcodec поднялся - все условия созданы - фигачим))

Ярлыки: , ,

10.02.2007

Скрипт парсинга овертюры в глубину и определения конкуренции в Google для каждого кея

Вот тут выкладывал скрипт для парсинга овертюры и гугла вместе.
Вот он собсно, с комментариями:



set_time_limit(0);
$pattern = "|#results\">(.*?).*?(\d{1,3},*\d{0,3},*)|i";


/**
Проверяет вхождение выражения подходящего под паттерн в текс и возвращает
массив ассоциативный таких вхождений, содержащий кей - количество запросов в месяц по овертюре
$source - текст старницы
$pattern - регулярное выражение определяющее фразы
/*
function Parse($source, $pattern) {
if(preg_match_all($pattern, $source, $matches))
{
$i = 0;
foreach ($matches[1] as $link)
{
$res[$link] = $matches[2][$i];
++$i;
}
return $res;
} else {
echo "
". "No pattern matches were found!\r\n" . "
";
}
}

/**
Получает количество страниц в гугле для массива кеев $keys
Возвращает ассоциативный массив кей - количество страниц
*/
function GETGOOGLECOUNT($keys){
for ($i=0; $i
([0-9,]*)", $file, $regs);
$count=str_replace(",", "", $regs[1]);
$res[$i] = $count;
}
return $res;
}

/**
Получает кей ($keyword), делает запрос к заданному сервису, получает до 100 слов(сервис до стольки выдает) с их конкуренцией (сервис иногда выдает ошибку, поэтому сделал пока просто 10 попыток парсинга, вроде хватает), потом по каждому слову узнает количество документов в гугле и все это возвращает массивом [кей] - [количество запросов;конкуренция в гугле] и ждет 20 секунд, чтоб бана гугли не получить.
*/
function PARSEONEWORD($keyword){
global $pattern;
$mkt = "US";
$service = "http://tools.seobook.com/general/keyword/?c=1&keyword=" . $keyword . "&mkt=" . $mkt . "#result";
echo "Reply from server " . $service . " for keyword " . $keyword . "

";
$source = @file_get_contents($service);
$keys_arr = Parse($source, $pattern);
if (sizeof($keys_arr) > 0) {
foreach($keys_arr as $kw=>$kwcount) {
$keys[]=$kw;
}
$g_count=GETGOOGLECOUNT($keys);
sleep(20);
$i = 0;
foreach ($keys_arr as $kw=>$kwcount) {
$result[$kw] = $kwcount.";".$g_count[$i];
$i++;
}
}else{
$result = false;
}
return $result;
}

//Записывает результаты в файл
function WRITERESULTS($fname, $keys) {
$i=0;
$h = fopen($fname, "ab");
foreach($keys as $kw=>$pair){
fwrite($h, $kw.";".$pair."\n");
}
fclose($h);
}

/**
Парсит список кеев из файла $fname, результаты пишет в файл result.txt
*/
function PARSEMANYKEYS($fname) {
$keys = file($fname);
$h = fopen("./result.txt", "w");
fwrite($h, "Keyword;Popularity;Google_Count\r\n");
fclose($h);
foreach ($keys as $k){
for ($i=0;$i<10;$i++){ keys1 ="">
{
print_r($keys1);
WRITERESULTS("./result.txt", $keys1);
break;
} else {
echo "\r\nNo results for " .$k.". Now attempt number " .$i ."\r\n";
}
}
}
}

PARSEMANYKEYS("keys.txt");
?>


Еще иногда перделываю из его себе подо что нужно, что бы разные распарсенныей кеи сохранял в разные файлы, можно убирать парсинг гугли ил уменьшать\увеличивать задержку (sleep(20)). Про задержку может кто в курсе сколько ее ставиь лучше?

Ярлыки: , , , , ,