Мне нужно получить количество результатов, которые показывает Гугл при поиске определенных слов/выражений. Слова и выражения при поиске берутся в кавычки. Например, вводим в строку поиска google.ru "прагматизм в праве" и получаем: "Результатов: примерно 22 (0,21 сек.)". Т.е. 22 результата (по-английски hits). 

Количество результатов нужно отобразить в файле Эксель. Имеем файл Эксель, в нем два столбца: в одном столблце - слова/выражения на русском, в правом - слова/выражения на английском, напр.

прагматизм в праве | juristic pragmatism

прагматическая школа права | pragmatic jurisprudence

Вывести результаты поиска в гугле нужно и для слов/выражений (т.е. терминов) на русском, и для слов/выражений на английском.

Термины на русском искать нужно на google.ru, при этом какие-л. инструменты или параметры поиска задавать не нужно.

Для терминов на английском следует получить результаты двух разных поисков: 1) поиск в google.co.uk (Country: the UK), т.е. искать данный термин только на сайтах из Великобритании; 2) поиск в google.co.uk (News, Country: the UK), т.е. искать данный термин только на новостных сайтах (т.е. на сайтах из раздела News) из Великобритании.

После парсинга должен получиться файл Эксель со следующей структурой:

количество результатов при поиске термина на русском в google.ru | термин на русском | термин на англ. | количество результатов при поиске термина на английском в google.co.uk (Country: the UK) | Количество результатов при поиске термина на английском в google.co.uk (News, Country: the UK).

Пример строки в итогом файле:

22 | прагматизм в праве | juristic pragmatism | 1 | 0

Примерный алгоритм того, как это сделать, описан на https://toster.ru/q/52906: "Открываете гугл. Выполняете пару запросов. Смотрите на изменения url, на основе чего делаете выводы о том, как url формируется.

Далее формируете список url для всех необходимых запросов, проходите по этим url, из отдаваемых данных с помощью регулярных выражений вытаскиваете число результатов (отображается под формой поиска). Все это реализуется стандартными средствами PHP."

Только нужно задать временный интервал между запросами к гуглу, иначе гугл заблокирует.

Например, url при поиске термина на английском "weekday holiday" в google.co.uk (Country: the UK) https://www.google.co.uk/?gws_rd=ssl#q=%22weekday+holiday%22&tbs=ctr:countryUK%7CcountryGB&cr=countryUK%7CcountryGB; в google.co.uk (News, Country: the UK): https://www.google.co.uk/?gws_rd=ssl#q=%22weekday+holiday%22&cr=countryUK%7CcountryGB&tbs=ctr:countryUK%7CcountryGB&tbm=nws.

Нужен готовый файл Эксель согласно описанной структуре, а также сам парсер.

8 лет назад
iharok84
Игорь 
40 лет
9 лет в сервисе
Был
3 года назад

Заявки фрилансеров

Нет заявок фрилансеров