| Источник

Гугловский сервис Knowledge Graph («Сеть знаний») теперь доступен и на русском языке. Этот инструмент больше похож на автоматическую энциклопедию — в поисковой выдаче выдаются блоки с краткими данными об объектах, которые так или иначе связаны с запросом.

«Мы собрали большую базу знаний о том, что нас окружает в мире. Это какие-то понятия, люди, места, архитектурные сооружения, планеты, породы собак. В общем, все, что можно описать. У всех этих понятий есть какое-то количество характеристик. Кроме этого, мы знаем какие-то связи, которые есть между этими объектами, например, что какой-то актер снимался в определенных фильмах, и что эта порода собак связана с собаками. И таких объектов очень много сейчас, их больше чем 500 миллионов, и между ними миллиарды связей», — пытается объяснить концепцию сервиса представитель московской команды качества поиска Google Ринат Сафин.

Например, по запросу «Петр Первый» эта «сеть знаний» показывает годы жизни царя, имена его родителей, главные события в его жизни, и – что очень важно – связи этого исторического персонажа с другими событиям и явлениями. Под краткой выжимкой на русском языке стоит светлосеренькая, почти незаметная ссылка на источник — в данном случае «Википедию». Что интересно, в русскоязычном блоке ссылка ведет на англоязычную статью.

«Данные приходят из различных источников, часть из них — это открытые источники, лицензия которых позволяет использовать их данные, это в том числе «Википедия», которая является очень важным, полезным и крупным источником. Это FreeBase, который мы купили несколько лет назад и который, собственно, содержит структурированную информацию об объектах из реального мира. Это источники, которые содержат данные о статистике, например, есть такой источник СIA FAQ Book — это какая-то база ЦРУ, открытая совершенно, про численность населения в разных регионах. Это данные Всемирного банка о численности населения и экономике в разных регионах. Информация собирается из разных источников, если источники открыты. Если же это какая-то закрытая информация, но мы знаем, что пользователям она нужна, мы стараемся ее купить и добавить в Knowledge Graph», — объясняет Ринат Сафин.

Похоже, что из «Википедии» в блоке процентов 70 информации, и, кажется, в Google были соблюдены все требования лицензии «Википедии» о цитировании. Кстати, можно было бы предположить, что из-за «сети знаний» у «Википедии» упадет посещаемость. Однако, сервис был запущен в Америке в мае этого года и никаких спадов в аудитории до сих пор не наблюдается.

Надо отметить, что, по задумке Google, этот инструмент должен стать переходом к семантическому поиску Google. Однако, язык – субстанция многогранная, и, вводя в поисковую строку запрос “Венера”, пользователь может иметь в виду отнюдь не вторую планету от солнца, а древнеримскую богиню плодородия или знаменитую древнегреческую скульптуру. Пользователь также может искать салоны красоты или рестораны, имеющие аналогичные названия. Суть Knowledge Graph сводится к тому, чтобы поиск научился понимать сущности реального мира в их взаимосвязи, а не примитивно “считывать строчки поисковых запросов”.

Здесь важно отметить, что в Google сейчас работают и над достоверностью выдаваемых фактов — то есть, создают определенную базу достоверных источников, а также внутренний механизм сравнения или совпадения информации. Кроме того, развитие сервиса затрудняется и специфическими особенностями для определённых языков: связи между словами и объектами в английском могут ничего не значить в русском.


Комментарии: (0)

Оставить комментарий

Представьтесь, пожалуйста